تهران ، ولیعصر
021-987654

آیا گوگل با تغییرات جزئی در ترجمه ماشینی مشکلی ندارد؟

ساعات اداری SEO اکتبر Google پاسخ داد که آیا استفاده از محتوای ترجمه شده به طور خودکار که توسط یک انسان بازبینی شده و تنها تغییرات جزئی ویرایشی داشته است، اشکالی ندارد یا خیر.

قسمت ساعات کاری دفتر SEO-Google

این قسمت از پاتوق ساعات اداری از قالب جدیدی پیروی می کند که در آن سؤالات به صورت کتبی ارسال می شوند و سپس پاسخ ها داده می شود.

کارمندان Google که به سوالات پاسخ می‌دهند لیزی ساسمن و جان مولر هستند.

لیزی ساسمن (@okaylizzi) یک نویسنده فناوری است که “به آن اهمیت می دهد” اسناد Google Site Central.

برخلاف قالب زنده قبلی، که در آن مخاطبان در زمان واقعی سؤال می‌پرسیدند، این قالب جدید فرصت پرسیدن سؤالات بعدی را از بین می‌برد.

این منجر به پاسخ‌هایی می‌شود که به طور دقیق مستندات Google را منعکس می‌کنند، بدون هیچ شانسی برای شفاف‌سازی.

فردی که این سوال را می‌پرسد نگران محتوای خود بود که به صورت ماشینی از زبان دیگری ترجمه شده بود.

آنها از ویرایشگرهای انسانی استفاده کردند تا محتوایی را که به طور منظم قابل قبول بوده و فقط به تغییرات جزئی نیاز دارد، بررسی کنند.

به طور طبیعی، شخصی که این سؤال را می‌پرسد نگران است که آیا «ترفندهای جزئی» برای قابل قبول کردن محتوا برای Google کافی است یا خیر.

لیزی ساسمن به این سوال با پاسخی که مستندات Google را از نزدیک دنبال کرده بود پاسخ داد.

مطمئناً، پاسخ را می‌توان با یک سؤال بعدی برای تعیین اینکه آیا «ترفندهای جزئی» به اندازه کافی خوب هستند روشن کرد.

بالاخره، این سوال به صراحت می پرسد که آیا ترفندهای جزئی برای Google به اندازه کافی خوب هستند یا خیر.

احتمالاً پاسخ ضمنی استفاده از قضاوت شما در مورد کیفیت محتوای ترجمه شده است.

خودتان قضاوت کنید.

آیا محتوای ترجمه شده ماشینی با ویرایش متوسط ​​قابل قبول است؟

آنها پرسیدند:

“یک سایت از ترجمه ماشینی برای ارائه پست‌ها به زبان‌های دیگر استفاده می‌کند.

محتوا توسط مترجمان انسانی بررسی می‌شود و آنها اغلب پس از تغییرات جزئی از کیفیت آن راضی هستند.

این برای Google مشکلی ندارد؟»

لیزی ساسمن از Google پاسخ داد:

«خب این خوب است که می شنویم که مترجمان انسانی خوشحال هستند و این برای Google کاملاً خوب است تا زمانی که انسانی در فرآیند بررسی حضور داشته باشد. این کلید است.

چیزی که می‌خواهید مراقب آن باشید این است که مطمئن شوید کیفیت همچنان خوب است و برای افرادی که محتوا را می‌خوانند خوب عمل می‌کند.”

پاسخ به‌طور مشخص نمی‌گوید که آیا ویرایش‌های جزئی خوب هستند یا نه، فقط این که اگر «مترجمان انسانی» با آن خوب باشند، پس باید برای Google خوب باشد.

آیا ممکن است Google بررسی نمی‌کند که محتوا به‌صورت ماشینی ترجمه شده است، اما به سیگنال‌های استاندارد کیفیت محتوای متکی است؟

ما نمی دانیم.

قالب جدید ساعات اداری به فردی که سؤال می‌پرسد فرصتی برای پرسیدن سؤال بعدی نمی‌دهد.

خط‌مشی‌های هرزنامه Google

اسناد توسعه‌دهنده Google در مورد محتوای هرزنامه به ابزارهای ترجمه خودکار متن اشاره می‌کند و به صراحت می‌گوید که هرزنامه است، مگر زمانی که یک عنصر انسانی در آن دخیل باشد.

این چیزی است که در اسناد Google آمده است:

«نمونه‌هایی از محتوای تولید شده به صورت خودکار هرزنامه عبارتند از:

متن ترجمه شده توسط یک ابزار خودکار بدون بررسی یا نظارت انسانی قبل از انتشار”

بنابراین از دستورالعمل‌های منتشر شده Google مشخص است که تا زمانی که یک انسان محتوای ترجمه شده توسط ماشین را ویرایش می‌کند، Google با آن مشکلی ندارد.

علاوه بر این، جان مولر در یک ویدیوی Google Office-Hours از آوریل ۲۰۲۲ اشاره کرد که چگونه محتوای تولید شده توسط هوش مصنوعی هرزنامه محسوب می‌شود و سپس به محتوای ترجمه شده خودکار اشاره کرد.

مولر در مورد ابزارهای تولید محتوای هوش مصنوعی صحبت کرد و آنها را با ابزارهای ترجمه خودکار مقایسه کرد.

در ۲۴:۵۵ دقیقه آوریل مولر گفت: ویدیوی ساعت اداری ۲۰۲۲:

«فکر می‌کنم، نمی‌دانم، با گذشت زمان، شاید این چیزی باشد که تکامل یابد، به این ترتیب که بیشتر به ابزاری برای مردم تبدیل شود.

مثل اینکه از ترجمه ماشینی به عنوان مبنایی برای ایجاد نسخه ترجمه شده یک وب سایت استفاده می کنید.

اما شما هنوز… اساساً به صورت دستی از طریق آن کار می کنید.”

چرا انسان باید محتوای ترجمه شده خودکار را بررسی کند؟

همانطور که در بالا ذکر شد، نگرانی Google این است که محتوای ارجاع شده از صفحات نتایج موتور جستجو (SERP) با کیفیت بالا باشد و کاربران از آن راضی باشند.

چیزی که مورد بحث قرار نگرفت این است که محتوای ترجمه شده حاوی امضاهایی است که الگوریتم تشخیص ترجمه می تواند آنها را شناسایی کند.

تشخیص محتوای ترجمه شده توسط ماشین چیزی است که سال‌ها مورد تحقیق قرار گرفته است.

یک مقاله تحقیقاتی از سال ۲۰۲۱ (تشخیص متن ترجمه شده ماشینی از طریق تشابه متن با ترجمه رفت و برگشت – دانلود PDF) بیان می‌کند که محتوایی که از زبانی به زبان دیگر ترجمه می‌شود می‌تواند برای انسان پیچیده باشد.

برای مثال، با استفاده از ۱۰۰ متن ترجمه شده، ارزیاب‌های انسانی فقط می‌توانند بیش از نیمی از متون ترجمه شده را شناسایی کنند.

محققان خاطرنشان کردند:

“متوسط ​​دقت ۵۳.۳٪ (۵۵.۰٪ برای افراد بومی زبان و ۵۲.۰٪ برای افراد غیربومی) بود که نزدیک به تصادفی بود.”

رویکردی که تشابه متن با ترجمه رفت و برگشت (TSRT) نامیده می‌شود، عملکرد بهتری نسبت به ارزیابی‌کننده‌های انسانی داشت و زمانی که مقاله در سال ۲۰۲۱ منتشر شد، امتیازی بالاتر از آشکارسازهای ترجمه پیشرفته کسب کرد.

قابل توجه، این تکنیک می تواند زبان اصلی متون ترجمه شده را تشخیص دهد.

همچنین می‌تواند تعیین کند که کدام الگوریتم ترجمه ترجمه را انجام داده است.

آنها گزارش دادند:

“نتایج ارزیابی نشان می دهد که TSRT با دقت ۹۰.۲% بهتر از سایر روش ها عمل می کند.

علاوه بر این، TSRT همچنین می‌تواند مترجم اصلی و زبان ترجمه را به ترتیب با دقت ۹۳.۳% و ۸۵.۶% شناسایی کند.”

مشخص نیست که آیا Google می‌تواند محتوای ترجمه‌شده را شناسایی کند و آیا Google حتی سعی در شناسایی محتوای ترجمه‌شده دارد یا خیر.

اما ما می دانیم که فناوری برای تشخیص آن وجود دارد. این فناوری می تواند محتوای ترجمه شده را بهتر از انسان تشخیص دهد و تعیین کند که کدام الگوریتم ترجمه ترجمه را انجام داده است.

اگر این واقعیت که برخلاف دستورالعمل‌های وب‌مستر است و ممکن است تجربه کاربری منفی داشته باشد برای ایجاد انگیزه در ویرایش محتوای ترجمه‌شده توسط ماشین کافی نیست، شاید احتمال که Google کیفیت محتوا را برای ترجمه ماشینی تجزیه و تحلیل می‌کند ممکن است دلیلی برای بررسی جامع این نوع محتوا باشد.


نقل قول

در ساعت ۱۷:۵۰ دقیقه به پاتوق Google Office Hours گوش دهید.

تصویر ویژه توسط Shutterstock/g_tech

مقالات مرتبط
پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد.قسمتهای مورد نیاز علامت گذاری شده اند *