ساعات اداری SEO اکتبر Google پاسخ داد که آیا استفاده از محتوای ترجمه شده به طور خودکار که توسط یک انسان بازبینی شده و تنها تغییرات جزئی ویرایشی داشته است، اشکالی ندارد یا خیر.
قسمت ساعات کاری دفتر SEO-Google
این قسمت از پاتوق ساعات اداری از قالب جدیدی پیروی می کند که در آن سؤالات به صورت کتبی ارسال می شوند و سپس پاسخ ها داده می شود.
کارمندان Google که به سوالات پاسخ میدهند لیزی ساسمن و جان مولر هستند.
لیزی ساسمن (@okaylizzi) یک نویسنده فناوری است که “به آن اهمیت می دهد” اسناد Google Site Central.
برخلاف قالب زنده قبلی، که در آن مخاطبان در زمان واقعی سؤال میپرسیدند، این قالب جدید فرصت پرسیدن سؤالات بعدی را از بین میبرد.
این منجر به پاسخهایی میشود که به طور دقیق مستندات Google را منعکس میکنند، بدون هیچ شانسی برای شفافسازی.
فردی که این سوال را میپرسد نگران محتوای خود بود که به صورت ماشینی از زبان دیگری ترجمه شده بود.
آنها از ویرایشگرهای انسانی استفاده کردند تا محتوایی را که به طور منظم قابل قبول بوده و فقط به تغییرات جزئی نیاز دارد، بررسی کنند.
به طور طبیعی، شخصی که این سؤال را میپرسد نگران است که آیا «ترفندهای جزئی» برای قابل قبول کردن محتوا برای Google کافی است یا خیر.
لیزی ساسمن به این سوال با پاسخی که مستندات Google را از نزدیک دنبال کرده بود پاسخ داد.
مطمئناً، پاسخ را میتوان با یک سؤال بعدی برای تعیین اینکه آیا «ترفندهای جزئی» به اندازه کافی خوب هستند روشن کرد.
بالاخره، این سوال به صراحت می پرسد که آیا ترفندهای جزئی برای Google به اندازه کافی خوب هستند یا خیر.
احتمالاً پاسخ ضمنی استفاده از قضاوت شما در مورد کیفیت محتوای ترجمه شده است.
خودتان قضاوت کنید.
آیا محتوای ترجمه شده ماشینی با ویرایش متوسط قابل قبول است؟
آنها پرسیدند:
“یک سایت از ترجمه ماشینی برای ارائه پستها به زبانهای دیگر استفاده میکند.
محتوا توسط مترجمان انسانی بررسی میشود و آنها اغلب پس از تغییرات جزئی از کیفیت آن راضی هستند.
این برای Google مشکلی ندارد؟»
لیزی ساسمن از Google پاسخ داد:
«خب این خوب است که می شنویم که مترجمان انسانی خوشحال هستند و این برای Google کاملاً خوب است تا زمانی که انسانی در فرآیند بررسی حضور داشته باشد. این کلید است.
چیزی که میخواهید مراقب آن باشید این است که مطمئن شوید کیفیت همچنان خوب است و برای افرادی که محتوا را میخوانند خوب عمل میکند.”
پاسخ بهطور مشخص نمیگوید که آیا ویرایشهای جزئی خوب هستند یا نه، فقط این که اگر «مترجمان انسانی» با آن خوب باشند، پس باید برای Google خوب باشد.
آیا ممکن است Google بررسی نمیکند که محتوا بهصورت ماشینی ترجمه شده است، اما به سیگنالهای استاندارد کیفیت محتوای متکی است؟
ما نمی دانیم.
قالب جدید ساعات اداری به فردی که سؤال میپرسد فرصتی برای پرسیدن سؤال بعدی نمیدهد.
خطمشیهای هرزنامه Google
اسناد توسعهدهنده Google در مورد محتوای هرزنامه به ابزارهای ترجمه خودکار متن اشاره میکند و به صراحت میگوید که هرزنامه است، مگر زمانی که یک عنصر انسانی در آن دخیل باشد.
این چیزی است که در اسناد Google آمده است:
«نمونههایی از محتوای تولید شده به صورت خودکار هرزنامه عبارتند از:
متن ترجمه شده توسط یک ابزار خودکار بدون بررسی یا نظارت انسانی قبل از انتشار”
بنابراین از دستورالعملهای منتشر شده Google مشخص است که تا زمانی که یک انسان محتوای ترجمه شده توسط ماشین را ویرایش میکند، Google با آن مشکلی ندارد.
علاوه بر این، جان مولر در یک ویدیوی Google Office-Hours از آوریل ۲۰۲۲ اشاره کرد که چگونه محتوای تولید شده توسط هوش مصنوعی هرزنامه محسوب میشود و سپس به محتوای ترجمه شده خودکار اشاره کرد.
مولر در مورد ابزارهای تولید محتوای هوش مصنوعی صحبت کرد و آنها را با ابزارهای ترجمه خودکار مقایسه کرد.
در ۲۴:۵۵ دقیقه آوریل مولر گفت: ویدیوی ساعت اداری ۲۰۲۲:
«فکر میکنم، نمیدانم، با گذشت زمان، شاید این چیزی باشد که تکامل یابد، به این ترتیب که بیشتر به ابزاری برای مردم تبدیل شود.
مثل اینکه از ترجمه ماشینی به عنوان مبنایی برای ایجاد نسخه ترجمه شده یک وب سایت استفاده می کنید.
اما شما هنوز… اساساً به صورت دستی از طریق آن کار می کنید.”
چرا انسان باید محتوای ترجمه شده خودکار را بررسی کند؟
همانطور که در بالا ذکر شد، نگرانی Google این است که محتوای ارجاع شده از صفحات نتایج موتور جستجو (SERP) با کیفیت بالا باشد و کاربران از آن راضی باشند.
چیزی که مورد بحث قرار نگرفت این است که محتوای ترجمه شده حاوی امضاهایی است که الگوریتم تشخیص ترجمه می تواند آنها را شناسایی کند.
تشخیص محتوای ترجمه شده توسط ماشین چیزی است که سالها مورد تحقیق قرار گرفته است.
یک مقاله تحقیقاتی از سال ۲۰۲۱ (تشخیص متن ترجمه شده ماشینی از طریق تشابه متن با ترجمه رفت و برگشت – دانلود PDF) بیان میکند که محتوایی که از زبانی به زبان دیگر ترجمه میشود میتواند برای انسان پیچیده باشد.
برای مثال، با استفاده از ۱۰۰ متن ترجمه شده، ارزیابهای انسانی فقط میتوانند بیش از نیمی از متون ترجمه شده را شناسایی کنند.
محققان خاطرنشان کردند:
“متوسط دقت ۵۳.۳٪ (۵۵.۰٪ برای افراد بومی زبان و ۵۲.۰٪ برای افراد غیربومی) بود که نزدیک به تصادفی بود.”
رویکردی که تشابه متن با ترجمه رفت و برگشت (TSRT) نامیده میشود، عملکرد بهتری نسبت به ارزیابیکنندههای انسانی داشت و زمانی که مقاله در سال ۲۰۲۱ منتشر شد، امتیازی بالاتر از آشکارسازهای ترجمه پیشرفته کسب کرد.
قابل توجه، این تکنیک می تواند زبان اصلی متون ترجمه شده را تشخیص دهد.
همچنین میتواند تعیین کند که کدام الگوریتم ترجمه ترجمه را انجام داده است.
آنها گزارش دادند:
“نتایج ارزیابی نشان می دهد که TSRT با دقت ۹۰.۲% بهتر از سایر روش ها عمل می کند.
علاوه بر این، TSRT همچنین میتواند مترجم اصلی و زبان ترجمه را به ترتیب با دقت ۹۳.۳% و ۸۵.۶% شناسایی کند.”
مشخص نیست که آیا Google میتواند محتوای ترجمهشده را شناسایی کند و آیا Google حتی سعی در شناسایی محتوای ترجمهشده دارد یا خیر.
اما ما می دانیم که فناوری برای تشخیص آن وجود دارد. این فناوری می تواند محتوای ترجمه شده را بهتر از انسان تشخیص دهد و تعیین کند که کدام الگوریتم ترجمه ترجمه را انجام داده است.
اگر این واقعیت که برخلاف دستورالعملهای وبمستر است و ممکن است تجربه کاربری منفی داشته باشد برای ایجاد انگیزه در ویرایش محتوای ترجمهشده توسط ماشین کافی نیست، شاید احتمال که Google کیفیت محتوا را برای ترجمه ماشینی تجزیه و تحلیل میکند ممکن است دلیلی برای بررسی جامع این نوع محتوا باشد.
نقل قول
در ساعت ۱۷:۵۰ دقیقه به پاتوق Google Office Hours گوش دهید.
تصویر ویژه توسط Shutterstock/g_tech