تهران ، ولیعصر
021-987654

نشت عوامل رتبه بندی جستجوی Yandex: بینش

جامعه بازاریابی جستجو در تلاش است تا مخزن Yandex لو رفته حاوی فایل‌هایی را که به نظر عوامل رتبه‌بندی جستجو فهرست می‌شوند، درک کند.

برخی ممکن است به دنبال سرنخ‌های عملی SEO باشند، اما احتمالاً این ارزش واقعی نیست.

توافق کلی این است که برای به دست آوردن یک درک کلی از نحوه کار موتورهای جستجو مفید خواهد بود.

چیزهای زیادی برای یادگیری وجود دارد

رایان جونز (@RyanJones) معتقد است که این درز یک معامله بزرگ است.

او قبلاً برخی از مدل‌های یادگیری ماشین Yandex را بارگذاری کرده است دستگاه خود برای آزمایش.

رایان متقاعد شده است که چیزهای زیادی برای یادگیری وجود دارد، اما این کار بسیار فراتر از بررسی فهرستی از عوامل رتبه‌بندی است.

رایان توضیح می دهد:

“در حالی که Yandex گوگل نیست، از نظر شباهت چیزهای زیادی می توانیم از آن بیاموزیم.

Yandex از بسیاری از فناوری‌های اختراع شده Google استفاده می‌کند. آنها رتبه صفحه را با نام ارجاع می دهند، از Map Reduce و BERT و بسیاری موارد دیگر نیز استفاده می کنند.

بدیهی است که عوامل متفاوت خواهند بود و وزن‌های اعمال شده برای آنها نیز متفاوت خواهد بود، اما روش‌های علوم رایانه در مورد نحوه تجزیه و تحلیل ارتباط متن و پیوند متن و انجام محاسبات در موتورهای جستجو بسیار مشابه خواهد بود.

من فکر می‌کنم می‌توانیم اطلاعات زیادی از فاکتورهای رتبه‌بندی به‌دست آوریم، اما فقط نگاه کردن به فهرست فاش‌شده به تنهایی کافی نیست.

وقتی به وزن‌های پیش‌فرض اعمال‌شده (قبل از ML) نگاه می‌کنید، وزن‌های منفی وجود دارد که سئوکاران آن را مثبت فرض می‌کنند یا برعکس.

همچنین فاکتورهای رتبه‌بندی بسیار بیشتری در کد نسبت به آنچه در فهرست عوامل رتبه‌بندی شناور فهرست شده است، محاسبه شده است.

به نظر می‌رسد که این فهرست فقط فاکتورهای ثابت باشد و نحوه محاسبه ارتباط پرس و جو یا بسیاری از عوامل پویا که به مجموعه نتایج مربوط به آن پرس و جو مربوط می‌شوند را در نظر نمی‌گیرد.”

بیش از ۲۰۰ عامل رتبه بندی

معمولاً بر اساس لو رفتن، تکرار می‌شود که Yandex از ۱۹۲۳ فاکتور رتبه‌بندی استفاده می‌کند (برخی کمتر می‌گویند).

کریستوف سمپر (نمایه LinkedIn)، بنیانگذار ابزارهای تحقیق لینک ، می گوید که دوستان به او گفته اند که فاکتورهای رتبه بندی بسیار بیشتری وجود دارد.

کریستف به اشتراک گذاشت:

“دوستان دیده اند:

  • ۲۷۵ عامل شخصی سازی
  • ۲۲۰ عامل «طراوت وب»
  • ۳۱۸۶ عامل جستجوی تصویر
  • ۲,۳۱۴ فاکتور جستجوی ویدیو

خیلی چیزهای بیشتری برای نقشه برداری وجود دارد.

احتمالاً شگفت‌انگیزترین چیز برای بسیاری این است که Yandex صدها فاکتور برای پیوندها دارد.”

نکته این است که بسیار بیشتر از ۲۰۰+ فاکتور رتبه‌بندی Google است که ادعا می‌کرد.

و حتی جان مولر گوگل گفت که Google از بیش از ۲۰۰ عامل رتبه بندی فاصله گرفته است.

بنابراین شاید این به صنعت جستجو کمک کند تا از تفکر الگوریتم Google در آن عبارات دور شود.

هیچ کس کل الگوریتم گوگل را نمی داند؟

آنچه در مورد نشت داده ها قابل توجه است این است که فاکتورهای رتبه بندی به روشی ساده جمع آوری و سازماندهی شده اند.

این نشت این ایده را زیر سوال می‌برد که الگوریتم Google به شدت محافظت می‌شود و هیچ‌کس، حتی در Google، کل الگوریتم را نمی‌داند.

آیا ممکن است صفحه‌گسترده‌ای در Google با بیش از هزار فاکتور رتبه‌بندی وجود داشته باشد؟

کریستف سمپر این ایده را زیر سوال می برد که هیچ کس الگوریتم Google را نمی داند.

کریستف به مجله موتور جستجو نظر داد:

«شخصی در لینکدین گفت که نمی‌توانست تصور کند که گوگل فاکتورهای رتبه‌بندی را به همین شکل «مستند» کند.

اما اینگونه است که باید یک سیستم پیچیده مانند آن ساخته شود. این درز از یک خودی بسیار معتبر است.

Google کدی دارد که ممکن است فاش شود.

این جمله که اغلب تکرار می‌شود مبنی بر اینکه حتی کارمندان Google از فاکتورهای رتبه‌بندی نمی‌دانند، همیشه برای فردی فنی مثل من پوچ به نظر می‌رسید.

تعداد افرادی که همه جزئیات را دارند بسیار کم خواهد بود.

اما باید در کد وجود داشته باشد، زیرا کد چیزی است که موتور جستجو را اجرا می‌کند.”

کدام بخش از Yandex شبیه Google است؟

فایل‌های Yandex درز کرده، نگاهی اجمالی به نحوه کار موتورهای جستجو دارند.

داده‌ها نحوه عملکرد Google را نشان نمی‌دهند. اما این فرصتی را برای مشاهده بخشی از نحوه رتبه بندی نتایج جستجو توسط موتور جستجو (Yandex) ارائه می دهد.

آنچه در داده‌ها وجود دارد نباید با آنچه ممکن است Google استفاده کند اشتباه گرفته شود.

با این وجود، شباهت های جالبی بین این دو موتور جستجو وجود دارد.

MatrixNet RankBrain نیست

یکی از بینش‌های جالبی که برخی از آنها کشف می‌کنند مربوط به شبکه عصبی Yandex به نام MatrixNet است.

MatrixNet یک فناوری قدیمی است که در سال ۲۰۰۹ معرفی شد (archive.org پیوند به اطلاعیه).

بر خلاف آنچه برخی ادعا می‌کنند، MatrixNet نسخه Yandex RankBrain Google نیست.

Google RankBrain یک الگوریتم محدود است که بر درک ۱۵ درصد از عبارت‌های جستجویی متمرکز است که Google قبلاً ندیده است.

مقاله‌ای در بلومبرگ RankBrain را در سال ۲۰۱۵ فاش کرد. این مقاله بیان می‌کند که RankBrain در آن سال، شش سال پس از معرفی Yandex MatrixNet به الگوریتم Google اضافه شد (عکس فوری Archive.org از مقاله).

مقاله بلومبرگ هدف محدود RankBrain را شرح می‌دهد:

“اگر RankBrain کلمه یا عبارتی را ببیند که با آن آشنا نیست، دستگاه می‌تواند حدس بزند که چه کلمات یا عباراتی ممکن است معنای مشابهی داشته باشند و نتیجه را بر این اساس فیلتر کند و در کارکرد آن موثرتر شود. جست و جوهایی که قبلاً دیده نشده بودند.”

از طرف دیگر MatrixNet یک الگوریتم یادگیری ماشینی است که کارهای زیادی انجام می دهد.

یکی از کارهایی که انجام می دهد طبقه بندی یک عبارت جستجو و سپس اعمال الگوریتم های رتبه بندی مناسب برای آن عبارت است.

این بخشی از آنچه در اعلامیه زبان انگلیسی سال ۲۰۱۶ الگوریتم سال ۲۰۰۹ بیان شده است:

“MatrixNet اجازه می دهد تا فرمول رتبه بندی بسیار طولانی و پیچیده ای را ایجاد کند که تعداد زیادی از عوامل مختلف و ترکیب آنها را در نظر می گیرد.

یکی دیگر از ویژگی های مهم MatrixNet این است که به شما امکان می دهد فرمول رتبه بندی را برای یک کلاس خاص از عبارت های جستجو سفارشی کنید.

اتفاقاً، بهینه سازی الگوریتم رتبه بندی برای مثلاً جستجوهای موسیقی، کیفیت رتبه بندی انواع دیگر جستجوها را تضعیف نمی کند.

یک الگوریتم رتبه بندی مانند ماشین آلات پیچیده با ده ها دکمه، سوئیچ، اهرم و سنج است. معمولاً، هر چرخش تک سوئیچ در یک مکانیسم منجر به تغییر کلی در کل دستگاه می شود.

با این حال، MatrixNet اجازه می دهد تا پارامترهای خاصی را برای کلاس های خاصی از پرس و جوها تنظیم کنید بدون اینکه باعث تعمیر اساسی کل سیستم شود.

علاوه بر این، MatrixNet می تواند به طور خودکار حساسیت را برای محدوده خاصی از عوامل رتبه بندی انتخاب کند.”

MatrixNet بسیار بیشتر از RankBrain انجام می دهد، واضح است که آنها یکسان نیستند.

اما نکته جالب در مورد MatrixNet این است که چگونه فاکتورهای رتبه‌بندی پویا هستند زیرا عبارت‌های جستجو را طبقه‌بندی می‌کند و فاکتورهای مختلفی را برای آنها اعمال می‌کند.

MatrixNet در برخی از اسناد فاکتور رتبه‌بندی ارجاع داده می‌شود، بنابراین مهم است که MatrixNet را در زمینه مناسب قرار دهید تا فاکتورهای رتبه‌بندی در نور مناسب مشاهده شوند و معنادارتر شوند.

ممکن است خواندن اطلاعات بیشتر در مورد الگوریتم Yandex مفید باشد تا به نشت Yandex کمک کند.

بخوانید: هوش مصنوعی و الگوریتم های یادگیری ماشین Yandex

برخی از عوامل Yandex با شیوه های SEO مطابقت دارند

دومینیک وودمن (@dom_woodman) مشاهدات جالبی در مورد این نشت دارد.

برخی از فاکتورهای رتبه‌بندی فاش شده با برخی از روش‌های سئو مانند تغییر متن لنگر منطبق است:

Alex Buraks (@alex_buraks) یک مگا موضوع توییتر در مورد موضوعی منتشر کرده است که انعکاس شیوه های سئو.

یکی از عوامل برجسته الکس مربوط به بهینه سازی پیوندهای داخلی به منظور به حداقل رساندن عمق خزیدن برای صفحات مهم است.

جان مولر Google مدت‌هاست که ناشران را تشویق می‌کند که مطمئن شوند صفحات مهم به‌طور برجسته به آن پیوند دارند.

مولر از دفن صفحات مهم در عمق معماری سایت جلوگیری می کند.

جان مولر به اشتراک گذاشت در سال ۲۰۲۰:

“بنابراین اتفاقی که خواهد افتاد این است که می بینیم صفحه اصلی واقعا مهم است، چیزهایی که از صفحه اصلی پیوند داده شده اند نیز معمولاً بسیار مهم هستند.

و سپس… همانطور که از صفحه اصلی دور می‌شود، فکر می‌کنیم که احتمالاً این موضوع کمتر مهم است.»

نگه داشتن صفحات مهم نزدیک به صفحات اصلی که بازدیدکنندگان سایت از آن وارد می شوند مهم است.

بنابراین اگر پیوندها به صفحه اصلی اشاره می‌کنند، صفحاتی که از صفحه اصلی پیوند داده شده‌اند مهم‌تر دیده می‌شوند.

جان مولر نگفته است که عمق خزیدن یک عامل رتبه‌بندی است. او به سادگی گفت که به Google سیگنال می دهد که کدام صفحات مهم هستند.

قانون Yandex ذکر شده توسط Alex از عمق خزیدن از صفحه اصلی به عنوان قانون رتبه بندی استفاده می کند.

این منطقی است که صفحه اصلی را به عنوان نقطه شروع اهمیت در نظر بگیرید و سپس هر چه بیشتر از آن در عمق سایت کلیک کنید، اهمیت کمتری را محاسبه کنید.

مقالات تحقیقاتی Google نیز وجود دارد که ایده‌های مشابهی دارند (مدل موج سوار معقول، مدل موج سوار تصادفی)، که احتمال اینکه یک موج سوار تصادفی ممکن است در یک صفحه وب مشخص به سادگی با دنبال کردن پیوندها به پایان برسد را محاسبه می کند.

Alex عاملی را پیدا کرد که صفحات اصلی مهم را اولویت بندی می کند:

قاعده سرانگشتی برای SEO از دیرباز این بوده است که محتوای مهم را بیش از چند کلیک از صفحه اصلی (یا از صفحات داخلی که لینک‌های ورودی را جذب می‌کنند) فاصله نداشته باشد.

Yandex Update Vega… به تخصص و اقتدار مرتبط است؟

Yandex موتور جستجوی خود را در سال ۲۰۱۹ با به‌روزرسانی به نام Vega به‌روزرسانی کرد.

به‌روزرسانی Yandex Vega عصبی ویژه شبکه هایی که با کارشناسان موضوع آموزش دیده اند.

این به‌روزرسانی ۲۰۱۹ با هدف معرفی نتایج جستجو با صفحات خبره و معتبر بود.

اما بازاریابان جستجویی که در حال بررسی اسناد هستند، هنوز چیزی که با مواردی مانند بیوگرافی نویسنده مرتبط باشد، پیدا نکرده‌اند، که برخی معتقدند مربوط به تخصص و اعتباری است که Google به دنبال آن است.

یاد بگیرید، بیاموزید، بیاموزید

ما در روزهای اولیه افشای اطلاعات هستیم و من گمان می‌کنم که منجر به درک بهتری از نحوه عملکرد موتورهای جستجو به طور کلی شود.


تصویر ویژه: Shutterstock/san4ezz

مقالات مرتبط
پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد.قسمتهای مورد نیاز علامت گذاری شده اند *