جامعه بازاریابی جستجو در تلاش است تا مخزن Yandex لو رفته حاوی فایلهایی را که به نظر عوامل رتبهبندی جستجو فهرست میشوند، درک کند.
برخی ممکن است به دنبال سرنخهای عملی SEO باشند، اما احتمالاً این ارزش واقعی نیست.
توافق کلی این است که برای به دست آوردن یک درک کلی از نحوه کار موتورهای جستجو مفید خواهد بود.
اگر هک یا میانبر میخواهید، آنها اینجا نیستند. اما اگر می خواهید در مورد نحوه کار یک موتور جستجو بیشتر بدانید. طلا وجود دارد.
— رایان جونز (@RyanJones) 29 ژانویه ۲۰
چیزهای زیادی برای یادگیری وجود دارد
رایان جونز (@RyanJones) معتقد است که این درز یک معامله بزرگ است.
او قبلاً برخی از مدلهای یادگیری ماشین Yandex را بارگذاری کرده است دستگاه خود برای آزمایش.
رایان متقاعد شده است که چیزهای زیادی برای یادگیری وجود دارد، اما این کار بسیار فراتر از بررسی فهرستی از عوامل رتبهبندی است.
رایان توضیح می دهد:
“در حالی که Yandex گوگل نیست، از نظر شباهت چیزهای زیادی می توانیم از آن بیاموزیم.
Yandex از بسیاری از فناوریهای اختراع شده Google استفاده میکند. آنها رتبه صفحه را با نام ارجاع می دهند، از Map Reduce و BERT و بسیاری موارد دیگر نیز استفاده می کنند.
بدیهی است که عوامل متفاوت خواهند بود و وزنهای اعمال شده برای آنها نیز متفاوت خواهد بود، اما روشهای علوم رایانه در مورد نحوه تجزیه و تحلیل ارتباط متن و پیوند متن و انجام محاسبات در موتورهای جستجو بسیار مشابه خواهد بود.
من فکر میکنم میتوانیم اطلاعات زیادی از فاکتورهای رتبهبندی بهدست آوریم، اما فقط نگاه کردن به فهرست فاششده به تنهایی کافی نیست.
وقتی به وزنهای پیشفرض اعمالشده (قبل از ML) نگاه میکنید، وزنهای منفی وجود دارد که سئوکاران آن را مثبت فرض میکنند یا برعکس.
همچنین فاکتورهای رتبهبندی بسیار بیشتری در کد نسبت به آنچه در فهرست عوامل رتبهبندی شناور فهرست شده است، محاسبه شده است.
به نظر میرسد که این فهرست فقط فاکتورهای ثابت باشد و نحوه محاسبه ارتباط پرس و جو یا بسیاری از عوامل پویا که به مجموعه نتایج مربوط به آن پرس و جو مربوط میشوند را در نظر نمیگیرد.”
بیش از ۲۰۰ عامل رتبه بندی
معمولاً بر اساس لو رفتن، تکرار میشود که Yandex از ۱۹۲۳ فاکتور رتبهبندی استفاده میکند (برخی کمتر میگویند).
کریستوف سمپر (نمایه LinkedIn)، بنیانگذار ابزارهای تحقیق لینک ، می گوید که دوستان به او گفته اند که فاکتورهای رتبه بندی بسیار بیشتری وجود دارد.
کریستف به اشتراک گذاشت:
“دوستان دیده اند:
- ۲۷۵ عامل شخصی سازی
- ۲۲۰ عامل «طراوت وب»
- ۳۱۸۶ عامل جستجوی تصویر
- ۲,۳۱۴ فاکتور جستجوی ویدیو
خیلی چیزهای بیشتری برای نقشه برداری وجود دارد.
احتمالاً شگفتانگیزترین چیز برای بسیاری این است که Yandex صدها فاکتور برای پیوندها دارد.”
نکته این است که بسیار بیشتر از ۲۰۰+ فاکتور رتبهبندی Google است که ادعا میکرد.
و حتی جان مولر گوگل گفت که Google از بیش از ۲۰۰ عامل رتبه بندی فاصله گرفته است.
بنابراین شاید این به صنعت جستجو کمک کند تا از تفکر الگوریتم Google در آن عبارات دور شود.
هیچ کس کل الگوریتم گوگل را نمی داند؟
آنچه در مورد نشت داده ها قابل توجه است این است که فاکتورهای رتبه بندی به روشی ساده جمع آوری و سازماندهی شده اند.
این نشت این ایده را زیر سوال میبرد که الگوریتم Google به شدت محافظت میشود و هیچکس، حتی در Google، کل الگوریتم را نمیداند.
آیا ممکن است صفحهگستردهای در Google با بیش از هزار فاکتور رتبهبندی وجود داشته باشد؟
کریستف سمپر این ایده را زیر سوال می برد که هیچ کس الگوریتم Google را نمی داند.
کریستف به مجله موتور جستجو نظر داد:
«شخصی در لینکدین گفت که نمیتوانست تصور کند که گوگل فاکتورهای رتبهبندی را به همین شکل «مستند» کند.
اما اینگونه است که باید یک سیستم پیچیده مانند آن ساخته شود. این درز از یک خودی بسیار معتبر است.
Google کدی دارد که ممکن است فاش شود.
این جمله که اغلب تکرار میشود مبنی بر اینکه حتی کارمندان Google از فاکتورهای رتبهبندی نمیدانند، همیشه برای فردی فنی مثل من پوچ به نظر میرسید.
تعداد افرادی که همه جزئیات را دارند بسیار کم خواهد بود.
اما باید در کد وجود داشته باشد، زیرا کد چیزی است که موتور جستجو را اجرا میکند.”
کدام بخش از Yandex شبیه Google است؟
فایلهای Yandex درز کرده، نگاهی اجمالی به نحوه کار موتورهای جستجو دارند.
دادهها نحوه عملکرد Google را نشان نمیدهند. اما این فرصتی را برای مشاهده بخشی از نحوه رتبه بندی نتایج جستجو توسط موتور جستجو (Yandex) ارائه می دهد.
آنچه در دادهها وجود دارد نباید با آنچه ممکن است Google استفاده کند اشتباه گرفته شود.
با این وجود، شباهت های جالبی بین این دو موتور جستجو وجود دارد.
MatrixNet RankBrain نیست
یکی از بینشهای جالبی که برخی از آنها کشف میکنند مربوط به شبکه عصبی Yandex به نام MatrixNet است.
MatrixNet یک فناوری قدیمی است که در سال ۲۰۰۹ معرفی شد (archive.org پیوند به اطلاعیه).
بر خلاف آنچه برخی ادعا میکنند، MatrixNet نسخه Yandex RankBrain Google نیست.
Google RankBrain یک الگوریتم محدود است که بر درک ۱۵ درصد از عبارتهای جستجویی متمرکز است که Google قبلاً ندیده است.
مقالهای در بلومبرگ RankBrain را در سال ۲۰۱۵ فاش کرد. این مقاله بیان میکند که RankBrain در آن سال، شش سال پس از معرفی Yandex MatrixNet به الگوریتم Google اضافه شد (عکس فوری Archive.org از مقاله).
مقاله بلومبرگ هدف محدود RankBrain را شرح میدهد:
“اگر RankBrain کلمه یا عبارتی را ببیند که با آن آشنا نیست، دستگاه میتواند حدس بزند که چه کلمات یا عباراتی ممکن است معنای مشابهی داشته باشند و نتیجه را بر این اساس فیلتر کند و در کارکرد آن موثرتر شود. جست و جوهایی که قبلاً دیده نشده بودند.”
از طرف دیگر MatrixNet یک الگوریتم یادگیری ماشینی است که کارهای زیادی انجام می دهد.
یکی از کارهایی که انجام می دهد طبقه بندی یک عبارت جستجو و سپس اعمال الگوریتم های رتبه بندی مناسب برای آن عبارت است.
این بخشی از آنچه در اعلامیه زبان انگلیسی سال ۲۰۱۶ الگوریتم سال ۲۰۰۹ بیان شده است:
“MatrixNet اجازه می دهد تا فرمول رتبه بندی بسیار طولانی و پیچیده ای را ایجاد کند که تعداد زیادی از عوامل مختلف و ترکیب آنها را در نظر می گیرد.
یکی دیگر از ویژگی های مهم MatrixNet این است که به شما امکان می دهد فرمول رتبه بندی را برای یک کلاس خاص از عبارت های جستجو سفارشی کنید.
اتفاقاً، بهینه سازی الگوریتم رتبه بندی برای مثلاً جستجوهای موسیقی، کیفیت رتبه بندی انواع دیگر جستجوها را تضعیف نمی کند.
یک الگوریتم رتبه بندی مانند ماشین آلات پیچیده با ده ها دکمه، سوئیچ، اهرم و سنج است. معمولاً، هر چرخش تک سوئیچ در یک مکانیسم منجر به تغییر کلی در کل دستگاه می شود.
با این حال، MatrixNet اجازه می دهد تا پارامترهای خاصی را برای کلاس های خاصی از پرس و جوها تنظیم کنید بدون اینکه باعث تعمیر اساسی کل سیستم شود.
علاوه بر این، MatrixNet می تواند به طور خودکار حساسیت را برای محدوده خاصی از عوامل رتبه بندی انتخاب کند.”
MatrixNet بسیار بیشتر از RankBrain انجام می دهد، واضح است که آنها یکسان نیستند.
اما نکته جالب در مورد MatrixNet این است که چگونه فاکتورهای رتبهبندی پویا هستند زیرا عبارتهای جستجو را طبقهبندی میکند و فاکتورهای مختلفی را برای آنها اعمال میکند.
MatrixNet در برخی از اسناد فاکتور رتبهبندی ارجاع داده میشود، بنابراین مهم است که MatrixNet را در زمینه مناسب قرار دهید تا فاکتورهای رتبهبندی در نور مناسب مشاهده شوند و معنادارتر شوند.
ممکن است خواندن اطلاعات بیشتر در مورد الگوریتم Yandex مفید باشد تا به نشت Yandex کمک کند.
بخوانید: هوش مصنوعی و الگوریتم های یادگیری ماشین Yandex
برخی از عوامل Yandex با شیوه های SEO مطابقت دارند
دومینیک وودمن (@dom_woodman) مشاهدات جالبی در مورد این نشت دارد.
برخی از فاکتورهای رتبهبندی فاش شده با برخی از روشهای سئو مانند تغییر متن لنگر منطبق است:
انکر متن خود را تغییر دهید عزیزم!
۴/x pic.twitter.com/qSGH4xF5UQ
— دومینیک وودمن (@dom_woodman) 27 ژانویه ۲۰
Alex Buraks (@alex_buraks) یک مگا موضوع توییتر در مورد موضوعی منتشر کرده است که انعکاس شیوه های سئو.
یکی از عوامل برجسته الکس مربوط به بهینه سازی پیوندهای داخلی به منظور به حداقل رساندن عمق خزیدن برای صفحات مهم است.
جان مولر Google مدتهاست که ناشران را تشویق میکند که مطمئن شوند صفحات مهم بهطور برجسته به آن پیوند دارند.
مولر از دفن صفحات مهم در عمق معماری سایت جلوگیری می کند.
جان مولر به اشتراک گذاشت در سال ۲۰۲۰:
“بنابراین اتفاقی که خواهد افتاد این است که می بینیم صفحه اصلی واقعا مهم است، چیزهایی که از صفحه اصلی پیوند داده شده اند نیز معمولاً بسیار مهم هستند.
و سپس… همانطور که از صفحه اصلی دور میشود، فکر میکنیم که احتمالاً این موضوع کمتر مهم است.»
نگه داشتن صفحات مهم نزدیک به صفحات اصلی که بازدیدکنندگان سایت از آن وارد می شوند مهم است.
بنابراین اگر پیوندها به صفحه اصلی اشاره میکنند، صفحاتی که از صفحه اصلی پیوند داده شدهاند مهمتر دیده میشوند.
جان مولر نگفته است که عمق خزیدن یک عامل رتبهبندی است. او به سادگی گفت که به Google سیگنال می دهد که کدام صفحات مهم هستند.
قانون Yandex ذکر شده توسط Alex از عمق خزیدن از صفحه اصلی به عنوان قانون رتبه بندی استفاده می کند.
#۱ عمق خزیدن یک عامل رتبه بندی است.
صفحات مهم خود را به صفحه اصلی نزدیک نگه دارید:
– صفحات برتر: ۱ کلیک از صفحه اصلی
– صفحات مهم: pic.twitter.com/BB1YPT9Egk— الکس بوراکس (@alex_buraks) 28 ژانویه، ۲۲۰ ژانویه
این منطقی است که صفحه اصلی را به عنوان نقطه شروع اهمیت در نظر بگیرید و سپس هر چه بیشتر از آن در عمق سایت کلیک کنید، اهمیت کمتری را محاسبه کنید.
مقالات تحقیقاتی Google نیز وجود دارد که ایدههای مشابهی دارند (مدل موج سوار معقول، مدل موج سوار تصادفی)، که احتمال اینکه یک موج سوار تصادفی ممکن است در یک صفحه وب مشخص به سادگی با دنبال کردن پیوندها به پایان برسد را محاسبه می کند.
Alex عاملی را پیدا کرد که صفحات اصلی مهم را اولویت بندی می کند:
#۳ پیوندهای برگشتی از صفحات اصلی مهمتر از صفحات داخلی هستند.
منطقی. pic.twitter.com/Mts9jHsRjE
— الکس بوراکس (@alex_buraks) 28 ژانویه، ۲۸ ژانویه
قاعده سرانگشتی برای SEO از دیرباز این بوده است که محتوای مهم را بیش از چند کلیک از صفحه اصلی (یا از صفحات داخلی که لینکهای ورودی را جذب میکنند) فاصله نداشته باشد.
Yandex Update Vega… به تخصص و اقتدار مرتبط است؟
Yandex موتور جستجوی خود را در سال ۲۰۱۹ با بهروزرسانی به نام Vega بهروزرسانی کرد.
بهروزرسانی Yandex Vega عصبی ویژه شبکه هایی که با کارشناسان موضوع آموزش دیده اند.
این بهروزرسانی ۲۰۱۹ با هدف معرفی نتایج جستجو با صفحات خبره و معتبر بود.
اما بازاریابان جستجویی که در حال بررسی اسناد هستند، هنوز چیزی که با مواردی مانند بیوگرافی نویسنده مرتبط باشد، پیدا نکردهاند، که برخی معتقدند مربوط به تخصص و اعتباری است که Google به دنبال آن است.
یاد بگیرید، بیاموزید، بیاموزید
ما در روزهای اولیه افشای اطلاعات هستیم و من گمان میکنم که منجر به درک بهتری از نحوه عملکرد موتورهای جستجو به طور کلی شود.
تصویر ویژه: Shutterstock/san4ezz