یکی از الگوریتم هایی که خیلی کم درباره آن صحبت شده، الگوریتم فاصله لینک است. در این مقاله، قصد داریم به شکل کامل با این الگوریتم آشنا شویم. این نوع الگوریتم ممکن است در رتبه بندی سایت ها نقش داشته باشد. به همین دلیل شناخت آن می تواند برای کارشناسان سئو اهمیت زیادی داشته باشد.
آیا گوگل از این الگوریتم استفاده می کند؟
هرچند این الگوریتم در یکی از پتنت های ثبت شده توسط گوگل آمده، ولی گوگل همیشه اعلام کرده که همه پتنت ها و مقالات تحقیقاتی لزوما در محصولات استفاده نمی شوند. یا اگر هم استفاده شوند، ممکن است کاربرد آن ها با متن اصلی متفاوت باشد.
با این حال، نکاتی که در این الگوریتم آمده شباهت هایی با نحوه پردازش لینک ها در گوگل دارد.
محاسبات سنگین و پیچیده الگوریتم
در پتنتی با عنوان “تولید رتبه برای صفحات با استفاده از فاصله در گراف لینک های وب”، به پیچیدگی بالای محاسبات اشاره شده است. در دو بخش مختلف از این سند آمده:
محاسبه این الگوریتم برای هر صفحه بذر، نیازمند حل کل سیستم به صورت جداگانه است. یعنی هرچه تعداد صفحات بذر بیشتر شود، پیچیدگی محاسبات نیز بیشتر می شود. به همین دلیل، استفاده عملی از تعداد زیاد صفحات بذر دشوار خواهد بود.
بنابراین، نیاز به روشی هست که بتواند رتبه صفحات را با استفاده از تعداد زیادی صفحه بذر متنوع، به صورت دقیق محاسبه کند.
این موضوع نشان می دهد که محاسبه این الگوریتم برای کل وب بسیار سنگین است. اما اگر گراف لینک ها را به بخش های موضوعی تقسیم کنیم، محاسبات ساده تر می شوند.
نکته جالب اینجاست که الگوریتم پنگوئن در گذشته تنها سالی یک بار محاسبه می شد. سایت هایی که جریمه می شدند، تا زمان بروزرسانی بعدی در همان وضعیت باقی می ماندند.
در ادامه، گوگل زیرساخت خود را تقویت کرد. این تغییرات البته معمولا اعلام نمی شوند. فقط سیستم Caffeine که مربوط به ایندکس وب است، به صورت عمومی معرفی شد.
الگوریتم پنگوئن در پاییز ۲۰۱۶ منتشر شد.
بنابراین، احتمالا گوگل یک بار برای کل وب محاسبه را انجام می دهد و سپس امتیاز هر سایت را بر اساس فاصله از صفحات معتبر تعیین می کند. این همان الگوریتم پنگوئن است، اما از زاویه جدیدی نگاه شده است.
نحوه محاسبه رتبه در الگوریتم فاصله
در پتنت آمده:
سیستم ابتدا به هر لینک، بر اساس ویژگی های لینک و صفحه، طول اختصاص می دهد. سپس، کوتاه ترین مسیر بین هر صفحه و مجموعه صفحات بذر را محاسبه می کند. در نهایت، بر اساس همین فاصله ها، نمره ای برای رتبه بندی هر صفحه تعیین می شود.
این یعنی الگوریتم یک امتیاز براساس فاصله کوتاه از صفحات معتبر اختصاص می دهد. این امتیاز، برای فیلتر کردن لینک های اسپم بسیار موثر است.
در واقع، صفحاتی که لینک های دستکاری شده دارند، فاصله زیادی از صفحات بذر خواهند داشت. و این نشان دهنده غیرقابل اعتماد بودن آن صفحات است.
سه مرحله اصلی رتبه بندی
فرآیند رتبه بندی می تواند به سه بخش اصلی تقسیم شود:
ایندکس
رتبه بندی
تعدیل رتبه (معمولا برای شخصی سازی نتایج)
در این الگوریتم، مرحله فاصله لینک در بخش دوم یعنی رتبه بندی انجام می شود. اگر صفحه ای ارتباطی با صفحات بذر نداشته باشد، شانس زیادی برای رتبه گرفتن نخواهد داشت.
در پتنت آمده:
یکی از روش های ممکن برای کاهش اثر لینک های دستکاری شده، انتخاب تعداد کمی صفحه معتبر (صفحات بذر) است. سپس با دنبال کردن لینک ها از این صفحات، سایر صفحات ارزشمند کشف می شوند.
شناخت این موضوع کمک می کند تا بفهمیم الگوریتم فاصله لینک در کدام مرحله اعمال می شود. این موضوع برای طراحی استراتژی سئو اهمیت زیادی دارد.
تفاوت با الگوریتم های دیگر
این الگوریتم با الگوریتم TrustRank یاهو متفاوت است. TrustRank به دلیل سوگیری ذاتی، انتقادهای زیادی دریافت کرده بود.
مدل Topical Trust Flow که توسط Majestic معرفی شد، نسخه بهتری از این الگوریتم است. تحقیقات نشان داده که اگر مجموعه صفحات بذر بر اساس موضوع دسته بندی شوند، نتایج بسیار دقیق تر خواهد بود. این الگوریتم هم از همین رویکرد استفاده می کند.
در واقع، گوگل هم در این الگوریتم از صفحات بذر دسته بندی شده بر اساس موضوعات مختلف استفاده می کند.
مفهوم گراف لینک فیلتر شده
در بخشی از پتنت آمده:
در یک نسخه دیگر از این الگوریتم، لینک هایی که فاصله کوتاه تری دارند، گراف لینک کوچک تری را تشکیل می دهند.
این به این معناست که ما یک نقشه کلی از لینک های وب داریم که به آن Link Graph گفته می شود. اما وقتی لینک های اسپم و بی ارزش حذف می شوند، نسخه کوچکتری از این نقشه ایجاد می شود.
به این نسخه، گراف لینک فیلتر شده یا Reduced Link Graph گفته می شود. صفحاتی که لینک هایشان خارج از این گراف هستند، عملا در رتبه بندی هیچ تأثیری ندارند.
گراف لینک فیلتر شده چیست
در بخشی از متن پتنت آمده:
موفقیت اولیه الگوریتم های مبتنی بر لینک، بر این فرض استوار بود که لینک ها نشانه اعتبار صفحات هستند. اما امروزه بسیاری از لینک ها با اهدافی غیر از انتقال اعتبار ساخته می شوند. این لینک ها باعث کاهش کیفیت تحلیل لینک ها و نتایج می شوند.
برای حفظ کیفیت نتایج، باید این لینک ها شناسایی و تأثیرشان حذف شود. با کمک یک سیستم طبقه بندی، این لینک های بی ارزش حذف می شوند. سپس تحلیل لینک ها فقط بر اساس گراف فیلتر شده انجام می شود.
اگر شما از سایت های خبری لینک دریافت می کنید، می توان فرض کرد که آن سایت ها داخل گراف فیلتر شده هستند. اما اینکه آیا در بین صفحات بذر هم هستند یا نه، لزوما مشخص نیست. و نباید وسواس زیادی روی آن داشت.
در بخش دیگری از متن آمده:
لینک هایی که در فاصله کوتاه تر محاسبه می شوند، گراف لینک فیلتر شده را می سازند.
همان طور که گفته شد، گراف اصلی لینک ها تمام سایت ها را شامل می شود. ولی گراف فیلتر شده، فقط شامل سایت هایی است که از فیلتر عبور کرده اند. بنابراین، اگر یک سایت اسپم به سایت شما لینک بدهد ولی خودش بیرون از گراف فیلتر شده باشد، تاثیری روی شما ندارد.
دقیقا همین موضوع است که باعث شده گوگل بگوید سئوی منفی وجود ندارد. چون این لینک ها حتی وارد سیستم رتبه بندی نمی شوند.
فاصله بیشتر از صفحات بذر یعنی قدرت کمتر
به جای اینکه به دنبال کشف لیست صفحات بذر باشید، بهتر است روی موضوعات مرتبط با سایتتان تمرکز کنید. ببینید لینک هایی که دریافت می کنید از چه سایت هایی هستند و چه ارتباطی با موضوع شما دارند.
در گذشته، گوگل نمره PageRank را نمایش می داد. آن زمان مشخص بود که چه سایت هایی نمره پایینی دارند. بعضی از این سایت ها با وجود نمره پایین، به سایت هایی لینک می دادند که فقط چند کلیک با صفحات بذر فاصله داشتند.
ابزار Moz DA همچنان مفید است. ولی باید توجه داشت که این ابزار فاصله از صفحات بذر را اندازه نمی گیرد. چون این اطلاعات، محرمانه و دیتای داخلی گوگل است.
بنابراین، DA ابزار خوبی است، اما بهتر است نگاه گسترده تری به لینک سازی داشته باشید.
چگونه متوجه شویم یک سایت به صفحات بذر نزدیک است
در یکی از اسناد دانشگاه استنفورد، در صفحه ۱۷ این سوال مطرح شده:
چه عواملی می توانند نشانه نزدیکی به یک سایت معتبر باشند؟
پاسخ ها شامل این موارد هستند:
تعداد زیاد اتصال ها
کیفیت لینک ها
وجود ارتباط مستقیم یا غیرمستقیم
طول و وزن اتصال
این موارد می توانند نشان دهند که یک سایت چقدر به منابع معتبر نزدیک است.
جمع بندی نهایی
امروزه خیلی ها هنوز نگران نسبت انکرتکست ها، نمره DA یا PA هستند. ولی به نظر می رسد این نگرانی ها بیشتر به گذشته برمی گردد.
در گذشته، هدف این بود که لینک از صفحاتی با PageRank بالای ۴ دریافت شود. اما امروز، ما با الگوریتم های پیچیده تری روبرو هستیم.
بنابراین، وقتی درباره لینک سازی و تاثیر آن بر رتبه بندی صحبت می کنیم، بهتر است مفهوم فاصله از صفحات معتبر یا الگوریتم Distance Ranking را نیز در نظر بگیریم. چون این مفهوم می تواند نگاه ما را به کلی تغییر دهد.