سیستم های موضوعی (تاپیکال) گوگل چگونه کار می کنند؟

mhSarmad
7 دقیقه

در یکی از اپیزودهای پادکست Search Off The Record، مهندسان گوگل به موضوعی اشاره کردند که توجه بسیاری از کارشناسان سئو را جلب کرد. آن ها از وجود سیستم هایی با نام “Core Topicality Systems” صحبت کردند. همین موضوع باعث شد تا بحث درباره جایگاه موضوعات در الگوریتم های رتبه بندی دوباره داغ شود.

اگرچه جزئیات زیادی از این سیستم ها منتشر نشده، اما می توان با بررسی برخی منابع و اسناد، دید کلی و مناسبی درباره آن ها به دست آورد. گوگل در مستندات مربوط به جستجوی ابری خود، تعریفی از “تناسب موضوعی” ارائه داده است که هرچند مربوط به موتور جستجوی عمومی نیست، اما درک روشنی از نگاه گوگل به موضوعات ارائه می دهد.

در این سند آمده:

تناسب موضوعی به معنای میزان ارتباط یک نتیجه جستجو با عبارت اولیه کاربر است.

این تعریف ساده و واضح، دقیقا توضیح می دهد که ارتباط میان صفحات وب و کوئری های جستجو چه معنایی دارد.

چطور می توان به تناسب موضوعی رسید

برای فهم بهتر سیستم های موضوعی گوگل، باید ابتدا بدانیم موتورهای جستجو چگونه موضوعات را درک می کنند. در واقع، درک یک پرسش به معنای درک موضوعی است که کاربر به دنبال آن است.

درک درست از پرسش ها و موضوعات

کاربران گاهی عباراتی جستجو می کنند که مبهم هستند اما در ذهنشان یک مفهوم دقیق وجود دارد. برای مثال، یک فرد ممکن است بنویسد “بالاترین سطح مصرف کننده در زنجیره غذایی”، در حالی که منظورش “شکارچی رأس هرم” است.

گوگل برای حل چنین مواردی، الگوریتم RankBrain را معرفی کرد. این سیستم کمک می کند گوگل مفاهیم درون پرسش ها را بفهمد. واژه “مفهوم” گسترده تر از “موضوع” است و کمک می کند تا نتایج دقیق تری نمایش داده شوند.

خود گوگل در مورد RankBrain گفته:

RankBrain به ما کمک می کند اطلاعاتی را پیدا کنیم که قبلا نمی توانستیم، چون حالا بهتر می فهمیم که کلمات جستجو شده به چه مفاهیمی در دنیای واقعی مرتبط هستند. مثلا اگر کسی جستجو کند “عنوان مصرف کننده در بالاترین سطح زنجیره غذایی چیست”، RankBrain با دیدن این واژه ها در صفحات مختلف یاد می گیرد که این سوال درباره حیوانات است، نه انسان ها. بنابراین متوجه می شود که پاسخ این سوال “شکارچی رأس زنجیره” است.

الگوریتم BERT و نقش آن در تحلیل موضوعی

الگوریتم BERT، که یک مدل یادگیری عمیق است، به گوگل کمک می کند تا زمینه و مفهوم واژه ها درون یک جمله را بهتر درک کند. این درک عمیق باعث می شود گوگل موضوع اصلی پرسش را به شکل دقیق تری شناسایی کند.

روش های آماری قدیمی برای مدل سازی موضوعات

در گذشته، موتورهای جستجو از مدل های آماری برای درک موضوع صفحات استفاده می کردند. یکی از این مدل ها، Topic Modeling بود. الگوریتم LDA یا Latent Dirichlet Allocation در میانه دهه ۲۰۰۰ نقش مهمی در درک موضوع صفحات داشت.

در سال ۲۰۱۵، الگوریتم جدیدتری به نام Neural Variational Document Model معرفی شد که قدرت بسیار بیشتری برای نمایش موضوعات پنهان در یک سند داشت.

امروز البته موتورهای جستجو از مدل های پیشرفته تر و مبتنی بر یادگیری عمیق استفاده می کنند.

مقاله جدید درباره بهبود رتبه بندی با مدل های زبانی

در یکی از جدیدترین مقالات علمی، پژوهشی با عنوان “فراتر از بله و نه” منتشر شده است. هدف این مقاله، بهبود رتبه بندی صفحات با استفاده از مدل های زبانی بزرگ است. این مقاله تلاش می کند سیستم رتبه بندی را از حالت بله یا نه (مرتبط یا نامرتبط) خارج کرده و سطح بندی دقیق تری به آن بدهد.

در بخشی از مقاله آمده:

ما پیشنهاد می کنیم برچسب های دقیق تر برای سنجش میزان ارتباط به مدل های رتبه بندی LLM داده شود. این برچسب ها کمک می کنند تا مدل بتواند تفاوت میان اسناد مختلف را بهتر تشخیص دهد. در نتیجه، رتبه بندی دقیق تر و منطقی تری انجام می شود.

چرا نباید نگاه ساده انگارانه به سئو داشت؟

امروزه موتورهای جستجو فقط ابزار بازیابی اطلاعات نیستند. آن ها تلاش می کنند مستقیما به سوالات کاربران پاسخ دهند. این تغییر چند سالی است که آغاز شده و اخیرا شدت گرفته است.

در یکی از مقالات مهم با عنوان “بازنگری در جستجو: تبدیل کاربران معمولی به متخصص حوزه” که در سال ۲۰۰۱ منتشر شد، چنین آینده ای پیش بینی شده بود. در ابتدای این مقاله آمده:

«وقتی کاربران نیاز به اطلاعات دارند، ترجیح می دهند با یک متخصص حوزه صحبت کنند. اما در عمل به موتورهای جستجو روی می آورند. سیستم های بازیابی کلاسیک، به جای پاسخ مستقیم، صرفا منابعی را معرفی می کنند. سیستم های پاسخ دهی موفق، مجموعه محدودی از پاسخ ها را که توسط انسان تهیه شده ارائه می دهند که نه سریع است و نه قابل توسعه. در مقابل، مدل های زبانی آموزش دیده، می توانند متنی تولید کنند که شاید پاسخگوی نیاز کاربر باشد. ولی این مدل ها هنوز متخصص واقعی نیستند و درک عمیقی از دنیا ندارند.

نکته مهم این است که اگر سئوکارها فقط روی کلمات کلیدی، تگ عنوان یا تیتر تمرکز کنند، راه را اشتباه رفته اند. فناوری های زیرساختی جستجو به سمتی می روند که دنیا را بفهمند. اگر بخواهیم درباره سیستم های موضوعی گوگل صحبت کنیم، باید این موضوع را در چارچوب تحول کلی موتورهای جستجو ببینیم.

سئوکارها باید چگونه فکر کنند

گوگل برای درک موضوعات صفحات از روش های پیچیده ای استفاده می کند. برخی از این روش ها را در گذشته دیده ایم و برخی دیگر تازه معرفی شده اند. اما در هر صورت، گوگل به دنبال درک عمیق تر و دقیق تر از محتواست.

اگر کسی می خواهد در فضای امروز جستجو دیده شود، باید بفهمد گوگل چطور فکر می کند. برای موفقیت در سئو، تنها دانستن اینکه چه چیزی “ظاهر می شود” کافی نیست. باید بدانید چرا و چگونه آن محتوا ظاهر می شود.

انتشار در شبکه‌های اجتماعی
بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *