Какво е алгоритъм RankBrain?
Google използват самообучаваща се машина, наречена “RankBrain”, която да помогне с предоставянето на по-качествени резултати в търсачката. Тази публикация на Ganbox има за цел да Ви даде обща представа за RankBrain и всички по-известни Google алгортими.
Излязоха новини, че Google използват самообучаваща се машина с изкуствен интелект, наречена RankBrain, която да помогне за показването на по-качествени резултати в SERP. Чудите се как работи тази система и се вписва в цялостната ранк система на Google? Ето какво знаем до този момент.
Какво е RankBrain?
RankBrain e технология, която се използва за обработване на резултатите от търсенията на потребителите в Google. При тази обработка, търсачката се опитва да разбере какво е намерението на човека, който търси.
Какво е Machine Learning?
Machine Learning се използва за този вид системи, които сами се обучават да вършат нещо, по някакви правила, вместо човек да го прави.
RankBrain e нов начин, по който Google подрежда резултатите в търсачката си?
Не 🙂 RankBrain е част от цялостния алгоритъм, който разглежда милиарди страници, в множество сайтове и показва най-точно отговарящите на конкретната заявка за търсене - дума или фраза, въведена в търсачката Google.
Какво е Колибри?
"Колибри" е името на последния главен алгоритъм на Google. На английски названието е Hummingbird. Алгоритъмът нямаше официално име, но през 2013, го преработиха цялостно и го нарекоха Колибри.
Значи RankBrain е част от алгоритъма на Google?
Да. “Колибри” е цялостният алгоритъм, както колата си има главна част - двигателят. Самият двигател е съставен от множество части, като маслени филтри, горивна помпа, радиатор и т.н. По същия начин, “Колибри” е съставен от множество части, като RankBrain e една от най-новите.
Това стана известно от статия в Bloomberg. Те ясно казват, че RankBrain не обработва всички търсения, като главния алгоритъм Колибри.
“Колибри” съдържа и други части, известни в SEO средите, като Padna (Панда), Penguin (Пингвин) и Payday, които са създадени да се борят със спама и сайтове с ниско качество. Pigeon, занимаващ се да подобри “локалните търсения”. Top Heavy, проектиран да понижава в търсачката, сайтовете с прекалено много рекламни карета. Mobile Friendly, награждаващ страниците, които имат мобилна версия или адаптивен дизайн (responsive design) и др.
Не се ли казва PageRank главният алгоритъм на Google?
PageRank е, отново, част от “Колибри”, който се занимава с това да дава оценка на страниците, възоснова на всички линкове, които сочат от други страници към оценяваната страница. PageRank е специален, защото е първият алгоритъм, който е наименуван от Google, още при създаването на търсачката през 1998г. Реално това е алгоритъмът, който дава огромно предимство на Google пред други търсачки и я прави това, което е днес.
Какви са тези “сигнали”, които Google използват за класиране на сайтове?
“Сигнали” са тези неща, които помагат на Google да определят как да класират уеб страници. Например, думите в една страница са един вид сигнал. Ако някои думи са bold-нати (удебелени) - това е друг сигнал, който ще бъде взет под внимание. Количеството текст и неговата уникалност е друг сигнал. Изчисленията, които са част от PageRank-а, дават на една уеб страница PageRank “точки”, според връзките, които сочат към страницата, които също са “сигнал”. Всички тези неща, алгоритъмът на Google Колибри ги взима под внимание, за да може най-накрая да покаже резултата, който най-добре съответства на търсенето на потребителите.
Важно е да се отбележи, че преди близо 2 години, Google спряха да показват и опресняват PageRank публично, но се предполага, че той продължава да работи както и преди.
Колко видове “сигнали” съществуват?
Google доста често говорят за това, че имат над 200 сигнала и над 10,000 под-сигнала. Най-често, обаче, се говори за “стотици”, както е споменато и в статията на Bloomberg.
Едно визуално представяне на повечето важни сигнали на Google има в тази диаграма на Search Engine Land правена през 2015г.
Важно е да се отбележи, че вече има нови сигнали, които имат все по-голямо значение. Сигналите не са нещо статично. Важността на едни се увеличва за сметка на други. Те се тестват и променят постоянно от Google с цел подобряване на алгоритъма. Най-новите и важни сигнали ще разгледаме в SEO курса на Ganbox.
Кои са най-важните Google сигнали?
Без съмнение първият и най-важен “сигнал” са линковете, а вторият е съдържанието на страницата - полезност и уникалност. Какво по-точно е уникално съдържание и как се прави проверка за уникалност, може да прочетете в Ganbox публикацията Проверка за уникално съдържание на публикация.
Според Google, третият най-важен фактор за класирането на уеб страници е новият RankBrain.
Как работи RankBrain?
RankBrain се занимава с това да интерпретира търсенията на хората и да намира подходящи страници с думи, които хората не са въвели точно по този начин, по който е изписано в страницата на сайта.
Google отдавна може да разбира какво всъщност търсиш. Например, ако търсиш обувка - Google ще ти даде резултати за обувки.
Google също разбира и от синоними. Например ако търсиш “спортни обувки” - Google знае подобни думи и ще ти извади резултати и за маратонки.
Най-лесно се забелязва силата на RankBrain при задаване на въпроси. Ето един пример с търсене на български "Кой е режисьорът на филма мумията се завръща?". Гугъл веднага разбира, че търсим конкретна информация за филма "The Mummy Returns" и за неговия режисьор (Director). При това извежда резултатите от картинката. Това търсене преди 2012г. щеше да доведе до множество несвързани резултати за различни известни режисьори, за други филми, за мумии и може би за фараони и пирамиди 🙂 Сега обаче благодарение на Knowledge Graph, вече Google може да отговаря на въпроси свързани с факти. В бъдеще ще може да отговаря на все по-сложни въпроси.
Подробности за Граф на знанието (Knowledge Graph).
Knowledge Graph стартира през 2012 и беше момента, в който Google започна да изгражда връзка между думите. Какво означава това? Например, ако търсиш “Обама” - Google ще предположи, че най-вероятно търсиш президента на САЩ, а не нещо друго.
Всъщност, Knowledge Graph-а е база данни, съставена от факти за хора и събития, и тяхната връзка с други хора и неща от света. Точно за това можеш да търсиш, например: “Кога е родена жената на Обама?” и да получиш резултат за Мишел Обама, без да използваш името ѝ.
За Knowledge Graph от Ganbox писахме подробно през 2013г. в публикацията Google граф на знанието.
Как RankBrain помага с подобрението на резултатите от търсене?
Методите, които Google вече използват зависят от човек, който накрая да свърши работата с подобрението на резултатите. Да, има и неща, които се извършват автоматично, но в повечето случаи - хора вършат повечето работа.
Проблемът, обаче е, че Google обработват по 3 милиарда търсения на ден. През 2007, Google обявиха, че 20-25% от тези търсения са нови (не е търсено същото нещо преди). През 2013г., числото е спаднало до 15%. Въпреки това, 15% от 3 милиарда е голяма част от всички търсения, някога правени от човек (450 милиона на ден).
Част от тези търсения са сложни изречения, често наричани “long-tail" (дългоопашати).
RankBrain e предназначен да помогне с интерпретирането на тези сложни търсения и с други думи да ги “преведе” на по-разбираем за себе си език, за да може да покаже по-добри резултати, които реално потребителят търси. Всъщност, RankBrain търси “модели на търсене” между, на пръв поглед, несвързан набор от думи и пробва да разбере как те са свързани помежду си. Ако Google успее да разбере търсенето, вече може винаги да показва тези резултати и дори да групира няколко вида търсения от един вид и да ги показва на потребителите.
Ето и примери:
Макар Google да не предоставят групи от търсения, статията на Bloomberg даде един пример, където RankBrain би трябвало да помага:
“Какво е наименованието на консуматора от най-високо ниво в хранителната верига?”
За обикновения човек, "консуматор" звучи като препратка към някой, който купува нещо. Всъщност, това е, също, и научен термин за нещо, което консумира храна. Също така, има и нива на консуматорите в хранителната верига. Хищникът е най-високо в хранителната верига. Именно заради RankBrain - Google успява да разбере точно, какво потребителят търси и съответно да предостави най-точния резултат, въпреки неясният въпрос написан в търсачката.
Сега вижте колко са близки резултатите за по-точното търсене на “най-високо ниво в хранителната верига”:
Всъщност това, което прави RankBrain е да свързва по-сложното търсене с това, което е кратко, по-точно и ясно.
Google тайна е и не е сигурено дали Google задължително групира тези две търсения, но това е примера, който те са дали на Bloomberg и са използвали в статията си. Това е просто пример, който показва как може да бъде свързано едно необичайно търсене с едно често срещано търсене.
(Примерите горе са преведени на български, докато в изображенията са оригиналните търсения на английски.)
Още примери?
Google дадоха още един пример: “Колко супени лъжици има в една чаша”.
Google обясниха, че RankBrain показва различни резултати, ако направиш търсенето от Австралия - резултатът ще бъде различен от този в САЩ. Причината е, че мерните единици са различни, макар да имат същото наименование.
RankBrain помага ли в крайна сметка?
Макар примерите по-горе да са толкова неубедителни по повод важността на RankBrain - системата трябва да оказва голяма тежест, защото Google са доста консервативни, когато става дума за тяхната търсачка и най-вече ранк алгоритъма (последователността, по която нарежда резултатите си). Google понякога тестват идеи в ограничени области, но пускат масово в действие, само когато имат сигурност, че това работи. Интегрирането на RankBrain, до степен, в която е третият най-важен “сигнал” е голяма промяна.
Кога RankBrain е пуснат в действие?
Google казаха, че постепенно са го пускали в действие през 2015, а цялостно е стартирал от няколко месеца.
Най-големите размествания в резултатите от търсене на Google, по десетки хиляди ключови фрази, се случиха през януари 2016, както може да се види в сайта algoroo.com. Коя точно част на алгоритъма е "виновна" за това, за момента остава загадка.
RankBrain винаги ли се “обучава”?
Google казват, че цялото "обучение" става offline. Дават се “партиди” от реални предишни търсения, които RankBrain изучава.
След това се тества наученото от RankBrain и ако тестовете са положителни - се пуска нова версия на RankBrain.
Видео интервю от Bloomberg относно алгоритъм Rank Brain:
Как да науча повече за RankBrain?
Можете да прочетете статия от блога на Google, която се намира тук макар, тогава все още да не се казваше RankBrain.
Или по-задълбочена научна статия тук.
Браво Георги, много добре описано. На български има все още много малко информация по този въпрос.
Какво ли още ще измислят за да монополизират тотално мрежата. Благодаря за информацията.