Shkondin.ru

MatrixNet. Epic Fail №1 — асессоры.

Click to rate this post!
[Total: 0 Average: 0]

Асессоры появились в Яндекесе давно.  Идея была заимствована у Гугля (наверняка многие из вас слышали, что выдачу в Гугле ранжируют толпы индусов 🙂 ) и сама по себе она была не плохой — с помощью асессора очень удобно отлавливать дорвеи, холвеи, клоаки и прочий SEO-спам, а так же обучать алгоритмы вычислять общие признаки сайтов, не достойных находиться в SERP’е.

Но яндексоиды пошли дальше  — они стали с помощью асессоров  обучать алгоритмы ранжировать хорошие сайты.  Это был Epic Fail №1, сейчас объясню почему.

Широкой публике в деталях  работа асессора стала известна с публикацией условий конкурса Интернет-математика 2009.  Асессор даёт оценку паре запрос — документ по пятибальной шкале. Кстати, обратите внимание на тотальную невнимательность яндексоидов, что в принципе свойственно талантливым людям: в условиях конкурса оценки от асессоров лежат в диапазоне от 0 до 4,  но средняя оценка выдачи победителей — выше 4-х.  Чего принципиально быть не может, если только реальная оценка асессоров не лежит в диапазоне от 1 до 5 😉 За год это несоответствие так никто и не заметил.

Итак, у асессора есть 5 оценок.  1 и 2 — это для спама и нерелевантных результатов.  3-ка — это нейтральная оценка — типа слова из запроса в документе присутствуют, но вобще документ не об этом (см.  скриншот предудущей заметки — красным обведены именно документы — троечники)  5-ка  — суперрелевантный результат, витальный. Чтобы было понятно — по запросу Спорт-Экспресс витальным будет сайт одноимённой газеты.  Для всех остальных сайтов — четвёрки.

Вы ещё подвоха не заметили?  А зря. Что происходит в результате такой дискретной оценки? Любой коммерческий запрос, не связанный с брендом, не имеет  витальных сайтов. Со спамом  Яндекс борется хорошо. В итоге,  алгоритм обучается  ранжировать сайты по коммерческим запросам на одних четвёрках.

Вы скаже ну и чё? (Видимо примерно такие же мысли бродят в голове абстрактного яндексоида). А вот чё.

Во-первых, между двумя соседними целыми числами умещается бесконечное множество чисел рациональных.  В переводе на русский это означает, что по любому коммерчески привлекательному запросу найдётся бесконечное множество (если не ограничивать вебмастеров во времени — точно бесконечное 🙂 ) сайтов, оцененных одинаково, но на самом деле достаточно сильно отличающихся  своей ценностью для пользователя поисковой системы.    То есть, выдача, состоящая из документов  соответствующих запросу почти на 5 и выдача, состоящая из документов, соответствующих запросу почти на3 с точки зрения оценивающего качество выдачи алгоритма будут  одинаково идеальны,  хотя одна из них будет казатся пользователям   тихим ужасом.

Именно поэтому Яндекс считает свою выдачу хорошей — ну там же одни четвёрки, не хуже чем в Гугле. Причём ситуация не изменится ровным счётом никак, даже если в реальной жизни Яндекс использует, допустим, десятибальную шкалу оценок.

Потому что,  во-вторых, асессор не даёт оценку бизнесу, стоящему за сайтом. Поэтому,  что сателлит,  не являющийся таковым только по формальным критериям, что лидер в нише, что просто старый заброшенный сайт или сайт-для-бизнеса-на-коленке для асессора, а вместе с ним и для яндекса выглядят одинаково релевантными  запросу. Это естественно, потому что асессоры не являются экспертами в оцениваемой ими области.

И чем это нам грозит, спросите вы, ведь даже если  сателлиты и заброшенные сайты попадут в топ случайно, то алгоритм  дообучится и всё исправит?  Беда заключается в том, что асессор-то даст таким сайтам хорошие оценки.  А это значит, что   алгоритм скорее всего дообучится ещё лучше находить подобные  сателлиты и заброшенные сайты, вместо сайтов богатых компаний, вкладывающих деньги в рекламу вообще и в SEO в частности.  Что мы и можем наблюдать в выдаче.

Хотите примеров? Их есть у меня.  Москва.   Запрос мебель для ванной. Первое место сайт http://www.mebel-vanna.ru/:

30-секундный анализ сайта потенциальным покупателем:
1. Логотипа нет
2. Адреса нет
3. Телефон в картинке

Вывод: в лучшем случае это бизнес-на-коленке, в худшем — сателлит, т.к. нормальный сайт телефон в картинку не прячет, нормальный бизнес не боится указать своё физическое месторасположение, а фирма, которая давно существует на рынке обязательно обзаводится логотипом. У каждого из пунктов могут быть исключения, но все вместе они наводят на мысль, что сайт, а точнее бизнес за сайтом — плохонький. А с точки зрения яндекса — он хорошист,  а потому всё в порядке.

Я могу привести и ещё примеры. Но, тут случилось забавное совпадение — именно сегодня директор некой инфокомуники лизнул яндекс в попу по самые гланды, озаглавив свой опус так:  Яндекс планомерно улучшает контент Рунета. Я не знаю, что это за дядя и что это за компания — видимо несколько отбился от современной SEO-тусовки. Но в статье приводятся цитаты представителей других SEO-компаний из старичков,  которые дружно и радостно уверяют нас, как всё в яндексе хорошо, ажно гламурно.  Поэтому у меня к вам большая просьба:  покажите этим странным дядям и тётям из seo-компаний, а так же яндексоидам (пара-тройка из них точно это сообщение прочитает, а если повезёт, то ссылку скинут и начальству 😉 ),  какой трэш  иногда присутствует в яндексе на топовых позициях.  Лучше — со скриншотами, чтобы было меньше шансов отвертеться  😀  Спасибо!

продожение следует