MatrixNet. Epic Fail №1 — асессоры.
Асессоры появились в Яндекесе давно. Идея была заимствована у Гугля (наверняка многие из вас слышали, что выдачу в Гугле ранжируют толпы индусов 🙂 ) и сама по себе она была не плохой — с помощью асессора очень удобно отлавливать дорвеи, холвеи, клоаки и прочий SEO-спам, а так же обучать алгоритмы вычислять общие признаки сайтов, не достойных находиться в SERP’е.
Но яндексоиды пошли дальше — они стали с помощью асессоров обучать алгоритмы ранжировать хорошие сайты. Это был Epic Fail №1, сейчас объясню почему.
Широкой публике в деталях работа асессора стала известна с публикацией условий конкурса Интернет-математика 2009. Асессор даёт оценку паре запрос — документ по пятибальной шкале. Кстати, обратите внимание на тотальную невнимательность яндексоидов, что в принципе свойственно талантливым людям: в условиях конкурса оценки от асессоров лежат в диапазоне от 0 до 4, но средняя оценка выдачи победителей — выше 4-х. Чего принципиально быть не может, если только реальная оценка асессоров не лежит в диапазоне от 1 до 5 😉 За год это несоответствие так никто и не заметил.
Итак, у асессора есть 5 оценок. 1 и 2 — это для спама и нерелевантных результатов. 3-ка — это нейтральная оценка — типа слова из запроса в документе присутствуют, но вобще документ не об этом (см. скриншот предудущей заметки — красным обведены именно документы — троечники) 5-ка — суперрелевантный результат, витальный. Чтобы было понятно — по запросу Спорт-Экспресс витальным будет сайт одноимённой газеты. Для всех остальных сайтов — четвёрки.
Вы ещё подвоха не заметили? А зря. Что происходит в результате такой дискретной оценки? Любой коммерческий запрос, не связанный с брендом, не имеет витальных сайтов. Со спамом Яндекс борется хорошо. В итоге, алгоритм обучается ранжировать сайты по коммерческим запросам на одних четвёрках.
Вы скаже ну и чё? (Видимо примерно такие же мысли бродят в голове абстрактного яндексоида). А вот чё.
Во-первых, между двумя соседними целыми числами умещается бесконечное множество чисел рациональных. В переводе на русский это означает, что по любому коммерчески привлекательному запросу найдётся бесконечное множество (если не ограничивать вебмастеров во времени — точно бесконечное 🙂 ) сайтов, оцененных одинаково, но на самом деле достаточно сильно отличающихся своей ценностью для пользователя поисковой системы. То есть, выдача, состоящая из документов соответствующих запросу почти на 5 и выдача, состоящая из документов, соответствующих запросу почти на3 с точки зрения оценивающего качество выдачи алгоритма будут одинаково идеальны, хотя одна из них будет казатся пользователям тихим ужасом.
Именно поэтому Яндекс считает свою выдачу хорошей — ну там же одни четвёрки, не хуже чем в Гугле. Причём ситуация не изменится ровным счётом никак, даже если в реальной жизни Яндекс использует, допустим, десятибальную шкалу оценок.
Потому что, во-вторых, асессор не даёт оценку бизнесу, стоящему за сайтом. Поэтому, что сателлит, не являющийся таковым только по формальным критериям, что лидер в нише, что просто старый заброшенный сайт или сайт-для-бизнеса-на-коленке для асессора, а вместе с ним и для яндекса выглядят одинаково релевантными запросу. Это естественно, потому что асессоры не являются экспертами в оцениваемой ими области.
И чем это нам грозит, спросите вы, ведь даже если сателлиты и заброшенные сайты попадут в топ случайно, то алгоритм дообучится и всё исправит? Беда заключается в том, что асессор-то даст таким сайтам хорошие оценки. А это значит, что алгоритм скорее всего дообучится ещё лучше находить подобные сателлиты и заброшенные сайты, вместо сайтов богатых компаний, вкладывающих деньги в рекламу вообще и в SEO в частности. Что мы и можем наблюдать в выдаче.
Хотите примеров? Их есть у меня. Москва. Запрос мебель для ванной. Первое место сайт http://www.mebel-vanna.ru/:
30-секундный анализ сайта потенциальным покупателем:
1. Логотипа нет
2. Адреса нет
3. Телефон в картинке
Вывод: в лучшем случае это бизнес-на-коленке, в худшем — сателлит, т.к. нормальный сайт телефон в картинку не прячет, нормальный бизнес не боится указать своё физическое месторасположение, а фирма, которая давно существует на рынке обязательно обзаводится логотипом. У каждого из пунктов могут быть исключения, но все вместе они наводят на мысль, что сайт, а точнее бизнес за сайтом — плохонький. А с точки зрения яндекса — он хорошист, а потому всё в порядке.
Я могу привести и ещё примеры. Но, тут случилось забавное совпадение — именно сегодня директор некой инфокомуники лизнул яндекс в попу по самые гланды, озаглавив свой опус так: Яндекс планомерно улучшает контент Рунета. Я не знаю, что это за дядя и что это за компания — видимо несколько отбился от современной SEO-тусовки. Но в статье приводятся цитаты представителей других SEO-компаний из старичков, которые дружно и радостно уверяют нас, как всё в яндексе хорошо, ажно гламурно. Поэтому у меня к вам большая просьба: покажите этим странным дядям и тётям из seo-компаний, а так же яндексоидам (пара-тройка из них точно это сообщение прочитает, а если повезёт, то ссылку скинут и начальству 😉 ), какой трэш иногда присутствует в яндексе на топовых позициях. Лучше — со скриншотами, чтобы было меньше шансов отвертеться 😀 Спасибо!
продожение следует