Почему вредно знать о BM25?
Директор? Да пошёл ты в жопу, директор!
Не до тебя сейчас (© Масяня)
Не очень понимаю людей, придерживающихся стратегии контент-маркетинга в стиле поручика Ржевского: «Я — Д’Артаньян, а вы все — …мушкетёры».
В двух словах, некий директор SEO-компании взялся утверждать, что рынок SEO, которое не наука и не искусство, а всего лишь ремесло, умер. Потому что никто не готовит подмастерий. Кроме, видимо, самого директора.
Что само по себе странно, т.к. если кто-то берёт сайты на продвижение и достигает обещанных хотя бы на словах результатов, значит на рынке существует достаточное количество обученных ремесленников. Не являющихся Д’Артаньянами, но туго знающих своё ремесло. А значит рынок жив.
Так может быть дело не в рынке, а в директоре? Давай попробуем разобраться почему это так.
Один из вопросов, который задаёт директор соискателю:
Вы знаете, что такое ГЕОзависимые и ГЕОнезависимые запросы?
Да, знаю. Это анахронизм периода начала второй половины первого десятилетия 21 века. Когда в интерфейсе Яндексе существовала галочка «сайты из региона», не применялись переформулировки запросов в нынешних объёмах и не использовалась технология Спектр.
Сегодня, слава птицам, каждый запрос может быть и геозависимым и геонезависимым одновременно. Это когда поисковик знает по поведению пользователей, что для кого-то данный запрос является информационным. То есть кого-то интересует ответ на вопрос что это такое. И лучшим ответом будет энциклопедия. В этом случае запрос трактуется и модифицируется поисковиком как геонезависимый.
А для других пользователей этот запрос является транзакционным. То есть они уже знают что это такое, но хотят узнать где и по какой цене эту штуковину приобрести. Жителя Петербурга мало интересуют предложения из Москвы. И тот же самый запрос трактуется и модифицируется как геозависимый. С добавлением к исходному запросу топонима, а так же слов цена и купить. Пример? Пусть будет запрос гидромодуль.
То есть для оптимизатора важно знать как исходный запрос пользователя был изменён поисковиком. А если применяется СПЕКТР, то любой изначально геозависимый запрос превращается поисковиком в геонезависимый лёгким движением руки добавлением к исходному запросу довеска своими руками или фото. Или другим модифицирующим довеском, например что такое.
И это всё в рамках одного исходного запроса. Таким образом, [bctt tweet=»геозависимостью обладает не запрос, а ответ на него» via=»no»]
Оптимизатор может сам принять решение, как продвигать сайт по запросу: как по информационному или как по транзакционному. И выберет для оптимизации разные документы с сайта. Или создаст новые. И если продвижение не ограничивается одним Default-city, а подразумевает продвижение сразу по нескольким регионам, то лучше выбрать информационный вариант. Чем париться с перечислением всех регионов на странице.
А что хотел узнать у соискателя господин директор? Работал ли соискатель на рынке в дветысяче-лохматом году?
Перейдём к другому вопросу директора:
Вы знаете, что такое BM25?
Да-да-да. Это семейство ранжирующих функций, которые сильно влияли на позиции сайтов в вебпоиске. До изобретения PageRank. Ещё знаю, что среди пресловутых 800 факторов ранжирования Яндекса данное сочетание букв применяется чаще других. Однако знания о BM25 скорее вредны для оптимизатора. И вот почему.
- И в этом случае гораздо важнее знать переформулировки исходного запроса. Тот самый гидромодуль для хорошего ранжирования требует присутствия в документе, к примеру, слова чиллер. Можно ли извлечь данный факт из знания о BM25? Нет.
- Попытка оптимизировать документ под BM25, то есть подобрать «оптимальную» плотность ключевых слов в разных частях документа, вероятнее всего ухудшит метрики качества текста (читабельность, естественность, применение общеупотребимых и редких слов, синонимов и т.д. ) Влияние этих метрик на ранжирование ничуть не меньше, чем BM25. Это основы борьбы с дорвейным автогенерённым контентом.
- Вообще любые попытки угодить поисковику больше, чем посетителю, вероятнее всего скажутся на ранжировании негативно. Всё дело в поведенческих факторах ранжирования. То есть оптимизатору гораздо важнее знать как побудить посетителя к взаимодействию с сайтом, чем о BM25.
Спрашивал ли директор о признаках качественного и не очень качественного текста, о том как влиять на кликабельность сниппетов и нужно ли это делать, как побуждать посетителя взаимодействовать с сайтом? Нет.
Выводы:
Сегодня гораздо проще взять толкового копирайтера, чем искать реликтового seoшника, знающего о TF/IDF и BM25. Где найти такого копирайтера — отдельный вопрос. Но переучивать и его будет не легко. И обучить этого копирайтера азам оптимизации. Вместо того, чтобы обучать сеошника копирайтерскому ремеслу (не путать с продажей знаков за рубли). Готовый оптимизированный текст, вышедший из под пера такого копирайтера, должен содержать все ключевые слова из переформулировки поисковой системы. Каковые можно и нужно определять автоматически, без человеческого участия.
Количество же повторений конкретного слова в тексте должно определяется исключительно коммерческой целесообразностью. А не мифической формулой, коэффициенты которой либо неизвестны вовсе, либо определяются с точностью плюс-минус лапоть. Текст должен побуждать посетителя купить, а не поблевать на экран.
Дополнительно такой текст хорошо прогнать через сервис Главред (или его аналоги). Чтобы окончательно избавиться от воды, свойственной многим копирайтерам. Особенно пишущим тексты по ТЗ от seoшников. И заодно сделать этот текст 100% уникальным. В среднем по больнице такой текст проблем с ранжированием иметь не будет.
Если дизайнер, верстальщик и админ не запороли ПФ на корню.
Вышеизложенные соображения, на мой взгляд, очевидны для каждого практикующего сеошника. Директора же, застопорившегося в своём профессиональном развитии, как впрочем и положено начальнику, сосредоточенному на управлении, от собеседований по существу профессии лучше отстранить. Или я не прав?