Здесь вы узнаете:
- Понятие об алгоритме «Палех» и нейронных сетях
- Для чего нужен «Палех»?
- Положительное и отрицательное влияние алгоритма на Сеть
До 2 ноября 2016 года при ранжировании в поисковой системе «Яндекс» использовались алгоритмы, основанные на статистике пользовательской активности и совпадении ключевых слов с вопросом пользователя. Такой подход хорошо работал при введении высокочастотных запросов. Однако если пользователь вводил редкую или уникальную поисковую фразу, система не справлялась с задачей. В SERP выходили ссылки, имеющие мало общего с информацией, которую хотел получить человек. Ситуацию удалось изменить осенью прошлого года, когда в эксплуатацию был введен новый алгоритм работы с поисковыми запросами, основанный на искусственном интеллекте — палех.
Понятие об алгоритме «Палех» и нейронных сетях
Искусственные нейронные сети — сравнительно новая разработка, представляющая собой огромное количество простых процессоров, объединенных между собой. Сами по себе они способны лишь принимать сигнал и передавать его дальше. Однако сеть, созданная с использованием таких процессоров, проявляет зачатки самостоятельного мышления. Подобно мозгу человека, она способна обучаться, распознавать образы и звуки, производить математический анализ.
Алгоритм «Палех» работает на основе одной из таких сетей. Получив запрос, искусственный интеллект переводит его в трехсотмерное виртуальное пространство, где определяет семантический вектор и подбирает подходящие по смыслу заголовки страниц. На сегодняшний день «Палех» работает только с title страницы. Однако разработчики уверяют, что в будущем система станет обращаться напрямую к текстовому содержимому сайта.
Для чего нужен «Палех»?
Алгоритм предназначен для работы с уникальными и редкими запросами, статистику по которым собрать не удается. «Яндекс» утверждает, что их количество равно 40% от общей массы обращений к поисковой системе. «Палех», условно говоря, понимает смысл написанного в поисковой строке текста, а не ориентируется на ключевые слова. Например, по запросу «песня, где говорится о летчике-истребителе” система выдает ссылку на произведение В. Высоцкого «Мир вашему дому», а не на сайты, где присутствуют слова «истребитель», «летчик» и т.д.
Благодаря алгоритму «Палех», стала возможной активная борьба поисковиков с переспамленными страницами и неестественно вписанными ключевыми фразами. Сегодня в текстах все реже встречаются выражения вроде «машина с пробегом недорого купить». Наступает эпоха LSI-копирайтинга, где фразы формируются естественным для носителей языка образом.
Положительное и отрицательное влияние алгоритма на Сеть
Бесспорно, введение нового алгоритма выполнения ранжирования положительно сказывается на результатах поисковой выдачи. За время работы «Палеха» деятельность «Яндекса» претерпела следующие изменения:
- Повысилась точность выдачи по низкочастотным и уникальным запросам;
- В SERP стали выводиться более качественные ресурсы;
- Владельцы сайтов и копирайтеры начали создавать тексты, ориентированные на читателей, а не на поисковых роботов.
Разумеется, всем этим изменениям Сеть обязана не только «Палеху». Развитие интернета происходит при участии множества алгоритмов выполнения, которые работают в комплексе.
К сожалению, сегодняшние ИНС не являются эталоном совершенства и имеют свои недостатки:
- Размытость результатов поиска. В ответ на конкретный вопрос пользователя система часто выдает очень обобщенную или смежную информацию;
- Присутствие, пусть и не в ТОП-3, сторонних ссылок, не имеющих отношения к запросу;
- На первые страницы выдачи часто попадают низкокачественные сайты;
- Пользователь не может управлять результатами поиска с помощью подбора нужных словосочетаний. Система ранжирования непрозрачна.
Компания «Яндекс» ведет работу над устранением вышеописанных недостатков. Продолжается обучение нейронных сетей, совершенствуются смежные алгоритмы данных. Остается надеяться, что качество поисковой выдачи будет расти по мере развития и улучшения ИНС.