В Московском планетарии вечером 22 августа 2017 года состоялся пресс-релиз новой системы сортировки веб-страниц. По заверениям представителей Яндекс, его основной принцип – выдача сайтов в соответствии со смыслом запроса, а не словесным содержанием.

Напомним, что Яндекс давно занимается созданием нового типа ранжирования. Годом ранее была создана система «Палех». Она еще не могла отвечать за аналитику смысловой составляющей тела статьи, однако уже осуществляла ее по отношению к заголовкам сайтов. «Королев» значительно превзошел систему-предшественницу по поисковым качествам.

Преимущества системы «Королев»

«Палех» мог сопоставлять смысл только заголовка и поискового запроса. «Королев» шагнул далеко вперед: клиновидная система аналитики позволяет проверить содержание всей статьи или иного информационного наполнения.




Развитие получила не только сама система отсеивания, но и вычислительные способности поисковика. При «Палехе» они равнялись не более чем 150 документам при обработке запроса. Благодаря инновации в системе ранжирования и предварительному сохранению характеристик содержания страницы максимальное количество документов возросло в несколько раз. На данный момент оно составляет 200 000 страниц – число, невообразимое еще для 2016 года.

Поменялась архитектура слоев. Если в предшественнике она была трехслойной, со скрытыми частями, то теперь представляет собой клиновидную структуру. Основное влияние на вычислительные объемы поисковика оказывает количество нейронов первых слоев. Сумев повысить содержание первых двух составляющих архитектуры до 500 у каждой, Яндекс добился значительного улучшения размера модели. При этом объем последнего слоя в 40 нейронов никак не сказался на работе системы: основной упор идет не на него.




Ранжирование на этапе индексирования

Производить аналитику в режиме реального времени – затратно для компании и долго для ее пользователей. Поэтому Яндекс, ориентируясь прежде всего на собственных посетителей, перенес аналитический этап на период индексирования.

Теперь смысловые характеристики будут выясняться и сохраняться за веб-страницами сразу после их создания, а не при каждом новом поиске.




Удобство для пользователей

«Королев» решит давнюю проблему поисковика: несоответствие смысла поискового запроса результатам выдачи. Теперь тело статьи будет полностью анализироваться ради определения основных тем.

Искусственный интеллект поисковика планирует производить наиболее точную выдачу не только на основе аналитики при индексировании, но и используя данные живых пользователей. Учитываться будут модели их переходов на определенные сайты – куда люди склонны перейти после ввода того или иного запроса. Рассматриваться должны и оценки пользователей на сервисе «Яндекс.Толока».