Глава отдела ранжирования \"Яндекса\" Андрей Стыскин о поисковике

Все блоги / Про интернет 18 июня 2013 0   
На Lenta.ru появился очередной гость из "Яндекса". Сейчас это был Андрей Стыскин - глава отдела ранжирования "Яндекса". Рассказал что:
в поисковом индексе только русских документов более 5 миллиардов, еще в два раза больше - на других языках. Факторов ранжирования сейчас около восьми сотен. Среди них есть посещаемость сайта, страницы, ссылки на документ, предпочтения пользователей по конкретным запросам. Поисковик накладывает на ранжирование индекс пользовательских намерений. Например, по одним запросам пользователь хочет с большей вероятностью увидеть энциклопедическую информацию, по другим — мультимедийный контент, по третьим — сделать покупку. (анализ выдачи - умирает, если не умер - Roem.ru)

Мы создаем этот список на основании анализа логов поведения пользователя. "Яндекс" получает в день около 200 миллионов запросов, по каждому из которых пользователь кликает — опять-таки в среднем — на два сайта. Не очень показательно, если на сайт просто часто переходят по данному запросу. Другое дело, как дальше пользователь взаимодействует с этим сайтом и поисковой выдачей — по этим вещам уже можно судить, нашел ли он там то, что искал. Информацию о переходах компания получает прежде всего от браузеров. (если ваш сайт хороший - продвигайте Я.Браузер. Если плохой - не продвигайте - Roem.ru)

Например: мы научились для запросов класса "смотреть онлайн" оценивать вероятность того, что пользователь действительно что-то посмотрел на данной странице. Для видеохостингов — узнавать, сколько процентов данного ролика просмотрел пользователь, прежде чем закрыть вкладку. Понятно ведь, что если ролик не стали смотреть, значит он не очень соответствовал ожиданиям. (Печально только, что у Google данных по смотрению видео чуть больше - Roem.ru)

Последние
предложения Минкульта
о изменении позиций "белых" "серых" сайтов вообще не реализуемы. У нас же машинное обучение, зеркало, отражает именно то, что хотят найти пользователи, мы вообще никогда не вмешиваемся в поиск "вручную".  (Тут "Яндекс" проигрывает Google - он давно чистит выдачу по DMCA. - Roem.ru)

В качестве обучающей выборки для "
Крипты
" использовались поисковые запросы миллиона людей из "Моего круга", где мы знаем пол и возраст человека и эти данные с большой вероятностью соответствуют действительности.

У нас есть целый отдел для борьбы с обманом поисковой машины. Возьмите хваленый алгоритм pagerank, анализирующий граф ссылок на страницах. Когда оптимизаторы поняли, как он работает, сеть стала просто забита ссылками, и сейчас pagerank не имеет практически никакого смысла.
Полностью:
Лента.ру
: Главный специалист «Яндекса» по ранжированию рассказал о персонализации и счастье пользователей.

 Источник:Roem.ru

Похожие публикации

@
  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent

Архив публикаций