«Фильм, где программист уворачивался от пуль в слоу-мо»?

Forwarded from :

👩‍💻 «Фильм, где программист уворачивался от пуль в слоу-мо»?

Для современных алгоритмов такой запрос кажется тривиальным, но так было не всегда — Поиск Яндекса прошёл долгий путь.

1998: всё построено на формуле

🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥

На старте поиск обрабатывался по написанной вручную формуле вроде знаковой BM25, которая сопоставляла слова из запроса с содержимым сайтов. Она называлась «полином» и требовала точного запроса. Для хороших результатов люди пользовались символьными командами: + (должно содержать слово), – (не должно содержать слово), «» (должна содержаться фраза в кавычках) и т. д.

2009: машины начали обучаться

🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥

Инженеры начали отходить от ручной настройки, когда появился первый в Поиске алгоритм машинного обучения — Матрикснет. Он анализировал тысячи характеристик сайтов вроде смыслового содержания, ссылок на источники, частоту кликов, глубину прочтения и т. д. Матрикснет подбирал сайты, которые с большей вероятностью подойдут и понравятся пользователю.

2016: нейросети изучают смысл

🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥

В помощь Матрикснету пришли нейросети, которые не просто видели отдельные слова и характеристики, но и понимали смысл запроса. Запросы и сайты теперь представлялись в геометрическом пространстве, где схожие по смыслу элементы находились рядом. Поиск стал искать точки, находящиеся ближе всего к смыслу запроса, и научился понимать метафоры или сравнения (но не только их).

2020: трансформеры приходят на смену

🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥

Алгоритм поиска постепенно вырос до 30 нейросетей, но потом появились трансформеры. До этого модели обрабатывали фрагменты запроса по отдельности, но новая архитектура позволила соединить все нейросети в одну — такую, которая учитывает смысл запроса целиком. Трансформерную архитектуру назвали YATI, и она, в числе прочего, помогла улучшить Быстрые ответы — краткие справки сразу под поисковой строкой.

2023: поиск создаёт готовые ответы

🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥

Появление генеративных нейросетей позволило добавить к ранжированию ссылок создание готовых ответов на любые вопросы благодаря большой языковой модели Яндекса. Со временем эти ответы становились глубже и получали новые функции. Например, создание изображений прямо под поисковой строкой или ответы от Алисы AI.

2026 и дальше: всё решают агенты

🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥🫥

В Поиск уже встроили режим диалога с Алисой AI, которой можно задать уточняющие вопросы и не только. Более того, в Яндексе сделали «агентный поиск», адаптированный специально под нужды нейросетей, так как они уже отправляют больше поисковых запросов, чем люди. Следующий этап — агентские функции Алисы AI, которые позволят сразу в Поиске выдавать готовые решения вроде бронирования столиков.

Подписывайтесь 👉 @techno_yandex