Легко найти и невозможно забыть: как нейросети изменили поиск информации в интернете

Я пользуюсь интернетом уже больше 20 лет. Современным юзерам сложно представить, что когда-то «аська» была верхом совершенства, а пользоваться ею можно было только с компьютера. Но даже в начале 2000-х, когда сайтов было не так много, найти полезную информацию было проблемой. Сейчас расскажу, как это работало в эпоху dial-up модемов и первых сотовых аппаратов с прищепкой для крепления на поясе.
Как охотились за ключами
Поиск в интернете лет 20 назад был довольно примитивным. Вся работа сервисов состояла в подборе страниц сайтов с подходящими «ключами», то есть словами и фразами из поискового запроса. Если вы искали «где купить дверь недорого», Яндекс, Yahoo или Google выдавали ссылки на страницы, где эти слова встречаются часто.
Вроде бы логично, но владельцы сайтов быстро разобрались с нехитрым алгоритмом и стали добавлять на страницы самые популярные ключи. В итоге с точки зрения человека тексты часто превращались во что-то нечитаемое, но с точки зрения поискового робота они казались идеальными. Никакой оценки качества информации на сайте не проводилось — сайт вообще мог быть посвящен, например, продаже недвижимости, но если его создатели добавили туда фраз про «купить телефон», он мог появляться в топе по этому запросу.
Конечно, если вам нужен телефон, нет смысла искать его в агентстве по недвижимости, но сайт мог получить трафик и заработать на рекламе. Поэтому пользователям приходилось «перелопачивать» множество сайтов, прежде чем они находили действительно нужную информацию.

Думать, как человек
Ситуация стала меняться к лучшему по мере развития технологий и интернета. Там появилось больше сайтов, туда пришел бизнес. Поисковики научились понимать, что потенциальным покупателям телефонов нужны соответствующие магазины, а не просто сайты с определенными ключами.
Каждый год ситуация улучшалась. Выдача становилась все более полезной, а времени на поиск нужной информации приходилось тратить все меньше. Представьте (или попробуйте вспомнить), существовали даже соревнования, в которых участникам нужно было на время найти ответ на заданный вопрос в интернете. Причем для разных категорий пользователей: юниоров (до 18 лет), взрослых, команд.
В какой-то момент и Яндекс, и Google научились отвечать на конкретные запросы непосредственно на странице выдачи в отдельном блоке. Так поисковики избавляли пользователей от необходимости переходить на сторонние сайты для получения простой информации: например, сколько метров в километре.

В 2017 году количество интернет-пользователей в России перевалило за 100 млн. У многих сформировались свои приоритеты: любимые сайты, магазины, соцсети. Стало очевидно, что даже при одном и том же запросе двум разным людям нужны совершенно разные выдачи. И чтобы это реализовать на практике, пришлось создать комплексную оценку каждого сайта, которая и влияла на его попадание в выдачу.
Для всего интернета это огромный массив данных. К этому времени у Яндекса уже работала собственная нейронная сеть (хотя тогда о нейросетях знали разве что специалисты). Именно за счет нейронок сайты стали еще лучше соответствовать запросам конкретного человека.
Большой плюс нейросетей — они могут понять запросы, которые ты даже сформулировать не можешь. Допустим, забыл ты слово «сегвей» — можешь просто описать девайс как «штука, которая сама ездит на двух колесах». И нейросеть поймет! То есть для поиска уже не нужны точные слова, он начал понимать то, что за ними стоит. Искать по смыслу «Поиск» научился еще с 2016 года, когда Яндекс стал использовать алгоритм «Палех». Следующие апдейты («Королев» в 2017 году и так далее) продолжали развивать эти технологии.
Интернет — не только Рунет
Лично для меня одним из первых заметных эффектов от нейросетей стала более простая работа с англоязычными источниками. Будем честны: не всегда нужную информацию можно найти в Рунете, то есть российском сегменте интернета. Я, наверное, рискну назвать себя техногиком, а поэтому мне всегда любопытны новые разработки и за пределами РФ. Так вот, с 2021 года Яндекс стал не просто показывать в выдаче англоязычные ресурсы, а сразу переводить текст на русский.
Кстати, это не только о текстовых материалах на сайтах. В Яндекс Браузере еще три года назад появилась функция перевода видео. С тех пор я внимательно слежу за иностранными блогерами — поскольку даже сложные технические термины в их роликах нейронка отлично переводит на русский.
Чат-боты внутри поиска
Нейросети долгое время работали «внутри» поисковиков, помогая в реализации отдельных задач. Но потом появились чат-боты, и вслед за ними рынок перевернулся. Bing, OpenAI, Google, — все IT-гиганты поняли, что будущее за объединением чат-ботов и поисковиков. Такой симбиоз позволяет давать один готовый ответ в формате диалога, используя как источник всю информацию из интернета.

Microsoft Bing в феврале 2023 года внедрил модель Openais GPT-4, предлагая интерфейс чат-бота, обработку информации в режиме реального времени и возможность отвечать на сложные вопросы на нескольких языках.
В октябре 2024 года OpenAI запустила свою поисковую систему для платных подписчиков ChatGPT, а уже в декабре сделала ее доступной для всех пользователей. SearchGPT даёт чат-боту возможность формировать ответы на основе актуальной информации из Интернета, одновременно предоставляя список использованных источников.
Google развивает свой чат-бот Gemini и интегрирует его в поисковик, превращая поиск в интерактивный ассистент. Сейчас проходят тестирования нового ИИ-поиска на основе Gemini 2.0. Также у Google есть свой нейросетевой поиск: называется AI Overviews. Проблема с ним и другими новинками в том, что они работают уже в сотне стран, но для России компании сделали их недоступными (и вряд ли что-то изменится в ближайшее время).
В 2024 году свое решение показал Яндекс – «Нейро». Сначала его предложили как опцию. То есть пользователи могли выбирать, использовать ли традиционный алгоритм поиска или новый. Пожалуй, это был тестовый период — Яндекс просто наблюдал за работой «Нейро», оценивал качество ответов, впечатления реальных пользователей. А потом взял и объединил все в привычном поиске.

Теперь это работает так: если «Поиск» считает, что «Нейро» по этому запросу может быть полезным, он выдает один готовый ответ прямо под поисковой строкой. Причем со ссылками на источники, из которых он берет данные, – здесь нет галлюцинаций или выдумок. Если пользователю нужно углубиться в тему, он может перейти в источник и почитать детали.
Здесь хочу отметить еще один важный момент: генеративные нейросети всегда обучаются на определенных массивах информации. И если нейросеть обучена на информации, например, до 2025 года, чат-бот будет просто не в курсе последних событий. К примеру, после вчерашнего футбольного матча задавать ему вопрос о победителе будет бессмысленно: в том массиве, на котором его обучали, матча вообще не было. При этом нейросеть не скажет об этом, а выдумает правдоподобный ответ о том, как прошел матч, какие лучшие моменты в нем были и с каким счетом он завершился.
Поисковики с чат-ботом лишены этого недостатка. Поиск Яндекса с Нейро в курсе событий, произошедших даже несколько часов назад, потому что он не обучается на каком-то массиве данных, а ищет все в интернете. Нейросети просто помогают сделать из тысяч ссылок один готовый ответ. Выглядит это так.
Когда мы задаем вопрос в любых формулировках Поиску с Нейро, он трансформирует его в поисковый. Затем уже традиционный «Поиск» Яндекса подбирает список максимально релевантных документов (страниц сайтов), в которых может содержаться ответ на вопрос. Из этого списка он выделяет самые подходящие источники и нужные фрагменты внутри них. Потом в дело вступает генеративная модель семейства YandexGPT: она формирует на основе этих фрагментов один ответ, который сопровождает всеми ссылками, чтобы всю информацию можно было проверить или погрузиться в тему глубже. То есть на самом деле делает работу, которой раньше приходилось заниматься.
Сейчас мне примерно в половине случаев хватает ответа «Нейро». К примеру, раньше для того, чтобы понять, в каких странах пляжный сезон открыт в феврале, мне пришлось бы задать запрос и открыть пару ссылок из топа, сравнить информацию и сделать выводы. Теперь вся основная информация собрана в одном ответе. Если интересно — можно перейти в источник и почитать про страну более подробно.

ИИ принес в поисковики диалог
Кстати, о запросах. Хорошо, когда вы знаете, что ищете. Но бывает и так: название фильма или песни крутится в голове, а вспомнить вы его не можете. Теперь это не проблема — нейросеть может сама понять, что именно вы забыли. Главное — хотя бы намекнуть. Например, я попробовал найти фильм, в котором Ди Каприо сыграл охотника, и «Нейро» точно определил, что это «Выживший».

Прелесть еще и в том, что можно уточнять свой же запрос, и не обязательно снова писать ту же информацию: сервис помнит контекст беседы. Скажем, мне стало интересно, какой режиссер снял этот фильм, и я спросил об этом как у живого собеседника.
У «Поиска» с «Нейро» отлично получается искать не только информацию, но и решения. Например, когда я спросил у «Поиска» где теплее, на Северном или Южном полюсе, он не просто выдал мне температуры, но и подвел итог.

То же самое сейчас есть и в других областях. Например, на школьные математические задачи «Поиск» не просто ищет ответ в интернете, а сам по шагам решает задачу. Когда мне потребовалось найти кардиолога для консультации, я было традиционно готовился изучать сайты клиник, но обнаружил, что вся нужная мне информация уже есть прямо на странице выдачи. Причем с фотографиями врачей, фильтрами, в которых можно настроить локацию, стоимость визита и так далее. А когда я решил проверить ставки по вкладам — они сейчас крайне выгодные, как вы знаете, — оказалось, что прямо в отдельном блоке собраны предложения от банков с подробными условиями. И тоже можно установить важные опции в фильтрах: например, ежемесячную выплату процентов.
Найти то, не знаю что
Знаете, что еще круто в современном «Поиске»? Он реально помогает найти ответы на вопросы, которые ты даже не можешь толком сформулировать словами. Вот, например, купил я как-то по случаю в магазине комнатное растение. Ну просто понравилось. Никогда с ним не было проблем, но тут вдруг листья стали желтеть, и я подумал — может, я что-то делаю не так? Например, поливаю слишком редко или часто?
Все было бы просто, если бы я помнил название растения. Но все, что я могу, — сфоткать его и показать. Но этого достаточно моей маме и «Поиску» с «Нейро». Загружаю фотку в «Поиск» и спрашиваю, как часто поливать «такое растение». Нейросеть сама распознает, что на этом снимке, и подбирает нужную информацию. Оказывается, график полива зависит от сезона! Кстати, называется Цикас революта — немудрено забыть.

Поиском по картинкам я пользуюсь уже давно — например, в моем смартфоне на Android есть функция Google Lens (или «Гугл Объектив»). Сегодня разработчики улучшают возможности такого визуального поиска и используют так называемые VLM — визуально-языковые модели. Они позволяют одновременно работать и с текстом, и с картинками. Например, если на фотографии с цветком будет кот, а я задам вопрос «как его поливать», благодаря VLM Поиск с Нейро поймет, что надо ответить именно про цветок. Это возможно благодаря тому, что VLM понимают детали, которые находятся на изображении или видео. Поливать кота явно странно — значит, речь идет о цветке.
В России Яндекс остается одним из самых популярных поисковиков, и только там доступны новые нейросетевые фишки, которые есть у конкурентов. По статистике, за 2024 год на него приходятся более 66% запросов — вдвое больше, чем у Google. Кроме того, согласно данным Cloudflare, Яндекс — второй крупнейший поисковик в мире. Регулярные обновления и совершенствование поисковых технологий явно приносят свои плоды. Будем следить за тем, как гонка нейросетей в поисковых системах будет развиваться дальше и как это повлияет на наш поиск и восприятие информации.