Тренды > Поисковые системы
Кривое зеркало Google
Порой поиск Google выдает такие варианты, которые просто сбивают с толку. Такие поисковые аномалии — это результат работы искусственного интеллекта с признаками аутизма, которому еще долго будет требоваться человеческая помощь.
Ангела Меркель — рептилоид, а Ксения Собчак — беременна. Именно так считает Google. Когда в поисковой системе вбивается запрос, алгоритм предлагает варианты поиска уже по первым буквам. Если какой-то из них подходит, можно не утруждать себя набором на клавиатуре и быстрее найти желаемое. Но слишком уж часто функция автозаполнения Google предлагает варианты, представляющие смесь из смешного и странного — или откровенно идиотского.
Особенно «здорово» работают открытые поисковые запросы. К вопросу «Почему Собчак...» в нашем тесте поисковая система добавила «… лошадь». Не менее оригинально звучат результаты ввода «Собчак — это…». В этом случае Google выдает: «собчак это бренд». «Автозаполнение осуществляется с помощью алгоритма», — сказал в беседе с CHIP Каспар Шиманский, бывший сотрудник компании Google, который сейчас занимает должность специалиста по оптимизации поисковых систем в собственной консалтинговой компании SearchBrothers. «Таким методом распознаются наиболее частые запросы пользователей, которые автоматически становятся потенциально полезными для других пользователей Google и предлагаются в вариантах поиска». Иными словами, если вместе с именем Ангелы Меркель пользователи часто задают вопрос о нарушении конституции, то такой вариант попадет в список автозаполнения. Как и поиск, такая автоматическая подстановка вариантов основывается на первоначальном алгоритме, еще двадцать лет назад представленном основателями Google Сергеем Брином и Ларри Пейджем в их докладе в Стэнфордском университете. Алгоритм состоит из четырех компонентов, которые с тех пор едва ли претерпели принципиальные изменения. Проще говоря, алгоритм постоянно сканирует Сеть, индексирует найденные страницы, сортирует их и выдает эту сортировку в результатах поиска. С тех пор как Брин и Пейдж опубликовали свой доклад в ноябре 1997 года, первоначальный вариант «parsing/indexing/sorting/serving» (синтаксический анализ/индексация/сортировка/выдача результата) был дополнен примерно 200 алгоритмами и факторами. С помощью всех этих регулировочных элементов поиск должен постоянно совершенствоваться. По словам Шиманского, программа меняется ежедневно, но эти изменения едва ли замечаются пользователями. «Сама технология, то есть тонкости семантического поиска или бесчисленные алгоритмы, обеспечивающие безупречность поиска Google, значительно изменились с 1997 года».
Соответствовать ожиданиям пользователя, даже если они бессмысленны
Безупречность поиска Google поставлена под вопрос — по крайней мере, после полемики на тему фейковых новостей. Кто будет доверять алгоритму, который придает такое большое значение заговору рептилоидов, что включает его в поисковые подсказки? «Эта тема как раз активно обсуждается в Европе, — поясняет специалист по оптимизации поисковых систем Шиманский, — но, к сожалению, зачастую скорее эмоционально, чем рационально». Звучит довольно резко, поскольку распространение фальшивых новостей представляет собой серьезную проблему. Впрочем, с технической точки зрения отдельные сайты для Google неважны. «Главную роль играет лишь удовлетворенность пользователя результатом. В этом и состоит основная мотивация Google — ведь именно от этого зависит успешность всей компании. Google просто не может себе позволить быть нейтральным».
Google не может быть нейтральным — клиент правит бал. Если конкретно, то если бы пользователи Google не спрашивали, действительно ли Ангела Меркель представляет собой гибрид человека и рептилии, жив ли Владимир Путин и т. п., поиск Google не предлагал бы такие варианты в автозаполнении.
То, что на момент поиска в качестве возможных соответствий предлагаются явно неверные утверждения, в корне противоречит самой миссии Google. Поисковой системе совершенно не нужно распространение фейков и спама, так как это снижает качество поиска. Поэтому целая армада сотрудников компании по всему миру занимается вылавливанием такого цифрового мусора из реестра Google. Шиманский тоже был одним из таких сотрудников калифорнийской компании и вместе с другим основателем компании SearchBrothers Фили Визе более семи лет работал в команде, занимающейся качеством поиска. По словам Шиманского, вкратце задачу этой рабочей группы можно обозначить как идентификацию сетевого спама и защиту от него пользователей Google.