Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Эпидемия «проявленности»: как искренность превратилась в коммерческий продукт Эпидемия «проявленности»: как искренность превратилась в коммерческий продукт

Как искренность превратилась в перформанс?

Forbes
Может ли живое существо вымахать ростом с небоскреб: древние титаны Может ли живое существо вымахать ростом с небоскреб: древние титаны

Почему древние глубины Земли таят в себе множество неизвестных тайн

Популярная механика
Потребительский терроризм и конфиденциальность данных: подводные камни при управлении салоном красоты Потребительский терроризм и конфиденциальность данных: подводные камни при управлении салоном красоты

Ключевые ошибки, которые совершают бизнесмены в бьюти-сфере

Inc.
Профессиональное выгорание Профессиональное выгорание

Чем длиннее световой день, тем больше людей приходит за оттенком блонд

Glamour
Насколько вы терпеливый человек? Психологический тест для самопознания Насколько вы терпеливый человек? Психологический тест для самопознания

Выберите свечу и узнайте, насколько вы терпеливы

ТехИнсайдер
13 крупнейших взяток в новейшей истории России 13 крупнейших взяток в новейшей истории России

Какие самые крупные взятки получали министры, губернаторы, мэры и силовики

Forbes
Дамоклов меч над Россией: чего ждать от новых санкций США Дамоклов меч над Россией: чего ждать от новых санкций США

Чем грозят России новые санкции

Forbes
Наcледник «Энергии» Наcледник «Энергии»

Новейший ракетный двигатель РД-171МВ открывает нашей космонавтике будущее

Популярная механика
Русский чеддер. Какое будущее у британской сыроварни Елены Батуриной Русский чеддер. Какое будущее у британской сыроварни Елены Батуриной

Елена Батурина основала ферму и сыроварню

Forbes
Хочешь больше совпадений в Tinder? 4 хитрых лайфхака, которые помогут Хочешь больше совпадений в Tinder? 4 хитрых лайфхака, которые помогут

С этими хаками успех гарантирован! Почти.

Playboy
Клещи проснулись Клещи проснулись

Роспотребнадзор предупреждает: сезон активности клещей наступил

Лиза
Роберт Семенов Роберт Семенов

Интервью с фронтовиком и блокадником Робертом Семеновым

Собака.ru
Время возмездия Время возмездия

Двигатели внутреннего сгорания живее всех живых

Quattroruote
«Кому он нужен с тремя детьми и женой»: Оксана Самойлова о ревности к Джигану «Кому он нужен с тремя детьми и женой»: Оксана Самойлова о ревности к Джигану

Супруга рэпера Джигана откровенно рассказала о своих взаимоотношениях с мужем

Cosmopolitan
Страховщики заплатят полную стоимость сгоревшего Sukhoi Superjet 100 Страховщики заплатят полную стоимость сгоревшего Sukhoi Superjet 100

Sukhoi Superjet 100 был застрахован на полную стоимость

Forbes
Вера, которая пьет тушь Вера, которая пьет тушь

Вера Мартынов рассказала, как она выращивает новый театр и нового зрителя

СНОБ
Как и с чем носить вязаные галстуки Как и с чем носить вязаные галстуки

Самая уместная вязаная вещь в летнем гардеробе

GQ
Хаб с глобальными амбициями Хаб с глобальными амбициями

Реконструкция аэропортов России должна стать стимулом к экономическому развитию

РБК
5 ключей к публичному выступлению 5 ключей к публичному выступлению

Умение убеждать становится насущной необходимостью

Psychologies
Человек без кожи. Почему мода переживает кризис доверия Человек без кожи. Почему мода переживает кризис доверия

Потребители все больше интересуются тем, из чего сделана их одежда

Forbes
Самые дорогие бренды мира 2019 года по версии Forbes Самые дорогие бренды мира 2019 года по версии Forbes

Forbes составил ежегодный рейтинг самых дорогих брендов мира

Forbes
Волков бояться... Волков бояться...

Какие страхи по поводу работы не дают нам спокойно жить и что с этим делать

Cosmopolitan
Выйти за рамки Выйти за рамки

Бывшая участница «ВИА Гры» Миша Романова вернулась как сольная исполнительница

OK!
Эфирное создание Эфирное создание

Неужели из друга семьи телевизор окончательно превратился в средство пропаганды?

GQ
Производство талантов Производство талантов

Не надо копировать Кремниевую долину

РБК
Правила жизни Боно Правила жизни Боно

Музыкант, Дублин, Ирландия, 59 лет

Esquire
Прогулка по истории Прогулка по истории

Для умиротворенного уик-энда Сенигаллия подходит идеально

Quattroruote
Ученые: фильмы про супергероев помогают избавиться от фобий и поверить в себя Ученые: фильмы про супергероев помогают избавиться от фобий и поверить в себя

Даже плакат с Суперменом может мотивировать на маленькие, но подвиги

Maxim
Майндфулнес и практика внимательности, или как используют медитацию в компаниях Майндфулнес и практика внимательности, или как используют медитацию в компаниях

Медитация давно перестала восприниматься как нечто эзотерическое

Forbes
«Забыв телефон дома, я поняла, что у меня проблема» «Забыв телефон дома, я поняла, что у меня проблема»

Оставить дома смартфон — кошмар человека XXI века

Psychologies
Открыть в приложении