Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Постоянство становится внутренним днем сурка: как любовь превращается в быт Постоянство становится внутренним днем сурка: как любовь превращается в быт

Роман «Другие ноты» — о предательстве, горе, о недосказанности и молчании

Forbes
Эфирное создание Эфирное создание

Неужели из друга семьи телевизор окончательно превратился в средство пропаганды?

GQ
В каких активах Илон Маск «хранит» капитал, благодаря которому считается одним из богатейших людей мира В каких активах Илон Маск «хранит» капитал, благодаря которому считается одним из богатейших людей мира

Что представляет из себя состояние Илона Маска?

VC.RU
Trump Tower от друзей Путина. Кто должен был дать на высотку в Москве $500 млн и сколько мог заработать Трамп Trump Tower от друзей Путина. Кто должен был дать на высотку в Москве $500 млн и сколько мог заработать Трамп

Как выборы помешали Дональду Трампу построить в Москве самый высокий небоскреб

Forbes
«Я жила с маньяком»: исповедь женщины, которая 30 лет страдала от секс-зависимости мужа «Я жила с маньяком»: исповедь женщины, которая 30 лет страдала от секс-зависимости мужа

Излишняя страсть в отношениях может мучать обоих партнеров: личная история

Psychologies
На пути к «умному» производству На пути к «умному» производству

Лидеры российской металлургии внедряют передовые решения мирового уровня

Эксперт
Почему весь мир пересаживается на велосипеды и самокаты? Почему весь мир пересаживается на велосипеды и самокаты?

Двухколесная техника из игрушек превратилась в один из двигателей прогресса

GQ
Чао, дорогой! Чао, дорогой!

Правда ли, что в Милан летают одни богачи и шопоголики?

Лиза
«Игра престолов»: 5 важных идей, которые мы вынесли из сериала «Игра престолов»: 5 важных идей, которые мы вынесли из сериала

Опыт коллективного переживания, который мы приобрели в процессе просмотра

Psychologies
Синий свет от смартфона: почему его все боятся? Синий свет от смартфона: почему его все боятся?

Синий свет от экранов гаджетов: чем он опасен, и как избежать?

CHIP
«Очень полезное умение — в некоторых ситуациях выждать и ничего не делать». Карьерные советы главы Google Russia «Очень полезное умение — в некоторых ситуациях выждать и ничего не делать». Карьерные советы главы Google Russia

Генеральный директор Google Russia дает карьерные советы

Forbes
Автоматический молитвенник и другие странные машины Криса Экерта Автоматический молитвенник и другие странные машины Криса Экерта

Творения Криса Экерта: мрачные, страшные, заставляющие задуматься автоматы

Популярная механика
От «у меня не получится» к «как мне это сделать»: учимся мыслить проактивно От «у меня не получится» к «как мне это сделать»: учимся мыслить проактивно

Кто из нас не рисовал в голове идеальный образ будущего, далекого и не очень

Psychologies
Приключения вариатора Приключения вариатора

Движение автомобильной эволюции приводит порой к весьма неожиданным плодам

АвтоМир
Сколько камер нужно смартфону? Сколько камер нужно смартфону?

Отвечаем на вопрос, действительно ли вам нужны шесть объективов

GQ
Откровения Шагала Откровения Шагала

Марк Шагал, имя которого в советской прессе упоминалось с порицанием

Дилетант
Ольга Куриленко: «Если у меня чего-то нет, значит, мне это не надо» Ольга Куриленко: «Если у меня чего-то нет, значит, мне это не надо»

Актриса вспомнила с нами прошлое и поговорила о будущем

Cosmopolitan
Дни французского дизайна в Москве: что смотреть и покупать Дни французского дизайна в Москве: что смотреть и покупать

Кому люстру мадам Помпадур и кресло Марии-Антуанетты?

Forbes
Имущественное неравенство как следствие плохой погоды Имущественное неравенство как следствие плохой погоды

Глобальное потепление усиливает экономическое неравенство между странами

Forbes
Восточные практики: с чего начать? Восточные практики: с чего начать?

Как понять, какое направление восточных практик подходит именно вам?

Psychologies
Трубам не дадут заржаветь Трубам не дадут заржаветь

Производителям труб придется преодолеть сопротивление нефтегазовых компаний

Эксперт
Детская площадка на даче Детская площадка на даче

Создайте ребенку игровое пространство на даче

Домашний Очаг
5 экзотических стран без виз: когда ехать, чем заняться, что есть 5 экзотических стран без виз: когда ехать, чем заняться, что есть

Куда сорваться, если отпуск нагрянул внезапно? Мы собрали подборку стран

Cosmopolitan
Владимир Овчаренко: «Яхта или самолет есть у многих, а «Золотого фонда» – ни у кого» Владимир Овчаренко: «Яхта или самолет есть у многих, а «Золотого фонда» – ни у кого»

Владимир Овчаренко рассказал, почему элита опасается современного искусства

GQ
О чем молчат химеры О чем молчат химеры

В понедельник католической Страстной недели горел собор Парижской Богоматери

Караван историй
Пивоварни, вискокурни и винодельни, которые стоит посетить Пивоварни, вискокурни и винодельни, которые стоит посетить

Дегустация алкоголя может быть не только вкусной, но и красивой

GQ
Как проводятся краш-тесты для вагонов? Как проводятся краш-тесты для вагонов?

Как тестируют локомотивы и вагоны, прежде чем они выйдут на путь?

Популярная механика
Вне зоны доступа Вне зоны доступа

В Челябинской области нашли 75 фронтовых писем, которых адресаты ждут с войны

StarHit
Как выходец из Бобруйска создал один из самых известных брендов российской одежды Как выходец из Бобруйска создал один из самых известных брендов российской одежды

Отказавшись от франчайзи, торговая марка «Твое» увеличивает продажи в онлайне

Forbes
Болезнь цифрового мира: как защититься от утечек персональных данных Болезнь цифрового мира: как защититься от утечек персональных данных

Есть ли прививка от утечки персональных данных?

Forbes
Открыть в приложении