Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Умри, моя любовь»: хоррор с Дженнифер Лоуренс о сложном опыте материнства «Умри, моя любовь»: хоррор с Дженнифер Лоуренс о сложном опыте материнства

Как Линн Рэмси превращает сюжет, знакомый многим семьям, в мрачный хоррор

Forbes
Надежда Кадышева: «В халате и тапочках меня даже супруг ни разу не видел!» Надежда Кадышева: «В халате и тапочках меня даже супруг ни разу не видел!»

Певица о том, как всю жизнь провести с одним мужчиной и не потерять интерес

StarHit
Как понять, хорошо ли работает ваш директор по развитию Как понять, хорошо ли работает ваш директор по развитию

Какие KPI нужно измерять у директора по развитию, чтобы бизнес развивался

Inc.
Майское варенье Майское варенье

На варенье годится почти все, что растет и цветет в мае в саду

Лиза
Скандинавская ходьба: глупый тренд или топовое упражнение для поддержания здоровья? Скандинавская ходьба: глупый тренд или топовое упражнение для поддержания здоровья?

Оказывают ли какой-то эффект палки в скандинавской ходьбе?

ТехИнсайдер
Оградить и уничтожить Оградить и уничтожить

Геохимические барьеры – средство защиты природы от человеческой деятельности

Популярная механика
HYATT CENTRIC дебютирует в Венеции и Милане HYATT CENTRIC дебютирует в Венеции и Милане

В Италии открываются первые отели динамичного бренда Hyatt Centric

Cosmopolitan
Ани Лорак «Считаю, что я – Мисс Вселенная» Ани Лорак «Считаю, что я – Мисс Вселенная»

Певица призналась, почему конфликтует с дочкой и не любит рано просыпаться

StarHit
Почему радостные события иногда вызывают тревогу? Почему радостные события иногда вызывают тревогу?

Казалось бы, время радоваться, но вместо радости вы испытываете беспокойство

Psychologies
Место встречи Место встречи

25-я, юбилейная выставка MosBuild прошла в начале апреля в Москве

SALON-Interior
7 неочевидных, но важных симптомов аллергии (один связан даже с либидо) 7 неочевидных, но важных симптомов аллергии (один связан даже с либидо)

И ни в коем случае не лечите аллергию сами!

Playboy
Как Мелинда Гейтс борется за равенство полов на работе и дома Как Мелинда Гейтс борется за равенство полов на работе и дома

Супруга Билла Гейтса рассказала, как преодолеть гендерное неравенство

Forbes
«Нам надо поговорить»: 11 ловушек, которых стоит избегать в диалоге «Нам надо поговорить»: 11 ловушек, которых стоит избегать в диалоге

Общаясь с другими на важные и острые темы, мы попадаем в самые разные ловушки

Psychologies
Век XXI Век XXI

Автор проекта Юлия Русских оформила квартиру в доме сталинской эпохи

SALON-Interior
Как замалчивали катастрофу в Чернобыле в 1986 году? Как замалчивали катастрофу в Чернобыле в 1986 году?

О катастрофе в Чернобыле подробно рассказывает новый сериал HBO

GQ
Найти правильный баланс Найти правильный баланс

Актер Гоголь-центра Никита Кукушкин протестировал автомобиль Genesis G80

OK!
Не все коту Масленица Не все коту Масленица

Любая из нас может услышать «Не знаю, готов ли я к серьезным отношениям»

Cosmopolitan
Разбор последней серии «Игры престолов», или несколько слов в защиту сценаристов Разбор последней серии «Игры престолов», или несколько слов в защиту сценаристов

Пришло время проститься с сериалом, с которым мы прожили восемь лет

Esquire
Доходность до 466%. Сколько заработали инвесторы в криптовалюту с начала года Доходность до 466%. Сколько заработали инвесторы в криптовалюту с начала года

Самая популярная криптовалюта биткоин только в мае подорожала почти на 100%

Forbes
Убийца авианосцев: трагическая история «сотки» Т-4 Убийца авианосцев: трагическая история «сотки» Т-4

СССР пытался найти дешевое «противоядие» для борьбы с королями океанов

Популярная механика
Как не надо флиртовать с девушками в сети: 8 самых частых ошибок Как не надо флиртовать с девушками в сети: 8 самых частых ошибок

Чего стоит избегать в кокетливой переписке с понравившейся девушкой

Playboy
Названы лучшие и худшие серии «Игры престолов» Названы лучшие и худшие серии «Игры престолов»

Финальный сезон «Игры престолов» не спешит на покой

Maxim
Спасибо маме: как Наоми Осака становится самой высокооплачиваемой спортсменкой мира Спасибо маме: как Наоми Осака становится самой высокооплачиваемой спортсменкой мира

Что превращают молодую теннисистку в маркетинговую звезду

Forbes
Kia ProCeed GT: аккуратно, добротно, продуманно Kia ProCeed GT: аккуратно, добротно, продуманно

Грузить много, везти быстро — главные правила нового универсала от Kia

Maxim
Перехват: секреты и тайны спецслужб США Перехват: секреты и тайны спецслужб США

Подлинные жемчужины рассекреченных архивов Агенства национальной безопасности

Популярная механика
Оракул из Апопки: встречайте Эдди Брауна, героя одной из величайших нерассказанных историй Уолл-стрит Оракул из Апопки: встречайте Эдди Брауна, героя одной из величайших нерассказанных историй Уолл-стрит

Как темнокожий инженер заработал многомиллионное состояние на бирже

Forbes
Политика погубила Нью-Йорк в симуляции армагеддона Политика погубила Нью-Йорк в симуляции армагеддона

По результатам симуляции армагеддона большая часть Нью-Йорка лежит в руинах

Популярная механика
Когда лучше всего выходить на пробежку? Когда лучше всего выходить на пробежку?

Время суток для пробежки, оказывается, играет не такую уж большую роль

GQ
Свидания после развода: 6 популярных ошибок (лучше их не допускать) Свидания после развода: 6 популярных ошибок (лучше их не допускать)

О распространенных ошибках на свиданиях, которые допускают разведенные парни

Playboy
В понедельники больше никогда В понедельники больше никогда

Музею изобразительных искусств им. Пушкина становится тесно в столице

СНОБ
Открыть в приложении