Секрет «Карточного домика»: как большие данные помогают создавать успешные проекты
Forbes публикует отрывок из книги Кирилла Еременко «Работа с данными в любой сфере». Автор рассказывает, как с помощью big data добиться успеха в любой сфере современной жизни — от создания своего проекта до построения карьеры. В июне книгу выпустит издательство «Альпина»
Что общего у аналитика данных и Шерлока Холмса? Как у Netflix получилось создать стопроцентный хит — сериал «Карточный домик»? Ответ кроется в правильном использовании данных, уверен автор книги «Работа с данными в любой сфере» Кирилл Еременко. Книга рассказывает, почему большие данные сегодня полезны всем — независимо от того, хотите ли вы использовать их в своей профессии, собираетесь стать аналитиком данных или уже работаете в этой области. В публикуемом отрывке речь идет о том, когда и почему большие данные стали такой важной частью нашей повседневной жизни, как крупные корпорации изучают предпочтения аудитории с помощью big data и как экстраполировать их опыт на собственные бизнес и карьеру.
Почему такая суета вокруг больших данных?
Может показаться странным, что мы только начали понимать, насколько значимыми могут быть данные. Но когда мы в прошлом собирали данные, единственное, что мешало нам превратить их во что-то полезное, было отсутствие технологий. [...] С изобретением компьютера появилась возможность автоматизации процесса хранения и обработки данных. Но большие массивы данных увязли в первых машинах; ученым, работавшим с электронными массивами данных в 1950-х гг., приходилось ждать решения простой задачи несколько часов. Вскоре пришли к выводу, что для правильной обработки больших массивов данных — для установления связей между элементами и использования этих связей с целью получения точных и значимых прогнозов — нужно создавать информационные носители, которые могли бы управлять данными и справляться с их хранением. Разумеется, по мере совершенствования технологий, основанных на вычислениях, менялись и возможности компьютеров по хранению и обработке данных. И за последние 70 лет мы не только научились эффективно хранить информацию, но и смогли сделать эту информацию переносимой. Те же самые данные, которые в 1970-х гг. помещались только на 177 778 гибких дисках, к 2000-му могли поместиться на одном флеш-накопителе. Сегодня вы можете хранить все это и многое другое в облаке (хранилище с виртуализированной инфраструктурой, которая позволяет просматривать ваши личные файлы из любой точки мира). Когда вы в следующий раз обратитесь к личным документам, хранящимся в местной библиотеке, у вас на работе или просто в вашем мобильном устройстве, имейте в виду: вы фактически делаете то, что в 1970-х гг. потребовало бы использования более 100 000 дискет.
Эффект Одри Хепберн
Когда новые технологии облегчили хранение данных, исследователи начали обращать внимание на то, как эти сохраненные данные могут быть использованы на практике. Некоторые из киностудий Голливуда еще в 1950-х гг. собирали данные о том, что конкретно — от актера до режиссера и жанра — хотела увидеть их аудитория, а потом преобразовывали эту информацию в демографические характеристики респондентов, включавшие в себя возраст, местожительство и пол.