Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Робособаку научили карабкаться по стенам враспор Робособаку научили карабкаться по стенам враспор

Как инженеры научили робособаку научили эффективно двигаться по вертикали

N+1
«Я слишком добрый»: где взять озверин и как отрастить клыки «Я слишком добрый»: где взять озверин и как отрастить клыки

Можно ли натренировать способность быть агрессивным, а главное — нужно ли?

Psychologies
Микропластик привел к загрязнению воды метилртутью Микропластик привел к загрязнению воды метилртутью

Микропластик в воде перевел метилртуть в токсичную форму

N+1
Денис Чернов Денис Чернов

Ведущий (и первый!) режиссер культовых «Смешариков» показал премьеру года

Собака.ru
Из мужского гардероба — в одежду для Барби: как розовый стал женским цветом Из мужского гардероба — в одежду для Барби: как розовый стал женским цветом

Как розовый стал воплощением гендерных стереотипов

Forbes
Как выбрать внешний аккумулятор для смартфона: шпаргалка от CHIP Как выбрать внешний аккумулятор для смартфона: шпаргалка от CHIP

Как выбрать пауэрбанк, чтобы его хватало всем вашим устройствам?

CHIP
Современное китайское вооружение: качественные копии и впечатляющие оригиналы Современное китайское вооружение: качественные копии и впечатляющие оригиналы

Как обстоят дела с китайской военной техникой?

ТехИнсайдер
Весы не могут без  любви, Рыбы придирчивы: секреты совместимости по гороскопу Весы не могут без  любви, Рыбы придирчивы: секреты совместимости по гороскопу

В чем секрет идеальных пар и как разобраться в совместимости мужчины и женщины?

VOICE
Ограниченная видимость: что это, при каких условиях, особенности ПДД Ограниченная видимость: что это, при каких условиях, особенности ПДД

Как вести себя на дороге в условиях ограниченной и недостаточной видимости

РБК
Нулевой пациент: от кого в СССР заразились ВИЧ сотни детей Нулевой пациент: от кого в СССР заразились ВИЧ сотни детей

Долгое время к ВИЧ в СССР относились легкомысленно

VOICE
10 курьезных кинобаек 10 курьезных кинобаек

Вообще никто в реальности точно не знает, что делает кино интересным

Maxim
Огромная свалка комет: подлинная природа Плутона Огромная свалка комет: подлинная природа Плутона

Плутон больше не считают планетой, но от этого он не становится менее интересным

ТехИнсайдер
В магическом трехслойном графене нашли два режима сверхпроводимости В магическом трехслойном графене нашли два режима сверхпроводимости

Физики исследовали сверхпроводимость в трехслойном графене

N+1
Анна Старшенбаум: «Я люблю жизнь. Мне очень многое в ней нравится» Анна Старшенбаум: «Я люблю жизнь. Мне очень многое в ней нравится»

Анну Старшенбаум называют «ангелом с детским взглядом»

Здоровье
Вели за собой армии: как жили женщины-самураи Вели за собой армии: как жили женщины-самураи

История японских женщин-воинов — онна-бугэйся

Вокруг света
Механизмы зрения: наука и жизнь Механизмы зрения: наука и жизнь

С чего начинается зрение?

Наука и жизнь
Самые дешевые электромобили в России. Список моделей и цены Самые дешевые электромобили в России. Список моделей и цены

Какие электромобили можно купить по цене новой Lada Vesta

РБК
Почему одни люди склонны слышать Почему одни люди склонны слышать

Что делает людей предрасположенными к "паранормальному" опыту слуховых явлений

ТехИнсайдер
Как сделать яркий макияж: тренды, идеи и советы эксперта Как сделать яркий макияж: тренды, идеи и советы эксперта

Яркий макияж популярен, но важно уметь расставлять акценты

РБК
Охотница на королей: как Диана де Пуатье завладела сердцем французского монарха Охотница на королей: как Диана де Пуатье завладела сердцем французского монарха

Диана де Пуатье почти тринадцать лет была некоронованной королевой Франции

Вокруг света
Природа цифровой зависимости: почему мы не расстаемся с «онлайном» и как с этим быть Природа цифровой зависимости: почему мы не расстаемся с «онлайном» и как с этим быть

Почему техника стала источником новой зависимости и как этим управлять

ТехИнсайдер
«Это как пойти в банкомат, снять деньги и сжечь их». Почему малому бизнесу не нужна собственная торговая марка «Это как пойти в банкомат, снять деньги и сжечь их». Почему малому бизнесу не нужна собственная торговая марка

Почему собственная торговая марка — беда для небольших компаний

Inc.
На пути к климатической нейтральности На пути к климатической нейтральности

В стране будет организована широкая сеть карбоновых полигонов

Агроинвестор
Генрих Остерман: как немецкий дуэлянт стал серым кардиналом Анны Оиоанновны Генрих Остерман: как немецкий дуэлянт стал серым кардиналом Анны Оиоанновны

Из-за какой-то драки, шестнадцатилетний студент стал первым министром России

ТехИнсайдер
Как отрегулировать яркость экрана, чтобы глаза меньше уставали? Как отрегулировать яркость экрана, чтобы глаза меньше уставали?

Насколько важна правильная яркость экрана для комфортной работы за компьютером

CHIP
Заблуждения о военных тактиках древности Заблуждения о военных тактиках древности

Прошлое было не просто ужаснее, чем мы думаем, но еще и гораздо приземленнее

Maxim
На солнечной стороне На солнечной стороне

Как отдыхать летом с пользой для своей кожи

Лиза
Ботаники описали первое хищное растение с подземными ловчими кувшинчиками Ботаники описали первое хищное растение с подземными ловчими кувшинчиками

Непентес стыдливый — первое известное хищное растение с подземными кувшинчиками

N+1
Алмазы под давлением Алмазы под давлением

Экономист Александр Аузан о будущем креативных индустрий

СНОБ
Сколько световых лет от нас до самой далекой из известных галактик? Сколько световых лет от нас до самой далекой из известных галактик?

Астрономы точно измерили расстояние до самой старой и самой дальней галактики

ТехИнсайдер
Открыть в приложении