Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Лисица поймала рыбу-пилу Лисица поймала рыбу-пилу

Завезенные в Австралию обыкновенные лисицы могут охотиться на рыб-пил

N+1
«Золото или жизнь»: краткая история пиратства «Золото или жизнь»: краткая история пиратства

Пиратство можно назвать одной из древнейших «профессий»

Вокруг света
Как люди! Обезьяны могут интуитивно «предугадывать мысли» людей Как люди! Обезьяны могут интуитивно «предугадывать мысли» людей

Способны ли обезьяны интуитивно «читать мысли» других существ?

ТехИнсайдер
Труба, валторна и фрак Труба, валторна и фрак

Как важными свидетелями событий военного времени становятся личные вещи

Дилетант
Сила воли: что мешает нам добиваться цели Сила воли: что мешает нам добиваться цели

Проблема отсутствия силы воли – в образе жизни, который ее ослабляет

Psychologies
Путин и золото: как британский миллионер судился из-за «русского следа» в Brexit Путин и золото: как британский миллионер судился из-за «русского следа» в Brexit

Как Аррон Бэнкс сколотил состояние, увлекся политикой и потратился на Brexit

Forbes
«Невидимый мир» — кроткий и нежный фильм о школьном буллинге и сопротивлении злу «Невидимый мир» — кроткий и нежный фильм о школьном буллинге и сопротивлении злу

«Невидимый мир» — бельгийский фильм о брате и сестре, которых травят в школе

Правила жизни
На природе и в огороде На природе и в огороде

Как научиться замечать и использовать на кухне то, что растет под ногами

Новый очаг
5 мест в Солнечной системе, в которых вам точно стоит побывать. Или хотя бы посмотреть на них 5 мест в Солнечной системе, в которых вам точно стоит побывать. Или хотя бы посмотреть на них

Куда лучше всего отправиться в Солнечной системе?

ТехИнсайдер
Очень московское собрание: как коллекция братьев Морозовых долго возвращалась домой Очень московское собрание: как коллекция братьев Морозовых долго возвращалась домой

Многолетняя эпопея по объединению собрания братьев Морозовых

Forbes
Технологический стартап из будущего Технологический стартап из будущего

Как в Москве делают «всепогодные» солнечные батареи

СНОБ
Переливание спинномозговой жидкости от молодых мышей улучшило память у старых Переливание спинномозговой жидкости от молодых мышей улучшило память у старых

Переливать от молодых мышей старым можно не только кровь, но и ликвор

N+1
Живший более шести миллионов лет назад крокодил указал на морское прошлое гавиалов Живший более шести миллионов лет назад крокодил указал на морское прошлое гавиалов

Палеонтологи обнаружили окаменелости морского крокодила из семейства гавиаловых

N+1
«Трудно даются праздничные речи»: как избавиться от страха выступлений «Трудно даются праздничные речи»: как избавиться от страха выступлений

Некоторые, когда приходит черед произносить речи, испытывают неловкость. Почему?

Psychologies
«Мой мужчина по-русски не говорит»: Волочкова раскрыла секреты бойфренда «Мой мужчина по-русски не говорит»: Волочкова раскрыла секреты бойфренда

Балерина проводит отпуск в Турции в компании нового избранника

VOICE
«Тайная жизнь пчел»: роман о взрослении в Америке 1960-х «Тайная жизнь пчел»: роман о взрослении в Америке 1960-х

Каково быть подростком-сиротой на американском юге в 1964 году? Отрывок из книги

Forbes
«Вас могут попытаться обмануть»: как экономить по-взрослому в Стамбуле «Вас могут попытаться обмануть»: как экономить по-взрослому в Стамбуле

Как можно экономно прожить в Стамбуле

Вокруг света
Гантели на пенсию Гантели на пенсию

Как будет выглядеть спорт в ближайшем и отдаленном будущем?

Forbes Life
Арабская ночь Арабская ночь

Как устроена финансовая система ОАЭ

Forbes
Поле вдохновения Поле вдохновения

Как украсить стены в доме с помощью цветочных обоев

Лиза
«Весь мир против меня!»: чем опасен синдром жертвы и как от него избавиться «Весь мир против меня!»: чем опасен синдром жертвы и как от него избавиться

Что такое синдром жертвы и почему он возникает?

Psychologies
7 фактов о загадочных, но величественных баобабах 7 фактов о загадочных, но величественных баобабах

Баобаб — настоящий супергерой среди растений!

ТехИнсайдер
Тревожные звоночки: ученые научились проверять риск попадания в ДТП во время сна Тревожные звоночки: ученые научились проверять риск попадания в ДТП во время сна

Потенциально аварийные ситуации сопоставили с показателями здоровья

Вокруг света
Друг империи и враг декабристов: главный жандарм России Александр Бенкендорф Друг империи и враг декабристов: главный жандарм России Александр Бенкендорф

Граф Бенкендорф широко известен как «гонитель и душитель».

Вокруг света
Чтение выходного дня: фрагмент книги «Так можно: выстроить границы в отношениях с трудными родителями» Чтение выходного дня: фрагмент книги «Так можно: выстроить границы в отношениях с трудными родителями»

Как понять поведение наших родителей — отрывок из книги Дэвида М. Аллена

Правила жизни
Как люди, сами того не замечая, массово уничтожают самых крупных рыб в мире Как люди, сами того не замечая, массово уничтожают самых крупных рыб в мире

Как морские магистрали нарушают среду обитания самых крупных рыб в мире

Популярная механика
Хозяева древних морей Хозяева древних морей

Кем были самые опасные морские хищники прошлого?

Вокруг света
Что такое классы автомобилей: в чем их разница Что такое классы автомобилей: в чем их разница

Разбираемся, что такое классы авто, какие они бывают и нужно ли знать их все

РБК
Как помочь ребёнку сдать экзамены? Как помочь ребёнку сдать экзамены?

Время тревог и ожиданий. Как помочь ребенку во время подготовки к экзаменам?

Здоровье
Этот год в истории: что происходило в России и в мире в 1994 году? Этот год в истории: что происходило в России и в мире в 1994 году?

Что происходило в 1994 году и каким был мир за пределами студии «Час пик»?

Правила жизни
Открыть в приложении