Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

ForbesКультура

Бывает ли безвредный алкоголь, что такое зомби-статистика и когда можно верить числам

Фото Getty Images

«Числа идеально подходят для изложения чуши. Они кажутся объективными, но ими легко манипулировать, чтобы рассказывать нужную историю», — говорят главные в мире эксперты по чуши, которые придумали университетский курс о том, как противостоять фейкам и дезинформации. Кто и как использует числа, чтобы морочить нам голову и когда не надо верить процентам и статистике.

Доктор биологических наук Карл Бергстром борется с фейками и враньем на протяжение многих лет. Как ученый он специализируется на механизмах распространения информации в рамках биологических и социальных систем — от внутриклеточного контроля экспрессии генов до дезинформации в социальных сетях. В период пандемии он боролся с антиваксерами, а недавно осудил подход Илона Маска к подсчету фейковых аккаунтов в Twitter как ненаучный. По его словам, выборка из 100 подписчиков, на основе которой Маск намерен оценить пропорцию настоящих аккаунтов в соцсети, не может считаться репрезентативной — это влечет за собой систематическую ошибку отбора. Но по экспертной оценке Бергстрома, скорее всего, Маск всех троллит.

В Вашингтонском университете Бергстром вместе с другим биологом Джевином Уэстом ведет курс под названием Calling Bullshit («Как распознать вранье»), задача которого — научить студентов скептически относиться к информации и уметь оценивать ее правдивость или убедительно доказывать ее фейковость. Об этом актуальном и полезном навыке они написали одноименную с курсом книгу, которая мае выходит на русском языке под названием «Полный бред! Скептицизм в мире больших данных» в издательстве «Манн, Иванов и Фербер». Forbes публикует отрывок.

«Вера людей в числа невероятно сильна. Скептики заявляют, что они «просто хотят увидеть данные», или требуют, чтобы им показали «исходные данные», или настаивают на том, что «показатели должны говорить сами за себя». Нас убеждают, что «данные никогда не врут». Но эта точка зрения может быть опасной. Даже если величины или числа верны, их всё равно можно использовать, чтобы морочить голову. Чтобы числа были понятными, они должны находиться в уместном контексте. Их нужно демонстрировать так, чтобы нам было доступно честное сравнение.

Мы полагаемся на приблизительные оценки, когда рассматриваем такие показатели, как, например, рост взрослого человека в определенной стране. Мужчины из Нидерландов считаются самыми высокими в мире — в среднем 183 сантиметра. Но чтобы получить эти данные, не измеряли всех жителей страны и не вычисляли среднее всех полученных величин. Вместо этого исследователи использовали случайную выборку местных мужчин, измерили тех, кто в нее попал, и экстраполировали выводы на все население. Если бы кто-то измерил полдюжины мужчин и вычислил их средний рост, только по случайности результат мог бы получиться неверным. Предположим, среди них некоторые были необычайно высокими. Это называют ошибкой выборки. К счастью, обширная выборка, как правило, позволяет выровнять отклонения, так что такая ошибка минимально влияет на результат.

Проблемы могут возникнуть и с процедурой измерения. Допустим, исследователи попросили участников сообщить о своем росте, но мужчины склонны завышать цифры, причем мужчины маленького роста делают это чаще, чем высокие.

Другой источник ошибки — предвзятость самой выборки — еще опаснее. Предположим, вы решили определить рост людей, отправились на местную баскетбольную площадку и стали измерять игроков. Баскетболисты, как правило, выше среднего роста, так что ваша выборка будет нерепрезентативной для населения в целом и в итоге значение окажется слишком высоким.

Большинство ошибок такого рода не настолько очевидны. Есть много хитроумных подходов, из-за которых выборка перестает характеризовать популяцию. Сводная статистика может быть удобным способом обобщать информацию, но, если она некорректна, вы легко введете свою аудиторию в заблуждение.

В расчеты и факты, которые кажутся совершенно очевидными, ошибки закрадываются по разным причинам. Можно запутаться в числах. Можно использовать слишком маленькую выборку, которая некорректно отражает особенности всей группы. Некорректными могут оказаться методики, с помощью которых мы выводим числа из иной информации. И наконец, числа могут просто быть полной чушью, выдуманной с нуля в попытке придать убедительность жалким аргументам. Мы должны помнить об этом, когда нам что-то доказывают с помощью численных показателей. Говорят, что цифры никогда не лгут, но следует помнить, что они часто вводят в заблуждение.

Зловредные проценты

Двенадцатая глава книги Карла Сагана 1996 года «Мир, полный демонов» называется «Тонкое искусство снимать лапшу с ушей». В ней автор разносит мир рекламы, атакующий нас ошеломительными, но бессмысленными фактами и цифрами. Саган подчеркивает ту же проблему, которой мы касаемся в этой главе: числа легко сбивают людей с толку, и рекламодатели многие десятилетия пользуются этим, чтобы убеждать. «От вас не ждут вопросов, — пишет Саган. — Не думайте. Покупайте».

Печально известный заголовок Breitbart сходным образом лишил читателей возможности провести осмысленное сопоставление. В этом впечатляющем образце нагнетания паники сообщалось, что 2139 потенциальных бенефициаров законопроекта DREAM (The Development, Relief and Education for Alien Minors Act — законопроект, согласно которому дети нелегальных мигрантов, получившие высшее образование или отслужившие в армии США, могут получить вид на жительство в США) — взрослые, нелегально прибывшие в США в детском возрасте — были осуждены или обвинены в преступлениях, совершенных против американцев. Число кажется пугающим. Но, конечно, закон DREAM относился к большому числу людей: соответствующий статус имели одновременно около 700 000 человек и еще около 800 000 получили его в какой-то момент до отмены программы. Это означает, что только 0,3% получателей такого статуса — то есть менее одного из 300 — обвинялись в преступлениях против американцев.

Уже лучше, но как это число соотносится с аналогичными показателями, касающимися граждан Америки? Если 0,75% американцев сидят за решеткой, получается, что граждане США в два раза чаще оказываются заключенными или обвиненными в совершении преступления, чем дети нелегальных мигрантов, претендующие на гражданство? Около 8,6% американских граждан были обвинены в преступлении в какой-то момент свой жизни, так и тут потенциальные бенефициары программы DREAM выглядят неплохо.

Конечно, они моложе и в целом могли просто не успеть совершить преступление до получения статуса, потому что у них было на это меньше времени, чем у среднего американца. Но оказывается, что 30% граждан США за какие-нибудь правонарушения (не считая дорожно-транспортных) арестовывались уже к 23 годам. Даже если мы предположим, что числа Breitbart корректны, издание представило их без необходимой информации, которая нужна читателю, чтобы поместить их в контекст.

Таким образом, демонстрируя исходные числа, можно заставить сравнительно небольшое количество выглядеть большим. Мы помещаем число в контекст с помощью выражения его в процентах. Конечно, проценты являются ценным инструментом сравнения. Но существуют различные способы затруднять необходимые сравнения и в процентах. Например, проценты могут заставить крупные показатели выглядеть менее значительными.

В своем блоге вице-президент по поиску Google признал, что его компания сталкивается с проблемами фейковых новостей, дезинформации и другого неуместного контента: «Наши алгоритмы помогают выявлять надежные источники среди сотен миллиардов страниц в нашем поисковом индексе. Однако стало очевидным, что небольшая часть запросов в нашем повседневном трафике (около 0,25%) выдает непристойные или откровенно вводящие в заблуждение результаты, а это не то, что нужно людям». Тут можно отметить две вещи. В первую очередь нам демонстрируют огромное, но практически не имеющее к нам отношения число как бы в роли контекста. «Сотни миллиардов страниц в нашем поисковом индексе». Этому огромному числу противопоставлено крошечное 0,25%. Но сотни миллиардов не имеют к этому особого отношения: это количество проиндексированных страниц, а не число поисковых запросов. Неважно, проиндексированы десять тысяч или сотни миллиардов страниц. Если 0,25% запросов в Google ведут не туда, у вас один на четыре сотни шанс получить чушь в результате поиска.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Отложенный дефицит: чем чреват отказ нанимать джунов Отложенный дефицит: чем чреват отказ нанимать джунов

Почему отказ нанимать джунов — перспектива новой волны нехватки кадров

Forbes
«Теория сексуальной экономики»: почему одних женщин раздражает откровенная одежда на других «Теория сексуальной экономики»: почему одних женщин раздражает откровенная одежда на других

Как и почему срабатывает внутриполовая конкуренция?

Psychologies
Настоящие произведения искусства: топ-5 самых красивых паспортов в мире Настоящие произведения искусства: топ-5 самых красивых паспортов в мире

Развороты некоторых паспортов можно смело вывешивать в галереях. Посмотрите!

ТехИнсайдер
Эти загадочные черные грибы породила чернобыльская радиация Эти загадочные черные грибы породила чернобыльская радиация

Жизнь способна даже смертоносную радиацию использовать на благо новых существ

ТехИнсайдер
Сколько лет на самом деле было героям всем известных книг Сколько лет на самом деле было героям всем известных книг

В каком возрасте герои ощутили на себе все трудности жизни

Maxim
Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко» Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко»

«Когда нам шагалось легко»: путевые заметки Ивлина Во 1929-1935 годов

Правила жизни
Зона отчуждения: как выглядят реальные последствия Чернобыльской катастрофы Зона отчуждения: как выглядят реальные последствия Чернобыльской катастрофы

Как действует радиация на человека и сколько жизней унёс Чернобыль на самом деле

ТехИнсайдер
Икра хариуса, галаган и конина: какие локальные продукты станут новыми деликатесами Икра хариуса, галаган и конина: какие локальные продукты станут новыми деликатесами

Какие локальные продукты заслужат звание новых российских деликатесов

Forbes
7 фактов об автомобилях, которые стыдно не знать даже начинающему водителю. Проверим, разбираетесь ли вы в машинах! 7 фактов об автомобилях, которые стыдно не знать даже начинающему водителю. Проверим, разбираетесь ли вы в машинах!

5 вещей об автомобилях, которые должен знать даже «чайник»

ТехИнсайдер
Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов

Португальский консул Аристидеш де Соуза Мендеш оказался перед непростым выбором

Вокруг света
Кто помог маме неизлечимо больного ребенка отстоять интересы сына и человеческое достоинство Кто помог маме неизлечимо больного ребенка отстоять интересы сына и человеческое достоинство

Как живут дети с миодистрофией Дюшенна

СНОБ
Почему был убит Александр II и как он мог спастись после покушения Почему был убит Александр II и как он мог спастись после покушения

От судьбы не уйдешь, даже если ты император

ТехИнсайдер
Последняя минута войны Последняя минута войны

Советский генерал подписал Акт о капитуляции Германии без разрешения Сталина

Вокруг света
Что делают суперуспешные люди рано утром? Что делают суперуспешные люди рано утром?

Что общего у Марка Цукерберга, Анны Винтур и Тима Кука?

Psychologies
Иосиф Бродский: «У меня нет ни философии, ни принципов… У меня есть только нервы» Иосиф Бродский: «У меня нет ни философии, ни принципов… У меня есть только нервы»

Иосиф Бродский — о смысле жизни, добре и зле, вере и умении прощать

Psychologies
Поздравления с днем рождения сыну: как выразить свои чувства? Поздравления с днем рождения сыну: как выразить свои чувства?

Как интересно и небанально поздравить сына с днем рождения

VOICE
Краткая история виниловых проигрывателей в СССР Краткая история виниловых проигрывателей в СССР

Виниловых проигрыватели в СССР: иногда инженеры создавали нечто любопытное

Maxim
Ученые выяснили, почему молодым женщинам опасно смотреть реалити-шоу Ученые выяснили, почему молодым женщинам опасно смотреть реалити-шоу

Девушкам небезопасно смотреть реалити-шоу. Но почему?

Psychologies
Как тренироваться после 40 лет? Как тренироваться после 40 лет?

Оставаться активным и спортивным с возрастом не только можно, но и нужно

Maxim
Бьюти-эксперт Елена Крыгина: о бестактных вопросах, личных границах и критериях «идеального партнера» Бьюти-эксперт Елена Крыгина: о бестактных вопросах, личных границах и критериях «идеального партнера»

Елена Крыгина — что помогает ей поддерживать внутренний баланс

Psychologies
Черная оспа: как Москва чуть не вымерла из-за ковра, купленного художником Черная оспа: как Москва чуть не вымерла из-за ковра, купленного художником

Московская эпидемия черной оспы в 1959–1960 гг.

VOICE
Аэробные и анаэробные нагрузки: что выбрать и как сочетать Аэробные и анаэробные нагрузки: что выбрать и как сочетать

Как заниматься — долго и комфортно или на пределе возможностей, но недолго?

РБК
10 малоизвестных «Запорожцев»: родственники 10 малоизвестных «Запорожцев»: родственники

У ЗАЗ был целый ряд интересных и неизвестных непрофессионалам машин

ТехИнсайдер
Странный брак: что на самом деле произошло между Чайковским и его женой Странный брак: что на самом деле произошло между Чайковским и его женой

Брак Чайковского продлился всего несколько недель и одновременно — всю жизнь

VOICE
Кто украл главную икону православной России Кто украл главную икону православной России

О краже иконы Казанской Божией Матери

СНОБ
Лучшие стрижки для непослушных волос: твоя прическа будет выглядеть идеально Лучшие стрижки для непослушных волос: твоя прическа будет выглядеть идеально

Непослушные волосы? Всё зависит от стрижки!

VOICE
Главные провалы: российские народные машины, которые не увидели свет Главные провалы: российские народные машины, которые не увидели свет

На какие машины планировалось пересадить россиян, и почему план не удался

РБК
Эта россиянка шьет вещи из простых футболок — их носят все, от Крида до Милохина Эта россиянка шьет вещи из простых футболок — их носят все, от Крида до Милохина

Лонгсливы Have a Nice Day — это нишевая марка «для своих»

VOICE
Философия безмятежности: как эпикурейцы учат относиться к страданиям и наслаждениям Философия безмятежности: как эпикурейцы учат относиться к страданиям и наслаждениям

Книга английского философа Джона Селларса «Философия безмятежности»

Forbes
«Любым способом вывести из строя противника»: 5 фактов о боях роботов «Любым способом вывести из строя противника»: 5 фактов о боях роботов

Бои роботов привлекли внимание большого количества зрителей по всему миру

Вокруг света
Открыть в приложении