Статистика и котики
Статистику боятся, ее не любят, но не уважать ее нельзя. Чем больше данных получает и производит человечество, тем статистика становится важнее, позволяя правильно оценивать и интерпретировать информацию. Для многих наук понимание статистики – это как правила хорошего тона, без соблюдения которых вас не примут ни в одну достойную компанию. Но статистика часто пугает своей сложностью. Поэтому прежде чем переходить к серьезным статистическим вопросам, необходимо разобраться в основах. И помогут нам в этом котики.
Описательная статистика: кто такие котики
Котики бывают разные: большие и маленькие, с висячими ушками и короткими лапками, длиннохвостые или вовсе без хвоста. Но в каждом из них есть некоторые черты, которые позволяют нам объединить их под общим названием «котики». Но ведь где-то существует котик, которого можно считать самым типичным представителем семейства. Как же его найти? Для простоты возьмем такое свойство, как размер. Первое, что мы можем сделать, – посмотреть, какой величины котики встречаются чаще. Этот размер называется модой, и он вполне может претендовать на звание самого типичного. А еще мы можем расположить котиков по порядку, от наименьшего к наибольшему, и посмотреть, котик какого размера находится ровно посередине. Этот размер называется медианой.
Ну а если мы сложим размеры всех наших котиков и разделим на их количество, то получим среднее арифметическое, знакомое нам еще со школы. Важно помнить, что показатель среднего значения очень чувствителен к выбросам. Если в нашу выборку попадет уникум размером со слоника, то его размер заметно сдвинет среднее значение в большую сторону, и тогда оно перестанет отражать реальную картину.
Мода, медиана и среднее значение позволяют находить типичные размеры котиков и называются мерами центральной тенденции. Но, кроме типичных значений, нас интересует и то, насколько разнообразными могут быть котики. В этом нам могут помочь меры изменчивости. Простейшая из них – размах – это всего лишь разница между самым большим и самым маленьким котиками. Иногда статистики отсекают 25% самых крупных и 25% самых мелких котиков, вычисляя разницу только для группы «середнячков». Эта величина называется межквартильным размахом.