Статистика и котики: как тёплые коты стали частью научной книги
Описательная статистика: кто такие котики
Котики бывают разные: большие и маленькие, с висячими ушками и короткими лапками, длиннохвостые или вовсе без хвоста. Но в каждом из них есть некоторые черты, которые позволяют нам объединить их под общим названием «котики». Но ведь где-то существует котик, которого можно считать самым типичным представителем семейства. Как же его найти? Для простоты возьмем такое свойство, как размер. Первое, что мы можем сделать, – посмотреть, какой величины котики встречаются чаще. Этот размер называется модой, и он вполне может претендовать на звание самого типичного. А еще мы можем расположить котиков по порядку, от наименьшего к наибольшему, и посмотреть, котик какого размера находится ровно посередине. Этот размер называется медианой.
Ну а если мы сложим размеры всех наших котиков и разделим на их количество, то получим среднее арифметическое, знакомое нам еще со школы. Важно помнить, что показатель среднего значения очень чувствителен к выбросам. Если в нашу выборку попадет уникум размером со слоника, то его размер заметно сдвинет среднее значение в большую сторону, и тогда оно перестанет отражать реальную картину.
Мода, медиана и среднее значение позволяют находить типичные размеры котиков и называются мерами центральной тенденции. Но, кроме типичных значений, нас интересует и то, насколько разнообразными могут быть котики. В этом нам могут помочь меры изменчивости. Простейшая из них – размах – это всего лишь разница между самым большим и самым маленьким котиками. Иногда статистики отсекают 25% самых крупных и 25% самых мелких котиков, вычисляя разницу только для группы «середнячков». Эта величина называется межквартильным размахом.
Оценить разброс можно и с помощью дисперсии. Предположим, что мы решили сравнить величину некоторого конкретного Барсика со средним котиковым размером. Разница (а точнее, разность) этих размеров называется отклонением от среднего. Чем сильнее Барсик от него отличается, тем отклонение больше. И конечно, чем больше примеров с большим отклонением, тем разнообразнее котики по размеру.
Чтобы оценить разнообразие, мы можем действовать уже испытанным способом: сложить все отклонения и поделить на общее число котиков, то есть найти среднее от отклонений. Но поскольку отклонения могут уходить как в плюс, так и в минус, их сумма даст нам ноль. Чтобы этого не происходило, статистики возводят значения отклонений в квадрат и лишь затем находят среднее значение. Полученная величина называется дисперсией (D). Впрочем, для оценки разнообразия котиков дисперсия не слишком удобна, поскольку размер измеряется в обычных сантиметрах, а дисперсия – в квадратных. Поэтому для удобства из дисперсии извлекают корень, получая среднеквадратическое отклонение (S).
Среднее значение и среднеквадратическое отклонение часто используют совместно для компактного описания той или иной группы котиков. Как правило, большинство (около 68%) котиков находятся в пределе одного среднеквадратического отклонения от среднего. Эти котики обладают нормальным размером. Оставшиеся 32% – котики либо очень большие, либо очень маленькие.
Все, о чем мы говорили выше, относится к описательной статистике, задача которой – дать краткое представление о том, как выглядят изучаемые нами объекты. Мера центральной тенденции показывает, как выглядит наиболее типичный из них. Мера изменчивости отражает их разнообразие. Но, помимо описательной, существует и куда более обширный класс методов, которые позволяют проверять гипотезы, относящиеся к нашим объектам. И тут на помощь котикам приходят... песики.
Доказательная статистика: чем котики отличаются от песиков
Чем-то песики и котики похожи: у тех и других есть четыре лапы, хвост и пара ушей – но во многом и различаются. Возможно, есть различие и по размеру, но как это проверить? Ведь бывают как очень маленькие песики, так и очень крупные котики... Первое, что приходит на ум, – это посчитать средний размер котиков и средний размер песиков, а затем вычесть одно из другого: чем больше окажется эта величина, тем больше различия между ними. Статистики так и поступают, деля эту разность на стандартную ошибку – коэффициент, зависящий от размеров выборки и дисперсии. Полученный показатель называется t-критерием Стьюдента. И чем больше t-критерий, тем с большей уверенностью мы можем утверждать, что в среднем песики отличаются от котиков по размеру.
Но насколько большим должен быть t-критерий Стьюдента, чтобы мы могли с уверенностью говорить о различии размеров песиков и котиков? Чтобы разрешить эту трудность, статистики идут от обратного, выдвигая нулевую гипотезу. Давайте и мы поступим так и предположим, что средние размеры котиков и песиков одинаковы. Теперь остается посмотреть, с какой вероятностью мы получим такое же (или большее) значение t-критерия, если нулевая гипотеза верна. Эта вероятность называется p-уровнем значимости, и если она велика (больше 5% или 0,05), то нулевая гипотеза не отвергается. Если же р-уровень невысок (меньше 5% – 0,05), то нулевая гипотеза отвергается и принимается альтернативная – что котики все-таки отличаются от песиков. По крайней мере по размеру.
В последнее время показатель p-уровня часто критикуется, но он продолжает оставаться одним из базовых понятий доказательной статистики. Вне зависимости от того, чем вы занимаетесь – ищете ли различия между котиками и песиками или находите взаимосвязи между кошачьим питанием и размером, – вы обязательно столкнетесь с этим понятием.
Итак, доказательная статистика позволяет проверять гипотезы об окружающем мире. Вместе с описательной она решает огромное количество научных и практических задач в самых разных областях, от психологии и генетики до производства и маркетинга. Она далеко не ограничивается понятиями, разобранными в этой статье. Изучайте статистику и любите котиков.