"Сегодня повезло!"

топ 100 блогов eugenegp07.02.2024 Каждый раз при публикации данных небольшого исследования возникают комменты "выборка слишком мала, это ничего не значит". Правы ли они? Например, друзья предупреждают: это же П., не играй с ним на деньги и не спорь, уж больно ему везет. Вы решаете проверить, сыграв в кости. Да, Эйнштейн предупреждал, что бог в кости не играет, но вы не бог и не Эйнштейн.

Игра простая, у кого больше сумма очков на двух кубиках, тот и выиграл (High Dice). Вы бросаете два кубика, три раза: результаты трех бросков 6, 3 и 5.
П. достает свои кости и тоже кидает три раза: результаты 9, 11, 8. Улыбается, говорит: "Сегодня повезло!", забирает деньги со стола.
В этот момент друзья уводят вас за локоток. И тут наперерез бросается комментатор со словами: "Выборка слишком мала! В каждой из групп всего три результата, при этом вероятности их вообще совершенно одинаковые, это просто случайность, играйте дальше!"

Неужели ученые настолько ненормальные? Нет. Для малых выборок придуманы специальные тесты. Конкретно можно применить U-критерий Манна-Уитни, который в прикладных целях и можно использовать, начиная с n=3, т.е. всего трех замеров в каждой из двух сравниваемых групп. Более того, его можно использовать, и когда в одной группе всего два замера, но тогда в другой должно быть не менее 5. [Строго говоря, можно считать U-критерий и при n=1, но смысла мало.]

В данном случае для расчета критерия Манна-Уитни будет важно, что хотя все результаты разные, КАЖДЫЙ ваш результат оказался ниже ЛЮБОГО результата соперника. То есть у вас 9 пар сравнения, и при каждом сравнении ваш результат хуже. Подходит критерий Манн-Уитни и потому, что неизвестно, подчиняются ли результаты вашего соперника нормальному, гауссовскому распределению, а то друзья заронили сомнения.
Расчеты покажут, что мнение комментатора о случайности не подтверждается, разница статистически есть. Мог ли такой выигрыш произойти случайно? Да, конечно, но речь о вероятностях, и по принятым в науке критериям гипотеза «странной везучести» в этом, таком маленьком, эксперименте подтвердилась.

И это не единственная возможность проверить случайность разницы между малыми выборками. Критерий Манна-Уитни не учитывает абсолютное преимущество, которое было у П. в каждом броске, только выстраивает результаты по рангу (от первого до шестого). Но разница в очках на каждом броске тоже выглядит подозрительно больше ожидаемой (6,3,5 против 9,11,8). Для проверки, случайно ли это, можно использовать Т-критерий Вилкоксона, но вот ему для осмысленности понадобится уже 5-6 пар замеров.

Есть около десятка статистических критериев, которые можно использовать для анализа малых выборок. Возникает вопрос, а зачем тогда вообще заморачиваться с огромными выборками, если можно получать значимые результаты на 10-20-30 объектах исследования в каждой группе? Дело в том, что разница результатов между группами должна быть очень большой, как в описанной игре. Если вы ищете эффект, который может составлять 10-15% процентов, на маленькой выборке вы его просто упустите. На большой выборке можно также делать анализы по подгруппам (возрасту, полу, доходу, сопутствующим заболеваниям, и другим переменным), а также искать редкие явления (побочные, например) – т.е. фактически идет сразу несколько исследований в одном. Поэтому в основном потоке публикаций вы увидите проверку гипотез на достаточно больших выборках с помощью параметрического теста Стьюдента. Который был придуман сотрудником компании Гиннесс для проверки качества пива. Конкретно темного стаута.

Сегодня повезло!

NB:
1) Просьба к работающим со статистикой поискать ошибки в тексте, уж больно упрощал.
2) поэтому в посте могут быть исправления.

Оставить комментарий

Архив записей в блогах:
Ижавиа сегодня опубликовала цены на летние перелёты к морю. Посмотрел на цифры и решил сравнить цены на перелёты на черноморские курорты из городов, из которых летает ижевский авиамонополист. Посмотрим, откуда дешевле летом россиянам слетать погреться и покупаться в Сочи, Анапу или Симфер ...
Как я и предполагал, как только наш клуб вернул себе первоначальное название, "лакейская" нервно скривила морды и чуть не подавилась своей слюной. Что за "лакейская" такая? Это клуб, в котором собрались те, кто подставил свой зад нынешней власти ...
Недалеко от нашего города Донского есть лес под названием Каменный (хотя там нет ни одного камня). Однажды мы с женой пошли туда за грибами, и там со мной приключилась просто невероятная история. День выдался ясный и теплый. Нам попалось грибное место, за пару часов набрали два ведра. ...
Ну вот, уже 17-е сентября, и я спешу поблагодарить всех вас за поздравления! Простите, что не могу каждому из вас лично написать "спасибо" - сил просто у меня не хватает. Также благодарю тех из вас, кто поздравил ...
Наконец-то я нашел подтверждение из конкретного исторического источника о том,  о чем знал и раньше -  что мифическую "Монгольскую империю" выдумали ватиканские иезуиты,  чтобы сокрыть то самое государство,  которое в Европе было известно как "Великая ...