Парадокс Симпсона, пишущая машинка Киллиана и условные гуманитарии
sova_f — 08.11.2021 Часть 1. Парадокс СимпсонаПару месяцев тому назад в сети циркулировала серия постов про парадокс Симпсона на примере израильской статистики вакцинации. Признаюсь, что именно тогда я впервые об этом парадоксе услышала и очень впечатлилась. Ну и как не впечатлиться при виде такой таблицы?
Таблица взята из этой статьи, о которой я узнала из постов gingema и motek.
Воспользуюсь цитатой из поста – motek.
Первый этап (то, что большинство госпитализированных с короной – привитые, не значит, что вакцина потеряла эффективность, т.к. надо смотреть на процент привитых по населению), надеюсь, уже все прошли. Следующий уровень: если подсчитать эффективность вакцины от тяжёлой болезни, не разбивая по возрасту, получается 67.5%. А вот если разбить по возрасту, то в каждой группе будет больше 80%! Это называется парадокс Симпсона.
Из Википедии: Парадокс Симпсона – эффект, явление в статистике, когда при наличии двух групп данных, в каждой из которых наблюдается одинаково направленная зависимость, при объединении этих групп направление зависимости меняется на противоположное. Там много примеров – причем в русской и английской примеры разные.
В вышеупомянутой статье парадокс объясняется на другом простом примере (его нет в Википедиях).
Предположим, по горизонтальной оси откладывается дозировка некоего лекарста, а по вертикальной – вероятность выздоровления. Красные точки относятся к людям более старшего возраста, а синие – к более молодым.
Из правого рисунка мы видим, что и у старшей, и у младшей группы более высокие дозы дают более низкую вероятность выздоровления, то есть для обеих групп лекарство явно не работает.
Однако если мы не стратифицируем свой анализ по возрасту, левый график показывает позитивное соотношение между дозировкой и вероятностью выздоровления. И это может привести к ошибочному заключению о том, что лекарство работает.
Причина этого парадоксального результата в том, что и дозировка, и вероятность выздоровления были систематически выше в одной группе (молодых) и ниже в другой (пожилых). И если мы не стратифицируем confounding factor (не знаю как перевести, но в данном случае возраст), то общий результат очевидно вводит нас в заблуждение.
Возвращаясь к нашей таблице, описывающей эффективность вакцины на количество тяжелых больных. Тот факт, что статус вакцинации и риск тяжелого заболевания систематически выше в старшей возрастной группе дает парадоксальный результат: общая эффективность (если оценивать их без разбивки по возрасту), 67.5%, намного ниже, чем эффективность для любой из возрастных групп (91.8% и 85.2%).
Фантастика, да? С тех пор наша четвертая волна уже сошла на нет, и неактуально, казалось бы, про Симпсона. Но во-первых, она наверняка не последняя, а во-вторых, записать очень захотелось.
Часть 2. Реакция публики.
К обоим постам нашлись чудесные комменты, и некоторые я полюбила особенно.
1. 60% населения привито, 60% привитых среди больных. Что еще надо? Вот правда. Все вы товарищи юлите. То вам приспичило нормировать на что-то, то по возрастам делить. Вот вам простая истина: 60% населения привито, 60% привитых среди больных – значит, больше болеют привитые!
На всякий случай объясняю на пальцах. 60% привито, 40% непривито. Те 60%, которые заболевшие, они в основном взялись не из тех 60%, а из этих 40%. Понятно, нет? Если непонятно, переходим к Части 3.
2. Про то, что первый этап все прошли
utnapishti:
Вы знаете – мне кажется, не все. Те, для кого очевидно, что процент привитых среди заболевших – параметр бессмысленный, впадают в другую крайность: не понимают, как кто-то ещё может этого не понимать. Я думаю – легко. (...) Вы кому-то говорите: процент привитых среди заболевших ни о чём не говорит. Или даже говорите – возьмём крайний случай: если привиты 100% населения, то и среди заболевших будет 100% привитых. А тот, кого вы пытаетесь просветить, говорит в ответ: Какая условная вероятность? Какой парадокс Симпсона? При чём тут крайний случай, когда привиты не 100% населения? Чего только эти гики-математики не придумают, чтобы сбить нас с толку!..
Отличный ответ alon_68:
Нечего делать, нам придётся жить в мире, где люди, не освоившие школьную математику, имеют возможность объединиться и заявить о себе как единая сила. Раньше они были разрознены ввиду мягкой, но действенной цензуры печатных изданий – ни одна уважающая себя газета или журнал не пропустили бы подобных рассуждений, а сейчас объединились в мировом масштабе.
Часть 3. Пишущая машинка Киллиана и гуманитарии
В процитированном выше комменте Утнапишти дает ссылку на знаменитую запись avva про пишущую машинку Киллиана. Я ее в свое время как-то упустила – зато теперь она идет просто на ура. Пост замечателен не только рассказом про удивительную историю с машинкой, но и рассуждениями про технарей и гуманитариев.
Л. сказал, что рассказ про пишущую машинку напомнил ему одну теорию о происхождении нашего мира. Когда-то Земля была плоская и на ней водились динозавры. Потом в Землю врезался гигантский метеорит, она прогнулась по центру, края закрылись и Земля приняла форму шара. Таким образом динозавры оказались внутри, а человек, возникший позже, оказался снаружи. И с тех пор мы выкапываем из земли кости динозавров.
А это просто картинка попалась в дружественном журнале.
Дисклеймер про гуманитариев напишете сами. С моей точки зрения – которые понимают про пишущую машинку, приравниваются к технарям. И наоборот.
|
</> |