Корреляции

топ 100 блогов shvarz26.01.2016 Кто разбирается в анализе разных корреляций и вообще в анализе данных, наведите меня на путь истинный по следующему вопросу или хотя бы выскажите свое мнение:

Есть две группы пациентов, А и B, отобранных по тому, что А справляются с вирусом гораздо лучше B, и соответственно здоровее, живут дольше и все такое.

У меня есть гипотезы о том, почему это так, аж целых 7 штук. Я меряю соответствующие семь параметров у А и B пациентов, но вижу, что эти группы никак по этим параметрам не отличаются (я ожидал, что у группы А эти параметры будут выше, чем у В). Статистически отличий нет, а на глаз если что и видно, так это то, что у А эти параметры даже пониже в среднем, и разброс в цифрах побольше.

Корреляции
Вот индивидуальные измерения, EC - группа А, VC - группа B. Еще есть группы CT и CU, и меня также интересует, отличается ли группа EC от них, но вообще для данного вопроса их можно игнорировать.


ОК, может по отдельности они и не отличаются, а что если нужно смотреть на комбинации этих параметров? Я попарно считаю корреляцию между всеми семью параметрами. Делаю это для группы А и отдельно для группы В. И вижу, что в группе А все эти параметры коррелируют друг с другом куда лучше, чем в группе В. Если в пациенте один из параметров выше, то и другие параметры выше (и наоборот - если один ниже, то и другой ниже). А в группе В - кто в лес, кто по дрова. Один из параметров может идти вверх, а другой вниз. Разница довольно большая - не просто статистически достоверная, но и "глазом видно".

Корреляции
Spearman's rank correlation coefficients



Вот на основании такого результата, что можно сказать? Можно ли предположить, что пациенты в группе А чувствуют себя лучше, потому что у них эти параметры между собой коррелируют?

Меня вот что смущает. С одной стороны - да, мы нашли нечто пусть и неожиданное, и пусть и пост-фактум, но реально коррелирующее с наблюдаемым фенотипом. Для построения гипотезы должно быть вполне достаточно. Но при этом я как-то очень понимаю, как эту гипотезу сформулировать. ОК, я вижу как может быть лучше иметь высокие значения для нескольких параметров сразу. Но корреляция же означает также, что у них и "когда меньше одного, то меньше и другого" - значит "иметь меньше и того и другого" лучше чем "иметь много одного, но мало другого". Верно? Но вот с биологической точки зрения это как-то не имеет большого смысла, по крайней мере на первый взгляд.

И последний вопрос - как я уже упомянул выше, разброс параметров у группы А мне кажется существенно больше, чем у группы В. Может ли описанный выше результат быть просто артефактом того, что при большем разбросе данных корреляции получаются сильнее?

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
Они бы обсуждали и принимали нормальные законы! Например, по которым перед покупкой автомобиля человек должен будет подумать о том, где он будет её хранить. Одно дело, когда ты живёшь в деревне и у тебя есть свой участок, а другое – когда ты живёшь в городе. Если бы у депутатов ...
"Бьет, значит любит" - от создателей "Ворует, значит честный", "Горит, значит замерз", "Бухает, значит трезвенник" и "Повесился, значит счастлив". И ведь любит же...) ...
Происшествия  5 ноября, 00:44 Филиппины оказались в эпицентре тайфуна Наводнения и сильный ветер затопили дома, оставив людей на крышах и в машинах. Тайфун стал причиной гибели как минимум 26 человек на Филиппинах. Большинство погибших — из провинции Себу и других центральных регионов, ...
То есть, не жара чтобы шла, а ты вставай и иди. Потому что у нас еще лето. Потому что встреча и гуляево туда и сюда. Потому что, кстати, новый месяц и новый бюджет. Надо же тратить деньги, пока они не ...
Они купили квартиры в ЖК бизнес-класса, выстроенном на месте снесённых хрущёвок, и думали, что теперь ''я в домике''. Подальше от уплотнений, локальных бандитских реноваций и переселения в ''человейники''. Но в Москве даже богатые иногда плачут, после того, как ты заплатил, а тебя ...