Корреляции

Есть две группы пациентов, А и B, отобранных по тому, что А справляются с вирусом гораздо лучше B, и соответственно здоровее, живут дольше и все такое.
У меня есть гипотезы о том, почему это так, аж целых 7 штук. Я меряю соответствующие семь параметров у А и B пациентов, но вижу, что эти группы никак по этим параметрам не отличаются (я ожидал, что у группы А эти параметры будут выше, чем у В). Статистически отличий нет, а на глаз если что и видно, так это то, что у А эти параметры даже пониже в среднем, и разброс в цифрах побольше.

Вот индивидуальные измерения, EC - группа А, VC - группа B. Еще есть группы CT и CU, и меня также интересует, отличается ли группа EC от них, но вообще для данного вопроса их можно игнорировать.
ОК, может по отдельности они и не отличаются, а что если нужно смотреть на комбинации этих параметров? Я попарно считаю корреляцию между всеми семью параметрами. Делаю это для группы А и отдельно для группы В. И вижу, что в группе А все эти параметры коррелируют друг с другом куда лучше, чем в группе В. Если в пациенте один из параметров выше, то и другие параметры выше (и наоборот - если один ниже, то и другой ниже). А в группе В - кто в лес, кто по дрова. Один из параметров может идти вверх, а другой вниз. Разница довольно большая - не просто статистически достоверная, но и "глазом видно".

Spearman's rank correlation coefficients
Вот на основании такого результата, что можно сказать? Можно ли предположить, что пациенты в группе А чувствуют себя лучше, потому что у них эти параметры между собой коррелируют?
Меня вот что смущает. С одной стороны - да, мы нашли нечто пусть и неожиданное, и пусть и пост-фактум, но реально коррелирующее с наблюдаемым фенотипом. Для построения гипотезы должно быть вполне достаточно. Но при этом я как-то очень понимаю, как эту гипотезу сформулировать. ОК, я вижу как может быть лучше иметь высокие значения для нескольких параметров сразу. Но корреляция же означает также, что у них и "когда меньше одного, то меньше и другого" - значит "иметь меньше и того и другого" лучше чем "иметь много одного, но мало другого". Верно? Но вот с биологической точки зрения это как-то не имеет большого смысла, по крайней мере на первый взгляд.
И последний вопрос - как я уже упомянул выше, разброс параметров у группы А мне кажется существенно больше, чем у группы В. Может ли описанный выше результат быть просто артефактом того, что при большем разбросе данных корреляции получаются сильнее?
|
</> |