­
­

Корреляции

топ 100 блогов shvarz26.01.2016 Кто разбирается в анализе разных корреляций и вообще в анализе данных, наведите меня на путь истинный по следующему вопросу или хотя бы выскажите свое мнение:

Есть две группы пациентов, А и B, отобранных по тому, что А справляются с вирусом гораздо лучше B, и соответственно здоровее, живут дольше и все такое.

У меня есть гипотезы о том, почему это так, аж целых 7 штук. Я меряю соответствующие семь параметров у А и B пациентов, но вижу, что эти группы никак по этим параметрам не отличаются (я ожидал, что у группы А эти параметры будут выше, чем у В). Статистически отличий нет, а на глаз если что и видно, так это то, что у А эти параметры даже пониже в среднем, и разброс в цифрах побольше.

Корреляции
Вот индивидуальные измерения, EC - группа А, VC - группа B. Еще есть группы CT и CU, и меня также интересует, отличается ли группа EC от них, но вообще для данного вопроса их можно игнорировать.


ОК, может по отдельности они и не отличаются, а что если нужно смотреть на комбинации этих параметров? Я попарно считаю корреляцию между всеми семью параметрами. Делаю это для группы А и отдельно для группы В. И вижу, что в группе А все эти параметры коррелируют друг с другом куда лучше, чем в группе В. Если в пациенте один из параметров выше, то и другие параметры выше (и наоборот - если один ниже, то и другой ниже). А в группе В - кто в лес, кто по дрова. Один из параметров может идти вверх, а другой вниз. Разница довольно большая - не просто статистически достоверная, но и "глазом видно".

Корреляции
Spearman's rank correlation coefficients



Вот на основании такого результата, что можно сказать? Можно ли предположить, что пациенты в группе А чувствуют себя лучше, потому что у них эти параметры между собой коррелируют?

Меня вот что смущает. С одной стороны - да, мы нашли нечто пусть и неожиданное, и пусть и пост-фактум, но реально коррелирующее с наблюдаемым фенотипом. Для построения гипотезы должно быть вполне достаточно. Но при этом я как-то очень понимаю, как эту гипотезу сформулировать. ОК, я вижу как может быть лучше иметь высокие значения для нескольких параметров сразу. Но корреляция же означает также, что у них и "когда меньше одного, то меньше и другого" - значит "иметь меньше и того и другого" лучше чем "иметь много одного, но мало другого". Верно? Но вот с биологической точки зрения это как-то не имеет большого смысла, по крайней мере на первый взгляд.

И последний вопрос - как я уже упомянул выше, разброс параметров у группы А мне кажется существенно больше, чем у группы В. Может ли описанный выше результат быть просто артефактом того, что при большем разбросе данных корреляции получаются сильнее?

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
1915 Приятель на аукционе купил вот этот снимок и теперь гадает, что изображено на нём. По его версии это дачные посиделки, но, на мой взгляд, слишком много народа. А что вы скажете? ...
Тут Виктора Ш по поводу неслучившейся поездки в Грузию встали поминать, реанимировали шутки про матрас. Нас про знаменитый видосик часто (см. заголовок), и вот, что мы думаем. Шендерович зажег не тем, что сношал матрас, а истерикой после. Если бы он отмолчался такого эффекта бы не ...
Давно хотел написать на эту тему, только руки всё не доходили. Но сегодня я понял - больше молчать нельзя. Если мы продолжим игнорировать тему быдла, оно скоро заполонит всё вокруг. Не далее как сегодня видел, проезжая перекрёсток, очередную пьяную парочку на сфетофоре. Мужик был ...
Шестой кассационный суд в Самаре вынес решение об увеличении размера компенсации морального вреда до 6 млн рублей жителю Уфы Фатхулле Исхакову, который провел 13 лет в колонии за убийство, которое он не совершал. Об этом ТАСС сообщили в суде. Исхаков 13 лет отбывал наказание по ...
у приятеля мерин С-шка 2006 г.в. дилерская.мотор 1.8 (кажецо) турбированный. на 110 тыщ движок застучал.вскрытие показало, что цепь растянулась и убила (сточила) нахуй все 3 звездочки - колен и оба распредвала. разъебашила успокоители, перскочила на 2 ...