53. Методы полногеномного анализа

Два следующих поста будут посвящены результатам исследования
трансгендерности с помощью методов полногеномного анализа. Но для
начала стоит ознакомиться с тем, что это такое. Есть три
высокотехнологичных подхода, которые используются в поисках генов,
ответственных за какой-то признак или болезнь:
· полногеномное исследование ассоциации (Genome
Wide Association
Study - GWAS)
· полное секвенирование экзома (Whole
Exome Sequencing -
WES)
· полное секвенирование генома (Whole
Genome Sequencing -
WGS).
Все три метода пока что довольно дорогие, хотя цена быстро падает. Это ограничивает количество образцов ДНК, которые могут исследовать даже хорошо финансируемые лаборатории. GWAS, WES и WGS это очень хорошие методы, но не нужно питать иллюзий, что с их помощью можно запросто выявить генетические варианты, ответственные за изучаемый признак. Увы, здесь много «подводных камней». Посмотрим, что же это за методы.
GWAS
Сразу оговорюсь, что на сегодняшний
день публикаций об использовании GWAS у трансгендеров в научной
литературе нет. Но, похоже, это дело времени, да к тому же в блоке
IX я буду писать о результатах GWAS, полученных в отношении
гомосексуализма. Как ясно из названия, GWAS это поиск ассоциации
какого-то признака или заболевания с полиморфными маркерами. По
сути это аналогично исследованиям ассоциации трансгендерности с
вариантами SNP и STR в «подозреваемых» генах, о которых шла речь в
постах 50-52. Однако GWAS включает генотипирование не нескольких
полиморфных вариантов в конкретных генах, а огромного числа SNP,
перекрывающих весь геном (до миллиона и даже больше). Принцип здесь
тот же – две группы сравниваются по частотам аллелей и генотипов
каждого SNP. Схема GWAS показана на рисунке.
В верхней части рисунка две сравниваемые группы – с изучаемым признаком (cases) и соответствующий контроль (controls). На чёрных панелях результаты генотипирования, каждая точка соответствует определённому SNP. Внизу график, где для каждого SNP показаны результаты сравнения. По горизонтали дано распределение SNP по геному. Над каждой хромосомой цветными точками обозначены результаты по каждому её SNP. По вертикали шкала, отображающая статистическую значимость, как log р. Дело в том, что при статистической обработке данных GWAS необходима корректировка на множественность сравнения, то есть нельзя использовать порог значимости р=0.05, как при единичном сравнении. Законы статистики говорят, что без такой корректировки будет выявляться ложная ассоциация с тысячами SNP. Коэффициент корректировки зависит от количества сравнений, но обычно пороговое значение при GWAS это р < 5х10-8 (минус 8-ая степень, то есть 0.00000005). Поэтому удобно использовать log. На графике пороговое значение показано верхней горизонтальной пунктирной линией. Все точки выше этого порога соответствуют SNP, которые по частоте (аллеля или генотипа) отличаются в сравниваемых группах.
WES и WGS
Оба варианта основаны на методах секвенирования нового поколения
(next generation sequencing) и уже были использованы для изучения
трансгендерности. Cеквенирование это определение последовательности
нуклеотидов в ДНК, иными словами, «прочтение текста», написанного
четырьмя буквами - A, G, C и Т. Классический метод секвенирования
Сэнгера позволяет «прочесть» только небольшие кусочки ДНК, правда с
большой точностью. Однако чтобы с его помощью прочесть весь геном,
требуется нереально длительное время, да и стоимость будет
запредельной. А вот методы секвенирования нового поколения, хоть и
менее точные, но позволяют сделать это достаточно быстро, и намного
дешевле. Посмотрим в чем суть этих двух подходов. WGS определяет
последовательность всего генома, то есть текст из 3 миллиардов
букв. WES «прочитывает» текст только кодирующей части генома, то
есть всех экзонов. Совокупность всех экзонов обозначают как экзом.
Отсюда и название - секвенирование экзома (не
экзона!). Экзом это только 1-1,5% всего генома, то есть
это уже не миллиарды, а лишь миллионы букв текста. Как правило,
единичные особо важные находки исследователи всё же перепроверяют
методом Сэнгера, секвенируя небольшой фрагмент, где был выявлен
особый вариант.
При проведении WGS и WES есть ещё один аспект - «информационный». Известно, что геномы двух случайно выбранных людей в среднем отличаются миллионами «букв». В этом гигантском массиве данных, резко возрастающем с каждым новым изученным геномом, надо уловить «сигнал», относящийся к изучаемому признаку, а сделать это очень непросто (намного сложнее, чем само секвенирование). Пока опубликованы две работы, в которых WES и WGS были использованы для изучения генетических причин трансгендерности. О них и пойдёт речь в следующих постах.
EIS-gen
|
</> |