Высокоточное предсказание 3-D структуры белков по их аминокислотной

Я уже давно не выходил за пределы «ковидной» тематики. Сегодня решил это сделать, несмотря на то, что я не специалист в области, которой посвящён этот пост. Это научное направление – предсказание 3-D структуры белков по их первичной последовательности. Начну с короткого ликбеза о белках и их структуре (те, кто базовые знания в этой области имеют, этот фрагмент поста могут опустить). Белки — это полимеры аминокислот. Аминокислот, «задействованных» в белках двадцать. В белке они связаны друг с другом однотипной связью (она называется «пептидной»), наподобие бус, в которых бусинки 20-ти цветов сцеплены друг с другом идентичными «крючочками». В каждом белке своя неповторимая последовательность «бусинок»-аминокислот, по-научному, это первичная структура белка или аминокислотная последовательность (amino acid sequence). Но в естественных условиях в виде линейной последовательности (незапутанных бус) белки не существуют. Каждая цепочка из аминокислот причудливым образом свёртывается и образует уникальную 3-D структуру («конформацию»). В 1973 году шведский биохимик, лауреат Нобелевской премии, Христиан Анфинсен сформулировал постулат, который называют «догмой Анфинсена» – конформация белка полностью определяется его первичной структурой. Вообще-то известно исключение – это прионы, но отставим эту загадку в сторону. Применимость догмы Анфинсена к подавляющему большинству белков сомнению не подвергается. Однако предсказывать достаточно точно конформацию белка по его первичной структуре (которую, благодаря секвенированию геномов, сейчас определить относительно просто) долгое время не удавалось.
Это направление исследований было и остаётся уделом довольно узкого круга очень «высоколобых» профессионалов. Каждые два года они устраивали «турнир», в котором соревновались их «программы-предсказатели» (https://www.predictioncenter.org/index.cgi ). Эти программы становились всё более совершенными, но, до недавнего времени им было далеко до точности, обеспечиваемой экспериментальными методами определения 3-D структуры белков. Однако экспериментальные методы очень сложны, дорогостоящи, и главное, до получения конечного результата проходят месяцы (в среднем 6 месяцев на один белок). В геноме человека закодировано около 20 тысяч белков (это протеом человека). Несколько десятилетий работы позволили установить 3-D структуру приблизительно 17% из них.
«Прорыв» обозначился в декабре прошлого года на очередном «турнире» (14 по счёту). Система ИИ AlphaFold, разработанная британской компанией DeepMind, продемонстрировала беспрецедентную точность предсказаний – выше 90%. Причём, на решения задачи (из первичной последовательности в 3D-структуру) у AlphaFold на один белок уходило 2-3 минуты. А на днях в Nature была опубликована статья (принята к печати, пока доступна как препринт) с детальной информацией о 3-D структурах приблизительно 350 тысяч белков человека и других организмов, расшифрованных с помощью AlphaFold ( https://www.nature.com/articles/s41586-021-03828-1 ). При этом покрытие протеома человека составило около 98%.
Программные коды AlphaFold и полная информация о расшифрованных белках публично доступны. Значение всего этого и, особенно, открывающихся возможностей для понимания молекулярных механизмов различных физиологических и патологических процессов, для разработки новых лекарств, вакцин, биотехнологий, трудно переоценить.
Проф_АФВ
|
</> |