Каждый год в науке происходят открытия, по той или иной причине проходящие мимо внимания большинства людей. В 2021 году произошел серьезный прорыв в биологии — впервые стало возможно предсказать трехмерную структуру белка, применяя технологии искусственного интеллекта и компьютерные алгоритмы.
Как выглядит молекула
Для того, чтобы понять, почему открытие биологов — это большой шаг для человечества, нужно начать с самых основ.
Вся наша жизнь есть взаимодействие молекул: в основном, это белки. Белки — это длинные цепочки аминокислот, которые формируются на основе информации, полученной из ДНК, а затем сворачиваются в трехмерные формы.
Формы, которые принимают белковые молекулы, определяются информацией, заложенной в ДНК, а уж в какую форму свернется сама молекула ДНК — зависит от состава аминокислот в цепочке. В свою очередь, форма в биологии определяет функцию.
К примеру, в пандемию COVID-19 многие видели изображение вирусной частицы, на ней можно было заметить небольшие выступы. Эти выступы — S-белок коронавируса или белок-шип.
То, что мы видим на подобных изображениях, — определенным образом свернутая в трехмерном пространстве молекула. Поверхность молекулы очень сложна, на ней есть множество выступов, впадин, участков с разным зарядом, ямок и т.д.
Ключ и замок
За счет поверхности белки взаимодействуют друг с другом. Это похоже на ключ и замок: ключ может открыть замок, только если бороздка ключа соответствует ему. В противном случае ключ или не войдет, или не повернется, или вовсе сломается.
Большинство заболеваний, к примеру, рак, связаны с тем, что белки изменяются в результате мутаций, а мутировавший белок с измененной трехмерной структурой способен взаимодействовать не с тем, с чем нужно. Как если бы поврежденный ключ перестал открывать нужный замок, но приобрел способность открывать замок в двери чужой квартиры.
По этому принципу работает большинство болезней — к примеру, связывающий домен S-белка коронавируса, находящегося на поверхности вирусной частицы, взаимодействует с рецепторами клетки легочного эпителия, как ключ с замком.
Знание трехмерной структуры белков и умение предсказать ее очень важно именно поэтому. Кроме того, большинство современных лекарств разрабатываются по такому же принципу. Например, в случае с белком коронавируса можно было бы разработать молекулу-заглушку. Таким образом, заражение было бы невозможно, потому что участок, взаимодействующий с рецептором вирусной частицы, оказывался бы закрыт.
Можно сказать, что жизнь — это взаимодействие множества молекулярных ключей с замками.
Об этом науке было известно еще с 50-х годов прошлого века, однако определить трехмерную структуру белка было крайне сложно.
Как определяется структура белка
Определить трехмерную структуру белка можно несколькими способами.
Один из методов — рентгеновская кристаллография. При таком подходе выделяется очень большое количество белка, затем он очищается, и белок образовывает кристалл. Пропуская через этот кристалл рентгеновские лучи, можно увидеть трехмерную структуру белка. Это явление называется дифракция. Недостаток данного метода — в медлительности процесса и негарантированном результате: белка может выделиться слишком мало или он может не кристаллизоваться.
Есть и другие способы, к примеру, метод ядерного магнитного резонанса или криоэлектронная микроскопия. Эти методы также требуют доступа к дорогостоящему оборудованию и больших затрат времени.
Предсказание структуры белков
Интересно то, что сами молекулы знают, в какую форму они свернутся. То есть белки с одинаковой аминокислотной последовательностью сворачиваются всегда в одну и ту же трехмерную форму.
Долгое время ученые могли определить структуру белка только после того, как он свернулся, используя при этом сложные и дорогостоящие методы. Однако около тридцати лет назад начались попытки предсказать трехмерную структуру белка: ученые пытались смоделировать ее, ориентируясь на то, из каких аминокислот состоит цепочка.
На протяжении долгих лет никому не удавалось предсказать структуру белка, несмотря на то, что на эксперименты выделялось финансирование и организовывались специальные премии. Так продолжалось до тех пор, пока в 2021 году не произошел прорыв — две группы ученых создали пакет компьютерных программ, которые с применением методов искусственного интеллекта научились предсказывать структуру белков. Rosetta — проект добровольных вычислений, разработанный в лаборатории Бейкера при Вашингтонском университете и AlphaFold — программа на базе искусственного интеллекта, созданная в Google DeepMind.
Это удивительно, ведь данные, которые раньше приходилось добывать годами работы в лаборатории, теперь можно получить за минуту с помощью расчета компьютера. Нейросеть предсказывает уже определенные структуры белков, имея в базе данных десятки тысяч структур.
На сегодняшний день более 90% структур, предсказанных этими алгоритмами, верны. Это значит, что точность предсказания структуры белка на данный момент выше, чем точность прогноза погоды.
Как работает программа
Программы по предсказанию структуры белков, такие как Rosseta и AlphaFold, работают по похожему принципу. Фактически создатели программ обучили искусственный интеллект предсказывать, как свернется молекула на основе данных из базы уже определенных структур белков.
Программу тренируют узнавать элементы структуры, фактически создается огромный каталог, где указано, какие тенденции имеют те или иные участки из аминокислот.
Простыми словами можно сказать, что программы были обучены методом перебора.
Помимо этого, есть, к примеру Foldit — онлайн-головоломка об укладе белка. Игра является частью исследовательского проекта Вашингтонского университета, в ней люди могут по-разному укладывать или сворачивать молекулу, играя с ее формой. Игровой процесс не сложен, цепочка аминокислот в нем напоминает кубик Рубика, поэтому в исследовании принимали участие люди без биохимического образования: от школьников до водителей-дальнобойщиков.
Гражданская наука
Сказанное выше — хороший пример гражданской науки, когда в научный процесс интегрируются не только ученые, но и обычные люди. Такие проекты развиваются и в России, к примеру, школьники привлекаются к сбору данных для научных исследований.
Подобная интеграция ведет к демократизации и глобализации науки. К примеру, одной из упомянутых выше программ — AlphaFold — может воспользоваться любой пользователь интернета, способный правильно сформулировать запрос.
Что это значит для медицины и для жизни
Пандемия коронавируса вызвала интерес людей к биологии — все с нетерпением и вниманием следили за разработкой и тестированием вакцин, а также первыми результатами их применения.
Вакцина или лекарство прямого действия не зависит от мутаций, которые накапливает вирус. Мутация вируса — это изменение его РНК, вместо одной аминокислоты возникает другая, и это меняет его свойства. Эти изменения касаются и поверхности вирусного белка: меняется его форма, за счет этого важные для нас антитела перестают узнавать вирус и бороться с ним.
Если же предсказать данное изменение и заранее знать трехмерную структуру белка, может быть разработано лекарство, взаимодействующее точечно с измененным участком поверхности. Таким образом, предсказание трехмерной структуры белков значительно ускоряет процесс разработки лекарств.
Новое открытие в биологии позволяет по-другому взглянуть на жизненные процессы. Мы переходим от понимания жизни как набора последовательности нуклеиновых кислот генома к набору трехмерных структур молекул.
С развитием технологий станет возможно не только предсказать, какую форму примет молекула, но и с чем она будет способна эффективно взаимодействовать. Влияя на такое взаимодействие, ученые получат возможность влиять на само поведение клетки, а это, в свою очередь, позволит воздействовать не только на болезни, но и на такие процессы, как старение, когнитивные функции и т.п.
В конечном счете предсказание трехмерных структур белков позволяет существенно продвинуться в понимании самой жизни и управлении ею.