ИИ собрал 200 миллионов структур белков в одну карту — и она показала скрытые закономерности жизни
Учёные сделали важный шаг к системному пониманию белков, организовав гигантский массив предсказанных структур с помощью искусственного интеллекта. Новый подход позволил увидеть скрытые закономерности в том, как белки устроены, работают и эволюционируют. Результаты проливают свет на ранее неизвестные формы и связи, в том числе потенциально уникальные для человека. Об этом сообщает исследовательская группа Сеульского национального университета.
Как упорядочили вселенную белковых форм
В основе работы лежит база данных AlphaFold Protein Structure — открытый каталог, в котором собраны структуры более чем 200 миллионов белков, рассчитанные ИИ. До недавнего времени этот массив оставался фрагментированным: учёные сравнивали белки небольшими группами, изучая отдельные семейства или узкие классы.
Новый проект объединил все доступные модели в единую систему. Это позволило перейти от точечного анализа к панорамному обзору всего белкового пространства и увидеть повторяющиеся мотивы формы, которые невозможно заметить при локальном подходе.
«Мы вступили в новую эру структурной биологии, где вычислительные методы открывают беспрецедентный доступ к исследованию белковой вселенной», — отметил доцент Школы биологических наук Сеульского национального университета Мартин Штайнеггер.
Алгоритмы вместо десятилетий вычислений
Ключевую роль сыграл алгоритм Foldseek Cluster. Он переводит сложные трёхмерные структуры в компактный «алфавит», что резко ускоряет сравнение форм. Благодаря этому почти бесконечное море моделей удалось сжать примерно до 2,3 миллиона репрезентативных кластеров.
Подобные вычислительные подходы всё активнее применяются и в смежных областях, включая автоматизированный подбор структуры биологических тканей при печати биотканей с помощью ИИ.
«Тёмные» кластеры и неизвестные функции
Особый интерес вызвали так называемые тёмные кластеры — группы белков, чья форма не совпадает с уже известными складками. Многие из них не имеют функциональных аннотаций, что делает их кандидатами на новые типы активности.
Исследователи дополнительно искали в этих структурах карманы связывания и каталитические участки, которые могут быть важны для биохимических реакций или разработки лекарств.
Что оказалось уникальным для человека
При анализе человеческих белков выяснилось, что строго «человеческие» формы встречаются крайне редко — команда нашла лишь около 13 подобных кластеров. Подавляющее большинство структур человека входит в более древние семейства, распространённые по всему древу жизни.
Это подчёркивает принцип эволюционного повторного использования: природа комбинирует старые молекулярные модули, создавая новые функции без изобретения принципиально новых форм.
Иммунная система и древние корни
Некоторые кластеры неожиданно связали иммунные белки человека с бактериальными аналогами. Один из ярких примеров — газдермины, формирующие поры в мембранах при пироптозе, процессе гибели инфицированных клеток. Подобные порообразующие механизмы уже помогают объяснять, как белки участвуют в медленном разрушении нейронов при болезни Паркинсона.
Структурное сходство показывает, что такие домены возникли задолго до появления сложных животных и сохранялись на протяжении сотен миллионов лет.
Почему форма важнее последовательности
Последовательности аминокислот со временем могут сильно расходиться, тогда как пространственная форма белка меняется медленнее. Именно поэтому структурные сравнения позволяют выявлять эволюционные связи там, где анализ последовательностей бессилен.
Созданный атлас кластеров AlphaFold становится навигационным инструментом для биологов и фармацевтических команд, помогая находить неожиданных «соседей» и формулировать новые гипотезы.
Сравнение традиционного анализа и кластеризации AlphaFold
Традиционный анализ опирается на сравнение последовательностей и ограниченные наборы структур, что эффективно для отдельных семейств. Кластеризация AlphaFold работает напрямую с формой и охватывает практически всё известное белковое пространство. В результате первый подход даёт фрагментарную картину, а второй — целостный обзор эволюции и функционального разнообразия.
Плюсы и минусы нового подхода
Метод открывает доступ к ранее неизвестным структурам и ускоряет исследования, а также полезен для поиска мишеней в разработке лекарств.
- Плюсы: масштабируемость, высокая точность, выявление скрытых эволюционных связей.
- Минусы: предсказанные структуры требуют экспериментального подтверждения и не всегда отражают динамику белков в живой клетке.
Советы шаг за шагом для исследователей
-
Использовать кластеры AlphaFold как отправную точку для поиска аналогов.
-
Обращать внимание на тёмные кластеры без аннотаций.
-
Комбинировать структурный анализ с экспериментальными методами.
-
Проверять потенциальные карманы связывания при разработке лекарств.
Популярные вопросы о структурных кластерах белков
Что лучше — анализ последовательности или структуры? Структура чаще сохраняет эволюционные связи при сильном расхождении последовательностей.
Можно ли применять эти данные в фармацевтике? Да, особенно для поиска новых ферментов и рецепторов.
Сколько стоит доступ к базе AlphaFold? База данных общедоступна и бесплатна.