DeepMind с помощью ИИ создаёт масштабную карту белков человека
Исследовательская лаборатория искусственного интеллекта DeepMind создала самую полную на сегодняшний день карту белков человека. Для этого использовались возможности ИИ. Компания бесплатно публикует данные, а некоторые ученые сравнивают потенциальное влияние этой работы с проектом «Геном человека» – международным усилием по картированию всех человеческих генов.
Белки – это длинные сложные молекулы, которые выполняют множество задач в организме, от создания тканей до борьбы с болезнями. Их предназначение продиктовано их структурой, которая сворачивается в сложные и неправильные формы. Понимание того, как белок сворачивается, помогает объяснить его функцию, что, в свою очередь, помогает учёным решать целый ряд задач – от проведения фундаментальных исследований того, как работает организм, до разработки новых лекарств и методов лечения.
Раньше для определения структуры белка требовались дорогостоящие и трудоёмкие эксперименты. Но в прошлом году DeepMind показала, что может производить точные предсказания структуры белка с помощью программного обеспечения на базе искусственного интеллекта под названием AlphaFold. Теперь компания опубликовала сотни тысяч предсказаний, сделанных программой ИИ.
В настоящее время в открытом доступе предлагается около 180 тыс. белковых структур, каждая из которых создана экспериментальными методами и доступна через Protein Data Bank. DeepMind публикует предсказания структуры около 350 тыс. белков у 20 различных организмов, включая животных, таких как мыши и плодовые мухи, и бактерии, такие как кишечная палочка. При этом есть некоторое совпадение между данными DeepMind и ранее существовавшими белковыми структурами, но точно определить их количество сложно из-за природы моделей. Что наиболее важно, данные DeepMind включают предсказания для 98% всех человеческих белков, около 20000 различных структуры, которые в совокупности известны как протеом человека. Это не первый общедоступный набор данных о человеческих белках, но он является наиболее полным и точным.
По словам технического руководителя AlphaFold Джона Джампера, при желании учёные могут загрузить для себя весь протеом человека. При этом файл HumanProteome.zip имеет размер около 50 ГБ.
DeepMind не планирует останавливаться на достигнутом и продолжит работать с прогнозированием сворачивания белков. До конца года компания намерена представить прогнозы для 100 млн белковых структур. По словам генерального директора European Molecular Biology Laboratory, этот набор данных «изменит наше понимание того, как устроена жизнь». И эти данные будут бесплатными на неограниченный срок как для научных, так и для коммерческих исследователей.