Команда DeepMind создала систему AlphaFold, которая решила проблему предсказания структуры белков. После полувека исследований ученые впервые получили работающее решение этой фундаментальной задачи биологии. DeepMind опубликовала структуры 200 миллионов белков в открытом доступе.Проблема сворачивания белков изучается с 1960-х годов. Белки называют машинами жизни — они строят все, контролируют все, и именно благодаря им работает биология. Если можно предсказать структуру белков по их аминокислотной последовательности, это открывает путь к созданию новых белков для лечения рака или переработки пластика.
Для оценки методов предсказания структуры белков существует соревнование CASP, которое проводится каждые два года. Командам дают аминокислотные последовательности около 100 белков, структуры которых уже определены экспериментально, но еще не опубликованы. Точность предсказаний измеряется специальным скором, и результат выше 90 считается решением проблемы сворачивания белков.
В CASP 13 система AlphaFold от DeepMind стала самой точной, предсказав структуры для 25 из 43 белков в самой сложной категории. Команда превзошла второе место почти на 50 процентов. Однако руководитель проекта Demis Hassabis подчеркнул, что до полного решения проблемы еще далеко, и качество предсказаний пока недостаточно для практического использования биологами.
Команда продолжила работу и создала улучшенную версию системы для следующего соревнования CASP 14. Организатор соревнования John Moult написал, что результаты DeepMind оказались выдающимися как относительно других команд, так и по абсолютной точности моделей. После получения результатов DeepMind опубликовала не только код AlphaFold, но и сделала предсказания доступными для всех исследователей. Eric Schmidt из Google назвал опубликованные структуры 200 миллионов белков подарком человечеству.
Источник: youtube.com