ИИ, обученный на бактериальных геномах, создает невиданные ранее белки. Нейросеть Evo интерпретирует большие фрагменты геномной ДНК как промпты и генерирует выходные данные, геномно-соответствующие этой интерпретации. Исследователи использовали известные гены как промпты, и Evo должна была создать последовательности для белков со связанными функциями.
Ключевой вопрос заключался в том, выдаст ли Evo последовательности уже известных белков или создаст менее предсказуемые результаты. При подаче 30 процентов последовательности гена известного белка Evo восстановила 85 процентов остального. При подаче 80 процентов последовательности система вернула всю недостающую последовательность. Когда один ген был удален из функционального кластера, Evo корректно идентифицировала и восстановила отсутствующий ген.
Большой объем обучающих данных обеспечил корректную идентификацию наиболее важных областей белка. Если Evo вносила изменения в последовательность, они обычно располагались в областях, где допустима вариабельность. Обучение позволило системе включить правила эволюционных ограничений на изменения в известных генах.
Исследователи решили протестировать, что произойдет, когда Evo попросят создать что-то новое. Для этого использовали бактериальные токсины, которые обычно кодируются вместе с антитоксином. Команда разработала токсин, лишь отдаленно связанный с известными и не имеющий известного антитоксина, и подала его последовательность Evo как промпт. На этот раз отфильтровали любые ответы, похожие на известные гены антитоксинов.
Источник новости и обложки: arstechnica.com