Команда искусственного интеллекта DeepMind, известного благодаря сверхчеловеческому умению играть в шахматы, решила важную научную проблему, ставившую ученых в тупик в течение полувека. Шахмат она не касается.
Новейшая программа искусственного интеллекта AlphaFold помогла исследователям продемонстрировать возможность прогнозирования того, в какую объемную структуру сворачиваются белки. Это чрезвычайно сложный процесс, имеющий фундаментальное значение для понимания биологического механизма жизни.
По словам независимых ученых, это открытие поможет исследователям разобраться в механизмах, провоцирующих некоторые заболевания, и поможет в разработке лекарств и «зеленых ферментов», которые могут уничтожать пластиковые отходы.
В DeepMind уже заявили о начале работы с несколькими группами ученых. Сначала они сосредоточат внимание на малярии, сонной болезни и лейшманиозе.
«Это важнейший момент для отрасли, — говорит Демис Хассабис, основатель и исполнительный директор DeepMind. — Эти алгоритмы наконец стали достаточно мощными, чтобы их можно было применить к действительно сложным научным задачам».
Венкатраман Рамакришнан, президент Лондонского Королевского общества по развитию знаний о природе, назвал эту работу «ошеломляющим прорывом», который произошел «на десятилетия раньше, чем предсказывали многие специалисты в этой области».
Больше всего ИИ DeepMind известен победами над шахматистами, игроками в го, Starcraft II и старую классику Atari. На самом деле обыгрывание человека никогда не было главной задачей этого искусственного интеллекта. Игры стали тренировочной площадкой для программ, которые могли бы решать реальные проблемы.
Сворачивание белков было такой проблемой для биологов на протяжении 50 лет. Большинство биологических процессов вращается вокруг белков, и форма белка определяет его функцию. Когда ученые узнают, как сворачивается белок, они смогут узнать, чему это помогает. То, как инсулин контролирует уровень сахара в крови, и то как антитела борются с коронавирусом, определяется структурой белка.
Ученые выявили более 200 миллионов белков, но структура известна лишь для части из них. Обычно структура исследуется в ходе кропотливой работы в лабораториях, которая отнимает годы. И хотя ученые намного продвинулись в решении этой проблемы, вывести структуру белка из его состава — непростая задача. Белки — это цепочки аминокислот, которые могут скручиваться и изгибаться в невероятном разнообразии форм: это единица с 300 нулями.
Чтобы узнать, как белки сворачиваются, исследователи DeepMind обучили свой алгоритм общедоступной базе данных, содержащей около 170 000 белковых последовательностей и их формы. При работе на эквиваленте от 100 до 200 графических процессоров y по современным меркам, скромная вычислительная мощность — обучение заняло несколько недель.
DeepMind испытал AlphaFold на «белковых олимпиадах» Casp (Критическая оценка прогнозирования структуры белка), которые проводятся раз в два года. Участники международного конкурса получают аминокислотные последовательности около 100 белков и должны их вычислить. Результаты команд, использующих компьютеры, сравниваются с результатами лабораторных работ.
AlphaFold не только превзошел другие компьютерные программы, но и достиг точности, сопоставимой с трудоемкими лабораторными методами. При ранжировании по всем проанализированным белкам AlphaFold получил средний балл 92,5 из 100, 90 баллов при этом эквивалентны экспериментальным методам.
Хассабис заявил, что в DeepMind уже начали предоставлять доступ к AlphaFold различным исследователям для их работ. Андрей Лупас, глава Института биологии развития имени Макса Планка в Тюбингене, Германия, рассказал, что институт уже использовал программу для определения структуры белка, которое не сдвигалось в течение десятилетий.
Джанет Торнтон, почетный директор Европейского института биоинформатики EMBL, расположенного рядом с Кембриджем, поведала, что уже и не надеялась на то, что проблема сворачивания белков будет решена при ее жизни. «Знание этих структур поможет нам понять, как мы работаем и функционируем», — отметила ученая.
Исследования будут продолжаться дальше. «Мы не понимали, насколько продвинулись в этой области, пока не увидели результаты Casp», — говорит Джон Джампер, исследователь из команды DeepMind. На следующем этапе ученые собираются выяснить, как белки объединяются в более крупные комплексы, и как они взаимодействуют с другими молекулами в живых организмах.
По материалам The Guardian