Bayesian Noise

Важное достижение AI в биологии, была решена задача над которой работали 50 лет: задача фолдинга белка.

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

В чём заключается задача?

В 1972-м году Christian Anfinsen в своей речи постулировал теорию, что аминокислотная последовательность белка должна полностью определять его структуру. Эта гипотеза вызвала пятидесятилетний поиск возможности предсказать трехмерную структуру белка, основываясь исключительно на его одномерной аминокислотной последовательности, в качестве дополнительной альтернативы этим дорогостоящим и трудоемким экспериментальным методам.

Другими словами, по известной аминокислотной последовательности нужно восстановить 3D структуру белка.

Почему это важно?

Современные способы исследования белков основаны на методах требующих дорогостоящего оборудования, которое могут себе позволить только несколько лабораторий в мире.

Предсказание белков позволит ускорить понимание болезней и создание новых лекарств, но не только, в целом это важная фундаментальная задача для биологии.

Я плохо разбираюсь в биологии, но думаю это можно сравнить с началом использования компьютерного моделирования в инженерии и производстве материалов. Математические модели позволили значительно ускорить эксперименты и сократить расходы. Только представьте, вместо долгих натурных экспериментов со сложным оборудованием, можно построить точную математическую модель и изучить её свойства.

Вот с белками до недавнего времени нельзя было обойтись компьютерной моделью, теперь можно.

В чём сложность?

Основная сложность, это вариативность возможных способов, как белки могут свернуться. Levinthal определил сложность задачи, как 10^300. В очередной раз AI показал эффективность в решении вычислительно сложных задач.

В чём прорыв?

Была создана end-to-end модель, которая почти в 2 раза увеличивает точность предсказаний и почти достигает качества экспериментальных подходов.

Для оценки алгоритмов используется Global Distance Test, который измеряется в диапозоне 0—100
Точность экспериментальных подходов оценивается в 90
Текущая модель набирает — 87
Предыдущая модель от deepmind была на уровне — 60
А другие решения не превосходили — 40

#ai

Deepmind

AlphaFold: a solution to a 50-year-old grand challenge in biology

Proteins are essential to life, supporting practically all its functions. They are large complex molecules, made up of chains of amino acids, and what a protein does largely depends on its unique 3D structure. Figuring out what shapes proteins fold into is…

111 viewsIhar Nestsiarenia, 19:54