Техножнец

Целью обучения нейронной сети для Drug Discovery, а именно для задачи сворачивания белка, послужила разработка превосходных шаблонов. 🧬 DEMONDRUG: предсказание структуры белков без использования нейросетей и GPU (интеграция нейронной сети планируется в ближайшем…

🧬 Как свернуть белок на ноутбуке. Простыми словами.

Слушайте.

Почему это важно: лекарство — это маленькая молекула, которая прилипает к белку в нужном месте и блокирует его (или наоборот включает). А чтобы понять куда прилипать — надо знать форму белка. Без формы — стрельба вслепую.

В чём была проблема

Прочитать последовательность аминокислот в белке — легко. А вот понять как эта цепочка скрутится в клубок — ад. Возможных форм астрономическое количество. Десятилетия задача считалась нерешаемой.

В 2020 пришёл AlphaFold от Google DeepMind и решил её. Получил Нобелевку по химии в 2024.

Но цена вопроса:

93 миллиона параметров нейросети
GPU A100 (карта за $10–15K)
Дата-центр, облако, всё дорого

Потом пришёл ESMFold от Meta — 15 миллиардов параметров. Ещё точнее, ещё дороже.

Что сделал я

Ноль нейросетей. Ноль GPU. Обычный процессор ноутбука. 8 мегабайт обучающих данных (одна фотка с телефона весит больше).
Точность: 2.02 ангстрема в среднем на 19 белках. На шести белках — меньше 1 ангстрема, это уровень AlphaFold. Для понимания: 1 Å = одна десятимиллиардная метра, размер атома. Когда говорят «sub-1Å» — это значит «попал в атом».

Что ещё умеет пайплайн

Это не только фолдинг. Это полный drug discovery стек:

Поиск карманов на белке (куда лекарство приклеить) — 9 из 9 на тесте
Докинг — проверка «подходит ли молекула к карману» — 7 из 7
ADMET — предсказание токсичности и всасывания будущего лекарства — 77% точности
Скрининг — могу проверить 677 000 молекул в секунду на одном CPU
MD-DEMON — отличаю «включающие» молекулы от «выключающих» по характеру колебаний

Где честно сливаю

Не на всех белках хорошо. Где есть похожий белок в базе — точность под 1 Å. Где нет — на крупных цепях (>100 остатков) проседаю до 3–5 Å. Ubiquitin: 3.01 Å. AlphaFold там делает 0.8. Я пока проигрываю в 4 раза на сложных случаях. Но это первая версия без нейросетей вообще. И она уже считает на ноутбуке то, для чего раньше нужен был совсем другой базар.

Зачем это людям
Если такое масштабируется — разработка лекарств переедет с серверных стоек на ноутбуки. Лаборатория в Уганде или в Усть-Хренальске сможет скринить миллионы молекул без подписки на облако за $50K в месяц. Это не теория. Это уже работает. Прямо сейчас.

И ВОТ ДЕЛАЮ С ПОМОЩТЮ НЕЙРОНА POPOVICH ПОСЛЕДНИЙ ШАГ! Совмещение моего пайплайна с нейроном = идеальная схема. Убирается клейм - Без нейросетей. Да! Нейросеть будет из одного нейрона, НО! Тут уже в институт филологический пора всем записываться на занятия и делать дела.

Техножнец всё делает на свои средства. 🥶
Если есть желание поддержать его, то вот ссылки: 🫡

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥47❤12👍5🤔1🕊1

1.69K viewsedited 13:24