Вениамин Фишман
1.23K subscribers
406 photos
73 videos
26 files
164 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Ещё один вариант архитектуры для языковых моделей ДНК. Чем-то похоже на state space models. Статья:

https://arxiv.org/abs/2411.04165
Прекрасный доклад, в котором показано (вообще говоря далеко не в первый раз), что полно модных моделей для предсказания экспрессии, которые ничем не лучше (хуже!) усреднения по уже известным клеточным типам.
😁62
Вот эта идея давно у меня сидит в голове: почему бы в транскриптомных моделях, которые на входе используют эмбединг гена (вроде scGPT), не использовать эмбединг из днк? А то люди что только не берут - эмбединг белка, эмбединг текста с описанием гена...
👍10
Автобус для наработки вирусных частиц
😁37🤣11❤‍🔥1
Один из очень впечатляющих докладов на ICLR был о специализированной биологической модели, которая имеет доступ к >200 биологическим инструментам и базам данных. Эта модель может действовать как учёный — сама предлагает гипотезу, ставит эксперименты с данными или, если публичных данных недостаточно, пишет протоколы для лабораторной работы, анализирует полученные результаты, делает вывод подтвердилось ли гипотеза.

На днях авторы выложили несколько демок и открыли форму регистрации для тестирования этой модели:

https://www.actoslab.com/biomni
🤯14👍9🥴2❤‍🔥1
Прилетел на XI съезд Российского общества медицинских генетиков.

Уже и забыл как красив Питер!
👍18🥰53🔥2
Пока воспоминания свежи, короткий отчёт об ICLR и фото нашей делегации.

Основные тренды в биологических работах: - агенты (это когда одна нейросеть управляет другими, "агентами", у которых, как правило, есть возможности совершать какие-то действия - запускать софт , выходить в интернет, скачивать данные из публичных репозиториев и т.п.)
- предсказание эффектов пертурбаций - это когда есть какой-то параметр, измеряемый в норме и после определённого воздействия. Зная воздействие — нужно предсказать как изменится параметр. Типичный дизайн такого эксперимента — есть транскриптомные данные в норме и после обработки химическим агентом, нужно предсказать, как химический ген повлияет на экспрессию генов
- анализ медицинских изображений (например, выбор химиотерапии на основе анализа фотографий гистологических препаратов опухолей).
👍152🤗1
В целом, очень много интересных биологических работ, видно, что люди заинтересованы в решении биомедицинских задач. Хотя, к сожалению, лишь малая часть из них делается с пониманием особенностей биологических данных. Все больше работ в стиле кагл - мы что-то скачали с ncbi и давай перебирать архитектуры. А то, что эти данные сами по себе не очень, и никакие архитектуры этому не помогут - никто не разбирает. Из-за отсутствия биологической экспертизы и желания "выжать максимальный скор" много скрытых дата ликов (когда в модель в неявной форме подается информация о правильных ответах и ее метрики оказываются сильно завышенными).

Но, на мой взгляд, это нормально для такой новой и развивающейся области. Со временем вся шелуха отсеется, останутся только ценные работы.

И уже сейчас есть очень амбициозные и вдохновляющие проекты, как, например, biomni о которой я писал выше. Ясно, что всё это ещё нужно настраивать и дорабатывать, и не факт что в итоге всё получится. Но если что-то получится, это может стать большим прорывом в биологии.
👍214💯1
Встреча с друзьями из СПбГУ - как всегда приятно было видеть наших коллег, и как всегда уезжаю с презентом - лягушки xenopus tropicalis для будущих совместных исследований!
Forwarded from 🔬 Группа Лаборатории структуры и динамики клеточного ядра
Нашу лабораторию посетил Вениамин Фишман из института Цитологии и генетики СО РАН
30
😱8❤‍🔥6
На днях в журнале Genome Medicine вышла наша статья о детекции хромосомных перестроек с помощью метода Hi-C. Хочу немного рассказать об этой работе.

Хромосомные перестройки — это особый тип мутаций, связанный с перемещением крупных фрагментов ДНК. Обычно, когда мы говорим слово «мутация», представляется изменение какой-то отдельной буквы в ДНК. Однако хромосомные перестройки встречаются не менее часто и могут быть причиной различных заболеваний. Кстати, распространено ещё одно заблуждение: далеко не все мутации обязательно приводят к болезням. Чаще всего они являются нейтральными событиями, поэтому в медицинской генетике правильнее использовать термин «вариант». Таким образом, перед врачом-генетиком стоит сложная задача: найти все варианты в геноме пациента (как одиночные буквы, так и крупные хромосомные перестройки) и оценить их значение.

Я уже рассказывал в этом канале о методе Hi-C. Кратко напомню: это технология, основанная на секвенировании, которая позволяет определить, какие участки ДНК контактируют друг с другом. Если хотите почитать подробно - вот замечательная статья нашего аспиранта, Павла Сальникова, на биомолекуле. Ещё в наших первых исследованиях мы заметили, что Hi-C очень чувствителен к хромосомным перестройкам. Стоит участку ДНК переместиться в новое место генома, как он тут же меняет соседей, с которыми контактирует. Именно этим метод Hi-C выгодно отличается от обычного секвенирования, при котором узнать о «переезде» участка можно только прочитав стык перемещённого фрагмента с новым окружением. Изменения контактов же затрагивают миллионы букв ДНК, что делает метод Hi-C гораздо более чувствительным.

В нашей новой работе мы совместили технологию Hi-C с экзомным обогащением — популярным в медицинской генетике методом, который при секвенировании создает предпочтение белок-кодирующим областям генома. Нарушения именно в этих участках чаще всего приводят к болезням - таким образом, можно секвенировать меньше (и дешевле), получая больше информации о белок-кодирующих участках. Теперь у нас есть молекулярный инструмент, который одновременно показывает, какие буквы входят в кодирующие белки участки ДНК и как эти участки контактируют между собой в пространстве ядра. Таким образом, мы можем одновременно обнаруживать как перемещения крупных блоков ДНК, так и однобуквенные изменения.

В этом проекте мы сотрудничали почти с десятком медико-генетических центров России, в первую очередь с московским (МГНЦ) и томским (Томский НИМЦ). Благодаря такому масштабному сотрудничеству нам удалось протестировать разработанный метод на большой когорте пациентов. Мы обнаружили новые, ранее не описанные мутации. Самое главное — для нескольких пациентов это исследование наконец позволило найти причину их заболевания и завершить, как принято говорить у медиков, «диагностическую одиссею». Эти люди годами ждали своего диагноза, поскольку другие методы не могли выявить повреждения ДНК, ставшие причиной болезни.

Публикация стала результатом многолетней работы — начало проекту было положено ещё в 2018 году. И статья, заслуженно, вышла в престижном журнале (IF > 10). Но самое главное: я очень надеюсь, что мы не закончим эту работу просто публикацией «ещё одной отчётной статьи». Научная часть проекта завершена, однако мы готовы к сотрудничеству с врачами и медицинскими центрами. На базе нашего клинического подразделения уже сейчас есть возможность сделать эти генетические исследования платно. Также мы работаем над тем, чтобы получить квоты ВМП и проводить подобные исследования бесплатно для пациентов, которым это необходимо.
🔥44👏105
Forwarded from BLUE SKY RESEARCH
🙌🙌🙌🙌 Подведены итоги последнего этапа конкурса Blue Sky Research

Победителями стали две команды:

🔵Проект BSR-2024-16 — Разработка генератора последовательностей термостабильных белков с помощью искусственного интеллекта.
Сколковский институт науки и технологий (г. Москва)

Команда: Марина Пак, Илья Шаров, Дарья Фролова.

🔵Проект BSR-2024-42 — Разработка ПО для улучшения чувствительности и специфичности детекции CNV в данных секвенирования.
ИЦиГ СО РАН совместно с научно-исследовательским институтом AIRI (г. Москва, г. Новосибирск)

Команда: Вениамин Фишман, Андрей Попов, Алексей Иванов.

Подробнее на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏12
Вместе со студенатами Алексеем Ивановым (НГУ, ИЦиГ) и Андреем Поповым (Сколтех, AIRI), приняли участие в конкурсе Blue Sky Research. Ребята молодцы и, практически самостоятельно, сделали интересный проект - написали софт для детекции хромосомных перестроек по результатам NGS-секвенирования биоптатов эмбрионов человека.

Этот проект - часть большой работы по созданию новой технологии преимплантационного тестирования эмбрионов, которую мы ведем уже несколько лет. Надеюсь, в ближайшее время мы выпустим препринт где подробно опишем этот метод.
🔥395🏆3👍2
Ученые ИЦиГ СО РАН избраны членами-корреспондентами РАН

29-30 мая 2025 года в Москве прошло Общее собрание членов Российской Академии наук. По традиции, одним из пунктов повестки собрания стало избрание новых членов. В их чиле оказались и сотрудники Института цитологии и генетики СО РАН.

Членами-корреспондентами РАН избраны Елена Артёмовна Салина и Владимир Сергеевич Науменко.

Также членом-корреспондентом РАН стала руководитель ФИЦ «Всероссийский институт генетических ресурсов растений имени Н.И. Вавилова (ВИР)» Елена Константиновна Хлёсткина, ранее много лет проработавшая в ИЦиГ СО РАН.
Поздравляем всех новоизбранных членов Академии наук и желаем им новых выдающихся научных результатов!
🔥17
Мышка вяжет ДНК | ИЦиГ
Photo
А ещё у соседей, в ихбфм со ран, в член-корреспонденты избран Никита Александрович Кузнецов, а Дмитрий Олегович Жарков получил позицию академика.
🔥25
Грант открыт 2го июня, дедлайн подачи заявок - до конца июня, результаты будут летом, дадут до 10 млн на полгода, за полгода нужно:
- сделать работу
- написать по результатам статьи
- успеть их опубликовать
- написать отчет
- потратить деньги.

Наверное, если очень постараться и иметь большие заделы (в виде уже поданной в печать статьи) такое можно технически реализовать, но на нормальное финансирование науки это не похоже - за полгода даже реактивы прийти не успеют.

А был бы нормальный конкурс - может и написал бы, грант со странами Латинской Америки, у нас там есть хорошее партнерство с Бразильцами.

https://promote.budget.gov.ru/public/minfin/selection/view/cd77d428-a388-4847-b041-32b423db71a6?showBackButton=true&competitionType=0&tab=1
🤯8😢7🤡4😱3🔥1
Ужас! Вот, казалось бы, доктор наук, занимаюсь уже много лет геномикой. Сегодня решил проверить ответ на простой вопрос - являются ли повторы в геноме человека GC-богатыми или GC-бедными участками. Взял для примера самый распространенный повтор - Alu. И что вы думаете?
5