Вениамин Фишман
1.23K subscribers
406 photos
73 videos
26 files
164 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Встреча с друзьями из СПбГУ - как всегда приятно было видеть наших коллег, и как всегда уезжаю с презентом - лягушки xenopus tropicalis для будущих совместных исследований!
Forwarded from 🔬 Группа Лаборатории структуры и динамики клеточного ядра
Нашу лабораторию посетил Вениамин Фишман из института Цитологии и генетики СО РАН
30
😱8❤‍🔥6
На днях в журнале Genome Medicine вышла наша статья о детекции хромосомных перестроек с помощью метода Hi-C. Хочу немного рассказать об этой работе.

Хромосомные перестройки — это особый тип мутаций, связанный с перемещением крупных фрагментов ДНК. Обычно, когда мы говорим слово «мутация», представляется изменение какой-то отдельной буквы в ДНК. Однако хромосомные перестройки встречаются не менее часто и могут быть причиной различных заболеваний. Кстати, распространено ещё одно заблуждение: далеко не все мутации обязательно приводят к болезням. Чаще всего они являются нейтральными событиями, поэтому в медицинской генетике правильнее использовать термин «вариант». Таким образом, перед врачом-генетиком стоит сложная задача: найти все варианты в геноме пациента (как одиночные буквы, так и крупные хромосомные перестройки) и оценить их значение.

Я уже рассказывал в этом канале о методе Hi-C. Кратко напомню: это технология, основанная на секвенировании, которая позволяет определить, какие участки ДНК контактируют друг с другом. Если хотите почитать подробно - вот замечательная статья нашего аспиранта, Павла Сальникова, на биомолекуле. Ещё в наших первых исследованиях мы заметили, что Hi-C очень чувствителен к хромосомным перестройкам. Стоит участку ДНК переместиться в новое место генома, как он тут же меняет соседей, с которыми контактирует. Именно этим метод Hi-C выгодно отличается от обычного секвенирования, при котором узнать о «переезде» участка можно только прочитав стык перемещённого фрагмента с новым окружением. Изменения контактов же затрагивают миллионы букв ДНК, что делает метод Hi-C гораздо более чувствительным.

В нашей новой работе мы совместили технологию Hi-C с экзомным обогащением — популярным в медицинской генетике методом, который при секвенировании создает предпочтение белок-кодирующим областям генома. Нарушения именно в этих участках чаще всего приводят к болезням - таким образом, можно секвенировать меньше (и дешевле), получая больше информации о белок-кодирующих участках. Теперь у нас есть молекулярный инструмент, который одновременно показывает, какие буквы входят в кодирующие белки участки ДНК и как эти участки контактируют между собой в пространстве ядра. Таким образом, мы можем одновременно обнаруживать как перемещения крупных блоков ДНК, так и однобуквенные изменения.

В этом проекте мы сотрудничали почти с десятком медико-генетических центров России, в первую очередь с московским (МГНЦ) и томским (Томский НИМЦ). Благодаря такому масштабному сотрудничеству нам удалось протестировать разработанный метод на большой когорте пациентов. Мы обнаружили новые, ранее не описанные мутации. Самое главное — для нескольких пациентов это исследование наконец позволило найти причину их заболевания и завершить, как принято говорить у медиков, «диагностическую одиссею». Эти люди годами ждали своего диагноза, поскольку другие методы не могли выявить повреждения ДНК, ставшие причиной болезни.

Публикация стала результатом многолетней работы — начало проекту было положено ещё в 2018 году. И статья, заслуженно, вышла в престижном журнале (IF > 10). Но самое главное: я очень надеюсь, что мы не закончим эту работу просто публикацией «ещё одной отчётной статьи». Научная часть проекта завершена, однако мы готовы к сотрудничеству с врачами и медицинскими центрами. На базе нашего клинического подразделения уже сейчас есть возможность сделать эти генетические исследования платно. Также мы работаем над тем, чтобы получить квоты ВМП и проводить подобные исследования бесплатно для пациентов, которым это необходимо.
🔥44👏105
Forwarded from BLUE SKY RESEARCH
🙌🙌🙌🙌 Подведены итоги последнего этапа конкурса Blue Sky Research

Победителями стали две команды:

🔵Проект BSR-2024-16 — Разработка генератора последовательностей термостабильных белков с помощью искусственного интеллекта.
Сколковский институт науки и технологий (г. Москва)

Команда: Марина Пак, Илья Шаров, Дарья Фролова.

🔵Проект BSR-2024-42 — Разработка ПО для улучшения чувствительности и специфичности детекции CNV в данных секвенирования.
ИЦиГ СО РАН совместно с научно-исследовательским институтом AIRI (г. Москва, г. Новосибирск)

Команда: Вениамин Фишман, Андрей Попов, Алексей Иванов.

Подробнее на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏12
Вместе со студенатами Алексеем Ивановым (НГУ, ИЦиГ) и Андреем Поповым (Сколтех, AIRI), приняли участие в конкурсе Blue Sky Research. Ребята молодцы и, практически самостоятельно, сделали интересный проект - написали софт для детекции хромосомных перестроек по результатам NGS-секвенирования биоптатов эмбрионов человека.

Этот проект - часть большой работы по созданию новой технологии преимплантационного тестирования эмбрионов, которую мы ведем уже несколько лет. Надеюсь, в ближайшее время мы выпустим препринт где подробно опишем этот метод.
🔥395🏆3👍2
Ученые ИЦиГ СО РАН избраны членами-корреспондентами РАН

29-30 мая 2025 года в Москве прошло Общее собрание членов Российской Академии наук. По традиции, одним из пунктов повестки собрания стало избрание новых членов. В их чиле оказались и сотрудники Института цитологии и генетики СО РАН.

Членами-корреспондентами РАН избраны Елена Артёмовна Салина и Владимир Сергеевич Науменко.

Также членом-корреспондентом РАН стала руководитель ФИЦ «Всероссийский институт генетических ресурсов растений имени Н.И. Вавилова (ВИР)» Елена Константиновна Хлёсткина, ранее много лет проработавшая в ИЦиГ СО РАН.
Поздравляем всех новоизбранных членов Академии наук и желаем им новых выдающихся научных результатов!
🔥17
Мышка вяжет ДНК | ИЦиГ
Photo
А ещё у соседей, в ихбфм со ран, в член-корреспонденты избран Никита Александрович Кузнецов, а Дмитрий Олегович Жарков получил позицию академика.
🔥25
Грант открыт 2го июня, дедлайн подачи заявок - до конца июня, результаты будут летом, дадут до 10 млн на полгода, за полгода нужно:
- сделать работу
- написать по результатам статьи
- успеть их опубликовать
- написать отчет
- потратить деньги.

Наверное, если очень постараться и иметь большие заделы (в виде уже поданной в печать статьи) такое можно технически реализовать, но на нормальное финансирование науки это не похоже - за полгода даже реактивы прийти не успеют.

А был бы нормальный конкурс - может и написал бы, грант со странами Латинской Америки, у нас там есть хорошее партнерство с Бразильцами.

https://promote.budget.gov.ru/public/minfin/selection/view/cd77d428-a388-4847-b041-32b423db71a6?showBackButton=true&competitionType=0&tab=1
🤯8😢7🤡4😱3🔥1
Ужас! Вот, казалось бы, доктор наук, занимаюсь уже много лет геномикой. Сегодня решил проверить ответ на простой вопрос - являются ли повторы в геноме человека GC-богатыми или GC-бедными участками. Взял для примера самый распространенный повтор - Alu. И что вы думаете?
5
Раньше я публиковал вакансии для студентов в группе в ВК, но в последнее время активность там снизилась, а в этом канале много студентов НГУ и других ВУЗов. Так что продолжу публиковать вакансии от коллег тут.
Forwarded from Александра
Сектор системной биологии морфогенеза растений ИЦиГ СО РАН ищет студента второго курса бакалавриата ФЕН НГУ для работы по выполнению дипломной работы.
Вы научитесь:
-Стерильной работе с растениями и бактериями
-Выделению нуклеиновых кислот
-Анализу экспрессии генов методом RT-qPCR
-Всем этапами молекулярного клонирование генов и трансформации Arabidopsis thaliana
-Микроскопии
-Работе с биологическими базами данных

Помимо экспериментальной работы, мы поможем вам освоить правила написания научных текстов и подготовки презентаций для успешного выступления на кафедре и научных конференциях.

От вас требуется трудолюбие, инициативность, ответственность и хорошее уровень школьной генетики и молекулярной биологии.
По вопросам писать на почту: a.sidorenko1@g.nsu.ru
9
Наш инструмент для моделирования Hi-C-контактов хромосомных перестроек Charm опубликован в NAR Genomics and Bioinformatics!

Если вы хотите понять, как на Hi-C карте будут выглядеть делеции, инверсии, транслокации или другие перестройки — попробуйсте Charm.

Подходит для:
— моделирования влияния SV на 3D-архитектуру генома
— генерации синтетических данных
— обучения и демонстраций

📄 Статья: https://academic.oup.com/nargab/article/7/2/lqaf081/8169141
💻 гитхаб: https://github.com/genomech/charm

П.С. Это была статья, в которой мы прошли рекордное для меня число раундов рецензирования у одних и тех же рецензентов - 5 ревизий.
👏27🔥18🎉2👍1
Вышла статья
https://github.com/google-deepmind/alphagenome

Пока не было времени прям внимательно прочитать, но проглядел по общим бенчмаркам.
Первое — круто, что люди потратили время на обучение действительно интересной штуки, идеи которой вертятся в сообществе давно. Ну и дали местами наверное неприятный ответ на часть надежд. Об этом далее

Второе — модель хоть и принимает на вход 1Mb, на самом деле still не видит далекие эффекты (о чем пишет и в пресс-ревью Anshul Kundaje). Так как модели при этом карты контактов пытается предсказать и как-то предсказывает — возникает вопрос, а точно ли их включение в обучение подобных моделей хотя бы чуть помогает.

Третье — с предсказанием эффектов регуляторных вариантов все тоже ну просто ок. То есть они не хуже Borzoi. Ок. На самом деле они пишут, что лучше, но тут надо учитывать сразу несколько моментов — Borzoi не идеал подобного предсказания. Они указывают значения "relative improvement". В реальных цифрах более очевидно тем, кто работал с этими данными, что эти изменения меньше дисперсии качества моделей, обученных буквально немного иначе (сиды поменять).

Четвертое — где-то эта штука действительно улучшает качество. Я не особо удивлен насчет ORCA кстати с предсказанием контактов — из той статьи было видно, что качество до конца не выжали. Круто, что улучшается предсказание RNA-Seq coverage и целиком на гене. действительно сильно лучше борзого для задачи ничего нет, а он справляется плохо. Возможно, в этом случае этот improvement поможет что-то новое делать (пока не показали). И точно интересно понять, как авторы этого добились. Помогло ли огромное окно, ибо гены большие? Или секрет в другом месте.


Пятое — качество улучшается в сравнении с популярными моделями. А не SOTA. Как я уже говорил, достаточно спорно насколько Borzoi SOTA, но это хоть дискутабельно. В задаче предсказания доступности хроматина тот же ChromBPNet бьётся, но что важно понимать — ChromBPNet голый король — это хорошая модель для старта но все заявления о ее SOTAшности — ну неправда. Можно взять две свертки + LSTM и смочь предсказывать то же покрытие сильно лучше ChromBPNet (relative improvement будет 4% с использованием меньшего числа параметров). И еще один момент — опять же, в этой задаче есть большая дисперсия качества в зависимости от оптимизируемой во время обучения. метрики. И сырые скоры ну не всегда будут говорить о том, насколько модель лучше. Потому я бы сказал, что в большинстве случаев модель не хуже имеющихся решений. Решая задачу сразу.

Шестое — Предсказания модели нельзя юзать для обучения своих моделей (по соглашению). Given уже сказанное, получается, что она полезна чтобы сейчас что-то быстро предсказать, но при этом для дальнейших исследований достаточно бесполезна (linreg даже не построишь). При этом в почти каждой области, которой эта штука занимается, есть альтернатива, которая таких ограничений не имеет, а работает не хуже или не сильно хуже.

Седьмое — Модель сравнительно небольшая. В ней 450млн параметров, что по идее должно позволить ее юзать на не очень дорогих серверах (когда будут веса или кто-то их воспроизведет). В то же время это еще в 2 раза больше, чем у Enformer. Но: она более сложным образом устроена, более сложным образом учится. А выигрыш на многих конкретных тасках, как я уже писал, либо укладывается в дисперсию, либо не лучше. (Кроме нескольких тасков)
На основе этого кажется, нужно прям сильно иначе на все эти задачи смотреть, чтобы действительно дальше развивать это дело. Возможно, нужны совсем другого типа данные.

Восьмое. Не советую втупую копировать оттуда решения —там есть странные приколы типо аугментации искуственными мутациями, что я не уверен, что помогает. Даже если согласно их статье помогает — мы же видим, что на тасках нет. Ну и традиционно огромное окно в 1Мб выглядит странным — у борзого в два раза меньше, работают на уровне с ним модели с окном в 4к нуклеотидов (тот же BPNet). Опять, точно нам нужно такое окно? Точно нужно его пихать так почти влоб, как это делают авторы?
4👍4🤔2👎1
Сам ещё не читал, кину ссылку от Димы на новую модельку для анализа ДНК
science.ads7373.pdf
3.9 MB
Новая модель, которая предсказывает эффект вариантов в промоторах.

Our estimates suggest that promoter variation accounts for 6% of the genetic burden associated with rare diseases.

Интересно было бы погонять на датасетах МГНЦ/Томского НИМЦ.
🔥9
Forwarded from Биомолекула
Конкурс «Био|Мол|Текст» — 15 лет вдохновения и науки🧬
Дорогие друзья, мы рады сообщить, что в юбилейный раз запускаем конкурс «Био|Мол|Текст»-2025/2026 на лучшую научно-популярную работу о современной биологии! Если вы начинающий или уже состоявшийся популяризатор науки, приглашаем вас поделиться своими идеями, рисунками или видеоработами на любимую тему.

🔥 В этом году мы готовы удивить вас новой спецноминацией от Центрального университета — «Искусственный интеллект в биологии», которую судят два настоящих гуру в этой области: Михаил Бурцев и Александр Горбань; а фавориты получат уникальную возможность посещать семинары профессора Горбаня, пройти отбор на дипломную или научную работу, получить консультации специалистов Института AIRI и присоединиться по фаст-треку к проектам AIRI — AGI_Med и AIDD.

Генеральный партнер конкурса — биотехнологическая компания BIOCAD — вновь поддержит номинацию «Академия & Бизнес». Номинацию «Свободная тема», как всегда, поддерживает SkyGen. Ну а поддержку «Школьной» номинации окажет Благотворительный фонд «Белая лилия». Помимо этого уже несколько лет с нами Диаэм и наш книжный партнер — издательство «Альпина нон-фикшн». Ну и наконец, партнер награждения — музей БИОТЕХ. Помимо этого, мы вручим два спецприза: «Огненный дебют» и Honoris Causa.

📅 Работы принимаются с 1 июля по 1 декабря 2025 года включительно. Результаты будут объявлены на награждении победителей в апреле 2026 года и опубликованы на сайте biomolecula.ru.

🌍 Участвовать может каждый — неважно, сколько вам лет или какой у вас опыт. Главное — желание создавать и делиться наукой! Мы поможем каждому участнику пройти первичный отбор и доработать статью до публикации. 🎓

🔍 Тематики конкурса: молекулярная биология, биомедицина, био- и нанотехнологии, иммунология, вирусология, микробиология и, конечно, новые горизонты ИИ в биологии!

Хотите обсудить тему своей работы? Проконсультируйтесь с нами по ссылке 💬

📥 Подать статью можно здесь. Подробную информацию о конкурсе читайте на сайте.

Позвольте вашим идеям зажечь мир науки и вдохновить других. Мы ждем именно вас! 💡
#Биомолтекст2025_инфо
Начинаем первый эксперимент по single cell транскриптомике на базе нашей лаборатории ИЦиГ. Спасибо хеликону, который выделил нам реактивы и организовал школу, чтобы показать протокол приготовления образцов.
👍40🔥12