Вениамин Фишман

Alu-повторы

Anonymous Poll

22%

Существенно беднее GC, чем в среднем геном

46%

Существенно богаче GC, чем в среднем геном

33%

Имеются GC-состав примерно равный среднему по геному

166 voters1.5K views04:03

Вениамин Фишман

Раньше я публиковал вакансии для студентов в группе в ВК, но в последнее время активность там снизилась, а в этом канале много студентов НГУ и других ВУЗов. Так что продолжу публиковать вакансии от коллег тут.

1.01K views11:48

Вениамин Фишман

Forwarded from Александра

Сектор системной биологии морфогенеза растений ИЦиГ СО РАН ищет студента второго курса бакалавриата ФЕН НГУ для работы по выполнению дипломной работы.
Вы научитесь:
-Стерильной работе с растениями и бактериями
-Выделению нуклеиновых кислот
-Анализу экспрессии генов методом RT-qPCR
-Всем этапами молекулярного клонирование генов и трансформации Arabidopsis thaliana
-Микроскопии
-Работе с биологическими базами данных

Помимо экспериментальной работы, мы поможем вам освоить правила написания научных текстов и подготовки презентаций для успешного выступления на кафедре и научных конференциях.

От вас требуется трудолюбие, инициативность, ответственность и хорошее уровень школьной генетики и молекулярной биологии.
По вопросам писать на почту: a.sidorenko1@g.nsu.ru

❤9

1.59K views11:48

Вениамин Фишман

Наш инструмент для моделирования Hi-C-контактов хромосомных перестроек Charm опубликован в NAR Genomics and Bioinformatics!

Если вы хотите понять, как на Hi-C карте будут выглядеть делеции, инверсии, транслокации или другие перестройки — попробуйсте Charm.

Подходит для:
— моделирования влияния SV на 3D-архитектуру генома
— генерации синтетических данных
— обучения и демонстраций

📄 Статья: https://academic.oup.com/nargab/article/7/2/lqaf081/8169141
💻 гитхаб: https://github.com/genomech/charm

П.С. Это была статья, в которой мы прошли рекордное для меня число раундов рецензирования у одних и тех же рецензентов - 5 ревизий.

OUP Academic

Charm is a flexible pipeline to simulate chromosomal rearrangements on Hi-C-like data Open Access

Abstract. Identifying structural variants (SVs) remains a pivotal challenge within genomic studies. The recent advent of chromosome conformation capture (3

👏27🔥18🎉2👍1

1.32K views04:50

Вениамин Фишман

Forwarded from Задумчивая крыса

Вышла статья
https://github.com/google-deepmind/alphagenome

Пока не было времени прям внимательно прочитать, но проглядел по общим бенчмаркам.
Первое — круто, что люди потратили время на обучение действительно интересной штуки, идеи которой вертятся в сообществе давно. Ну и дали местами наверное неприятный ответ на часть надежд. Об этом далее

Второе — модель хоть и принимает на вход 1Mb, на самом деле still не видит далекие эффекты (о чем пишет и в пресс-ревью Anshul Kundaje). Так как модели при этом карты контактов пытается предсказать и как-то предсказывает — возникает вопрос, а точно ли их включение в обучение подобных моделей хотя бы чуть помогает.

Третье — с предсказанием эффектов регуляторных вариантов все тоже ну просто ок. То есть они не хуже Borzoi. Ок. На самом деле они пишут, что лучше, но тут надо учитывать сразу несколько моментов — Borzoi не идеал подобного предсказания. Они указывают значения "relative improvement". В реальных цифрах более очевидно тем, кто работал с этими данными, что эти изменения меньше дисперсии качества моделей, обученных буквально немного иначе (сиды поменять).

Четвертое — где-то эта штука действительно улучшает качество. Я не особо удивлен насчет ORCA кстати с предсказанием контактов — из той статьи было видно, что качество до конца не выжали. Круто, что улучшается предсказание RNA-Seq coverage и целиком на гене. действительно сильно лучше борзого для задачи ничего нет, а он справляется плохо. Возможно, в этом случае этот improvement поможет что-то новое делать (пока не показали). И точно интересно понять, как авторы этого добились. Помогло ли огромное окно, ибо гены большие? Или секрет в другом месте.

Пятое — качество улучшается в сравнении с популярными моделями. А не SOTA. Как я уже говорил, достаточно спорно насколько Borzoi SOTA, но это хоть дискутабельно. В задаче предсказания доступности хроматина тот же ChromBPNet бьётся, но что важно понимать — ChromBPNet голый король — это хорошая модель для старта но все заявления о ее SOTAшности — ну неправда. Можно взять две свертки + LSTM и смочь предсказывать то же покрытие сильно лучше ChromBPNet (relative improvement будет 4% с использованием меньшего числа параметров). И еще один момент — опять же, в этой задаче есть большая дисперсия качества в зависимости от оптимизируемой во время обучения. метрики. И сырые скоры ну не всегда будут говорить о том, насколько модель лучше. Потому я бы сказал, что в большинстве случаев модель не хуже имеющихся решений. Решая задачу сразу.

Шестое — Предсказания модели нельзя юзать для обучения своих моделей (по соглашению). Given уже сказанное, получается, что она полезна чтобы сейчас что-то быстро предсказать, но при этом для дальнейших исследований достаточно бесполезна (linreg даже не построишь). При этом в почти каждой области, которой эта штука занимается, есть альтернатива, которая таких ограничений не имеет, а работает не хуже или не сильно хуже.

Седьмое — Модель сравнительно небольшая. В ней 450млн параметров, что по идее должно позволить ее юзать на не очень дорогих серверах (когда будут веса или кто-то их воспроизведет). В то же время это еще в 2 раза больше, чем у Enformer. Но: она более сложным образом устроена, более сложным образом учится. А выигрыш на многих конкретных тасках, как я уже писал, либо укладывается в дисперсию, либо не лучше. (Кроме нескольких тасков)
На основе этого кажется, нужно прям сильно иначе на все эти задачи смотреть, чтобы действительно дальше развивать это дело. Возможно, нужны совсем другого типа данные.

Восьмое. Не советую втупую копировать оттуда решения —там есть странные приколы типо аугментации искуственными мутациями, что я не уверен, что помогает. Даже если согласно их статье помогает — мы же видим, что на тасках нет. Ну и традиционно огромное окно в 1Мб выглядит странным — у борзого в два раза меньше, работают на уровне с ним модели с окном в 4к нуклеотидов (тот же BPNet). Опять, точно нам нужно такое окно? Точно нужно его пихать так почти влоб, как это делают авторы?

❤4👍4🤔2👎1

1.25K views16:46

Вениамин Фишман

Сам ещё не читал, кину ссылку от Димы на новую модельку для анализа ДНК

1.28K viewsedited 16:46

Вениамин Фишман

science.ads7373.pdf

3.9 MB

Новая модель, которая предсказывает эффект вариантов в промоторах.

Our estimates suggest that promoter variation accounts for 6% of the genetic burden associated with rare diseases.

Интересно было бы погонять на датасетах МГНЦ/Томского НИМЦ.

🔥9

1.38K views06:30

Вениамин Фишман

Forwarded from Биомолекула

Конкурс «Био|Мол|Текст» — 15 лет вдохновения и науки🧬
Дорогие друзья, мы рады сообщить, что в юбилейный раз запускаем конкурс «Био|Мол|Текст»-2025/2026 на лучшую научно-популярную работу о современной биологии! Если вы начинающий или уже состоявшийся популяризатор науки, приглашаем вас поделиться своими идеями, рисунками или видеоработами на любимую тему.

🔥 В этом году мы готовы удивить вас новой спецноминацией от Центрального университета — «Искусственный интеллект в биологии», которую судят два настоящих гуру в этой области: Михаил Бурцев и Александр Горбань; а фавориты получат уникальную возможность посещать семинары профессора Горбаня, пройти отбор на дипломную или научную работу, получить консультации специалистов Института AIRI и присоединиться по фаст-треку к проектам AIRI — AGI_Med и AIDD.

Генеральный партнер конкурса — биотехнологическая компания BIOCAD — вновь поддержит номинацию «Академия & Бизнес». Номинацию «Свободная тема», как всегда, поддерживает SkyGen. Ну а поддержку «Школьной» номинации окажет Благотворительный фонд «Белая лилия». Помимо этого уже несколько лет с нами Диаэм и наш книжный партнер — издательство «Альпина нон-фикшн». Ну и наконец, партнер награждения — музей БИОТЕХ. Помимо этого, мы вручим два спецприза: «Огненный дебют» и Honoris Causa.

📅 Работы принимаются с 1 июля по 1 декабря 2025 года включительно. Результаты будут объявлены на награждении победителей в апреле 2026 года и опубликованы на сайте biomolecula.ru.

🌍 Участвовать может каждый — неважно, сколько вам лет или какой у вас опыт. Главное — желание создавать и делиться наукой! Мы поможем каждому участнику пройти первичный отбор и доработать статью до публикации. 🎓

🔍 Тематики конкурса: молекулярная биология, биомедицина, био- и нанотехнологии, иммунология, вирусология, микробиология и, конечно, новые горизонты ИИ в биологии!

Хотите обсудить тему своей работы? Проконсультируйтесь с нами по ссылке 💬

📥 Подать статью можно здесь. Подробную информацию о конкурсе читайте на сайте.

Позвольте вашим идеям зажечь мир науки и вдохновить других. Мы ждем именно вас! 💡✨
#Биомолтекст2025_инфо

1.01K views16:31

Вениамин Фишман

Биомолекула

Конкурс «Био|Мол|Текст» — 15 лет вдохновения и науки🧬 Дорогие друзья, мы рады сообщить, что в юбилейный раз запускаем конкурс «Био|Мол|Текст»-2025/2026 на лучшую научно-популярную работу о современной биологии! Если вы начинающий или уже состоявшийся популяризатор…

Всем любителям эпистолярного жанра очень советую принять участие! В этом году есть темы близкие мне, связанные с ИИ в биологии, интересно будет почитать работы.

Кстати, наши студенты уже когда-то становились призерами конкурсов биомолекулы

biomolecula.ru

Павел Сальников | «Биомолекула»

Павел Сальников. Страничка на сайте «Биомолекула»

🔥9❤4🥰1

1.28K views16:33

Вениамин Фишман

Начинаем первый эксперимент по single cell транскриптомике на базе нашей лаборатории ИЦиГ. Спасибо хеликону, который выделил нам реактивы и организовал школу, чтобы показать протокол приготовления образцов.

👍40🔥12

1.62K views05:33

Вениамин Фишман

Очень удивительно для текущей ситуации, но правительство Швейцарии объявило конкурс грантов на краткосрочные (до года) стажировки для молодых учёных из РФ. Размер стипендии, правда, очень скромный (около 2000 долларов, для Швейцарии, по моим представлениям…

Аспирантка нашей научной группы стала победителем стипендии правительства Швейцарии, о которой я писал в посте от 2 июля 2024 года, и получила возможность пройти стажировку в ведущей лаборатории по тематике 3D-организации генома.

Очень радует, что даже сейчас сохраняется возможность для научных обменов. Это не только способ сделать интересное исследование, но и возможность наладить новые связи и научиться современным методам.

🔥73❤11👍1

1.58K viewsedited 05:21

Вениамин Фишман

Нашлось на просторах интернета

😁59👏2❤1

1.38K views01:51

Вениамин Фишман

science.ads7373.pdf

Пока летел в самолёте смог нормально прочитать статью о новом инструменте от илюмина для анализа промотеров. Работа на самом деле очень хорошая, особенно с точки зрения аккуратности в подготовке данных и интерпретации модели.
Меня впечатлили 2 момента.

1.01K viewsedited 15:29

Вениамин Фишман

Во-первых, результаты модели лучше коррелируют с экспериментальными данными по анализу транскрипции, чем MPRA-эксперимент, в котором тестируют те же варианты. В какой-то степени это объяснимо, потому что модель видит большой регион вокруг старта транскрипции, а в MPRA - только 200 букв в чужом контексте. Ну очень круто что модели добрались до такого качества, что их предсказания более точные, чем не очень 'удачный' эксперимент

🔥5👀5👎1

1.06K viewsedited 15:31

Вениамин Фишман

Второе - модель настолько точная, что для некоторых полигенных признаков, в которых эффект отдельных генов может быть очень большим, варианты в промотере неплохо предсказывают фенотип.

Замечательный пример из статьи — предсказания уровня липидов высокой плотности в крови по последовательностям промотора двух генов.

🔥9🤔1🤨1

1.13K viewsedited 15:34

Вениамин Фишман

Очень красивая история с MCCMB от Дмитрия Первушина.

В генах BRD (белков с бромодоменами) есть "ядовитый" (название от автора) экзон. Ядовитый экзон - это экзон, длиной не кратной 3 нт, вне рамки считывания. Его включение в РНК приводит к сдвигу рамки считывания и деградации транскрипта.

Сами белки BRD являются активаторами транскрипции.

Известно, что включение альтернативного экзона зависит от скорости полимеразы.

Получается, что когда скорость элонгации полимеразы падает, образуется больше BRD, что делает инициацию транскрипции более эффективной - такой механизм обратной связи для глобальной регуляции транскрипции.

🤩20👍9🤔3❤1🔥1

958 views09:49

Вениамин Фишман

Вчера у постера обсуждали с Арсением, почему MPRA лучше RNA-seq как источник данных для обучения моделей, предсказывающих экспрессию. Некоторые мысли по этому поводу в ветке обсуждений этого поста.

👍8

838 views16:28

Вениамин Фишман

Cегодня записывал подкаст для радио "Спутник" о наших работах в Сириусе для инконсалт. Кто не знает - ИНКК это консалтинговая компания, которая сопровождает мегагранты, порграммы ФТ Сириус и другие крупные гранты в РФ.

Я часто даю интервью по поводу вышедших статей. Обычно их берут журналисты, у которых есть минимальный бэкграунд в научной области, которую они освещают. Но в этот раз я был искренне впечатлен уровнем подготовки коллег, которые, во-первых, кажется, знают всех крупных ученых в РФ и, во-вторых, тщательно подготовились, изучив мою биографию и научные работы. А больше всего меня впечатлило что интервью берет сама гендиректор ИНКК (на фото). Мне показалось, что коллеги очень неформально подходят к своей работе и искренне интересуются научными успехами своих гостей, а не просто выпускают "ещё один пост в телеграмме" для галочки. Посмотрим, что получится, программу обещают сверстать к концу августа!

❤39🔥17❤‍🔥5

1.1K views16:58

Вениамин Фишман

Слушаю доклад из БТК о сборке из собственного фазированного референсного генома трио. С интересом узнал, что частота рекомбинаций в женском мейозе отличается от мужского (больше на 10%)

👍6

1.17K views10:38

Вениамин Фишман

Ещё интересная статистика - 40 de novo изменений копийности STR на геном на поколение

👍9

1.13K views10:40

Вениамин Фишман

🔥4👀2

1.11K views10:43

About

Blog

Apps

Platform