Вениамин Фишман
1.23K subscribers
406 photos
73 videos
26 files
164 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Несколько месяцев назад мы на этом канале разбирали препринт aGenome. А сегодня полноценная статья вышла в Nature!


Для тех, кто не знаком - это модель, которая предсказывает тысячи биохимических и транскрипционных сигналов по последовательности ДНК.

Одновременно вышло интервью от разработчиков:

https://youtu.be/V8lhUqKqzUc?si=0MeT6Wc-nydRT24q

Для меня самые интересные - последние 5 мин, где они обсуждают планы на будущее.

П. С. Из интервью: у топовой команды гугла ушло около 2 лет на разработку этой модели
🔥116👍5😐1
Вениамин Фишман
Randomizing human genome Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов. Пару лет назад мы опубликовали…
Сегодня на лабораторном семинаре разобрали статью из Science, о которой я писал несколько дней назад. Впечатляет, насколько толерантен геном к изменениям - по крайней мере in vitro. Авторы находят не только крупные делеции и дупликации, но и даже дицентрики, которые достаточно долго присутствуют в культуре.

Артем Шадский сделал отличную презентацию. Семинар можно послушать по ссылке

https://us06web.zoom.us/rec/share/XkyJwjKReun-rrWoTWvQmDO48_ayrAMSdn-jInUplkkJ4Tr-XwJktUG79HJH3PBj.STGv5FjU2tWw8zgf

Passcode: ?L73pd.B
19👍7
Объявлен очередной конкурс на получение повышенных стипендий Президента РФ для аспирантов (75 тыс. руб. в месяц). Прием заявок с 29 января до 27 февраля (14:00 по Москве) в электронном виде на сайте:

https://aspirant.extech.ru/

В этот раз предполагается назначить 800 стипендий. Соискатели стипендий выдвигаются научным руководителем. Объявление и конкурсную документацию можно посмотреть здесь:

https://aspirant.extech.ru/documents/100/view
Что будет с мотивами сайтов связывания TF, если на них не будет действовать отбор? Эксперимент - перемешаем все буквы в геноме и будем искать мотивы связывания используя известные PWM. Ваше предсказание: для большинства TF после перемешивания:
Anonymous Poll
13%
количество мотивов в разы уменьшится
48%
количество мотивов в разы уменьшится, но для некоторых TF станет больш мотивов
37%
количество найденных мотивов изменится немного (в несколько раз)
2%
Свой вариант в комментариях
Forwarded from Bioinformatics Institute
Продолжается прием заявок на программу переподготовки «Биоинформатика для биологов» Института биоинформатики | Сайт

Студентов ждет год обучения онлайн, много практики по программированию, анализу данных NGS, статистики, R и ML, научный проект с реальными данными и сокурсники из разных городов мира.

Стоимость – 83 000 руб. в семестр. Можно оформить рассрочку и налоговый вычет. При окончании выдаем диплом о профессиональной переподготовке.

Ждем студентов, аспирантов и уже состоявшихся специалистов естественно-научного профиля. Нагрузка при обучении большая, но по отзывам выпускников – оно того стоит на 100%.

Подробная программа и этапы поступления: bioinf.me/admission

Будем ждать ваших заявок!

#bioinf_education #bioinf_online @bioinformatics_institute
10👍2
Bioinformatics Institute
Продолжается прием заявок на программу переподготовки «Биоинформатика для биологов» Института биоинформатики | Сайт Студентов ждет год обучения онлайн, много практики по программированию, анализу данных NGS, статистики, R и ML, научный проект с реальными…
Это не личная рекомендация - попросили сделать репост. Я, честно говоря, ничего не знаю про эту программу, но в целом выского мнения об институте биоинфоматики. Если у кого-то есть отзыв, основанный на личном опыте, поделитесь в комментариях.
😁86👍3
Во многих регионах России, в том числе в Сибири, мы живём в условиях йододефицита - количество этого важного элемента, которое мы получаем с пищей, недостаточно. Интересный слайд я увидел сегодня на очередной сессии института Терапии в Новосибирске - согласно их исследованию, йододефицит у подростков Новосибирска неуклонно уменьшается. Это связано, видимо, как с улучшением качества питания населения, так и с государственными программами йодификации продуктов питания
👍227
Читаю статью о ДНК-моделе OmniNA.
Идея очень интересная - буквы ДНК пишутся следом за их текстовым обписанием с NCBI (например: this is genome assembly of rhesus monkey иди this is CDS of human EF1a). И на такой смеси ДНК и букв тренируется GPT-модель.

Потом модель может делать как на картинке - выдвать по ДНК описание того, что это за последовтаельность.

Также можно файнтюнить модель прямо текстом: вводится инструкция, потом последовательность ДНК, потом задается вопрос. Получается такой вариант GPT, который адаптирован к работе с ДНК.

Вообще мне кажется, что пока прогресс ДНК-моделей именно в получении биологических сигналов не очень большой это может стать основным направлением их использования - интеграция с текстами, чтобы людям было удобно решить биологические задачи. Чтобы с этим могли комфорртно взаимодействовать "мокрые" биологи, описывая свои вопросы текстом, без написания кода.

https://www.biorxiv.org/content/10.1101/2024.01.14.575543v1.full.pdf
🔥6👍42
Forwarded from Innovation & Research
➡️ Стартовал сбор заявок на Научную премию Сбера 2026!

🚀 Дан старт пятому сезону Научной премии Сбера. Эта престижная награда вручается учёным за выдающиеся достижения, которые открывают новые перспективы для развития науки и технологий в стране.

Ключевое нововведение — впервые в номинациях «AI в науке» открыта возможность самовыдвижения.


➡️ Общий призовой фонд в 2026 году составил рекордные 111 млн рублей!

Лауреаты будут определены в следующих основных номинациях:

▪️ «Физический мир» (физика, химия, астрономия, науки о Земле и технические науки),

▪️ «Науки о жизни» (биология, медицина и сельскохозяйственные науки),

▪️ «Цифровая вселенная» (математика, компьютерные науки, информатика и искусственный интеллект).

Каждый победитель получит 30 млн рублей.

⚡️ Для молодых учёных до 35 лет включительно представлены три номинации «AI в науке» по направлениям основных номинаций Премии. В них могут участвовать коллективы до трёх человек, добившиеся ярких научных результатов с применением искусственного интеллекта за последние 5 лет. Победители разделят призы, составившие в этому году 7 млн рублей.

Подать заявку можно на сайте Премии до 30 апреля 2026 года включительно.

Лауреаты пятого сезона будут награждены в Москве в конце года.
Please open Telegram to view this post
VIEW IN TELEGRAM
Всем привет!

Летом в Новосибирске пройдет конференция «Биоинформатика регуляции и структуры геномов / системная биология», BGRS/SB-2026 (6 по 11 июля)

Новосибирск летом прекрасен!

Мы будем активно участвовать в секции по 3D-геномике. Приезжайте пообщаться, рассказать о вашей работе - мы рады видеть коллег и колабораторов, а также новых гостей!

Дэдлайн подачи тезисов 6 апреля. Регистрация:
https://bgrssb.icgbio.ru/2026/profile/

Планируется сформировать спецвыпуски статей по итогам докладов (можно будет подать заявку - из журналов планируют ВОГиС,
IJMS, Gene Expression, Journal of Bioinformatics and Computational Biology - к слову об отчетах по РНФ и не только)

После конфы можно поехать в авторский тур на Алтай (11-17 июля) - никогда не ездил сам, но коллегам нравится (https://bgrssb.icgbio.ru/2026/altai/). Конференция будет проведена в гибридном формате, предоставляя возможность участвовать как лично, так и дистанционно (с онлайн-докладом).

Больше информации: https://bgrssb.icgbio.ru/2026/
🔥243
Forwarded from Inna Pristyazhnyuk
В России принят закон, запрещающий передачу генетических данных человека иностранцам — PCR News
https://pcr.news/stati/v-rossii-prinyat-zakon-zapreshchayushchiy-peredachu-geneticheskikh-dannykh-cheloveka-inostrantsam/
🤡55🫡4
Вениамин Фишман
В России принят закон, запрещающий передачу генетических данных человека иностранцам — PCR News https://pcr.news/stati/v-rossii-prinyat-zakon-zapreshchayushchiy-peredachu-geneticheskikh-dannykh-cheloveka-inostrantsam/
Хочется написать несколько слов об этой инициативе. Я не юрист, но кажется что этот закон делает ещё более сложной и без того непростую область исследований в области медицинской генетики в РФ.

Во-первых, мне не понятно, считается ли публикация отдельных новых вариантов, связанных с болезнями, передачей генетической информации. Как будто если почитать закон, то формально - считается, ведь когда мы пишем
A>G в позиции 13 365 555

мы формально передаём всему миру информацию о "последовательности нуклеиновых кислот". Как без этого научное сообщество будет обмениваться информацией о причинах редких болезней? Особенность этих болезней в том, что носителей поломок конкретного гена может быть всего десяток на весь мир, и без обмена данными о конических случаях мы никогда не соберём статистику.

Во-вторых, я категорически не согласен с гораздо более явно прописными ограничениями на обезличенную публикацию частот вариантов. Эти данные нужны для медицинских целей (понять, является ли найденный вариант патогенным или доброкачественным), причём нужны в особенности для РФ - в Европе и США есть свои хорошие базы. Сложно представить, как такая усреднённая обезличенная информация могла бы использоваться во вред жителям РФ, но уж если предположить, что кто-то задался целью ее получить, закон ему не помешает - миллионы бывших и сегодняшних жителей РФ сформировали большие диаспоры в самых разных городах мира, от Берлина до Нью-Йорка. Но, ещё раз, само предложение, что эти данные могут быть использованы во вред, совершенно необосновано, аналогичные зарубежные базы (гномад, 1KG и т.д.) уже давно доступны публично.
👍511
Вениамин Фишман
Хочется написать несколько слов об этой инициативе. Я не юрист, но кажется что этот закон делает ещё более сложной и без того непростую область исследований в области медицинской генетики в РФ. Во-первых, мне не понятно, считается ли публикация отдельных…
И, наконец, третий забавный казус коснётся исследований древней ДНК, одной из немногих областей, которая относительно хорошо развита в РФ. Из текста закона непонятно, касается ли он только живущих сейчас людей или также умерших, и какой "срок давности" по разглашению их геномов. Если в статьях по медицинской генетике мы традиционно пишем, что полные геномные данные являются персональными и не подлежат разглашению, и редакторы журналов это принимают, то вряд ли такое объяснение пройдёт для древней ДНК
33💔2
В общем и целом, кажется что это очередной закон, который многие будут неявно нарушать, и я подозреваю, что никто не будет мониторить каждую научную статью на предмет публикации отдельного генетического варианта отдельного пациента. Но закон останется и будет домокловым мечом висеть над каждым, кто занимается генетикой человека (а если тезисы конференции? А если на лекции рассказал свои результаты, а там был иностранец? И т.п.). Это, безусловно, только добавляет негатива к и без того непростому фону Российской науки.

Буду рад комментариям людей более сведущий, возможно, я что-то неправильно интерпретирую
35🤝7💯5
This media is not supported in your browser
VIEW IN TELEGRAM
Один из неявных бонусов университета Сириус: тут часто проходят разные события. От серьёзных конференций до студенческих выступлений. Вот так придёшь поработать в воскресенье вечером и попадаешь на рок-концерт. Ребята молодцы - очень атмосферно!
🔥45👍9👎5😁2😎21
На этой неделе я буду в Тбилиси. Если кто-то сейчас там и хочет встретиться, поговорить о науке или о жизни - пишите, попробую найти окошко
16🤯5👀5
Область языковых моделей ДНК продолжает развиваться. Модель Evo2 только что опубликовали в Nature.

Публикация вышла сегодня, но модель уже устарела - см., например, мои посты от начала февраля, где я рассказывал про более новые мультимодельные ДНК модели, совмещающие текст и геномные данные. Как я и прогнозировал, эта область пока развивается поступательно, без каких-то фантастических прорывов, но с постоянным улучшением качества. Для ДНК-моделей ещё не наступил alphaFold moment - и это прекрасно, потому что у нас ещё есть шанс принять в нем участие!
🔥11🗿72😴2
organism_boxplot_logp_5_log10_02022026.png
2 MB
На этой картинке для каждого TF (один TF = одна точка) показано как часто он встречается в образце по сравнению с промоторными областями человека.

Пунктирная вертикальная линия через 0 - никаких отличий, точки слева от нее соответствуют более редкой рассадке TF, справа - более частой

И что мы тут видим - в перемешаной (shuffled) ДНК частота мотивов TF ненамного отличается от случайно выбранных межгенных районов (random) - и в обоих случаях сильно отличается от частоты связывания TF в промоторах (точки далеко от пунктиной линии).

Так что же - почти вся наша межгенная ДНК, несмотря на сотни миллионов лет отбора, не слишком отличается от случайной мешанины? Размышления - мои и ваши - в комментариях.

П.С. Кредиты за великолепную картинку Дарье Панченко
👍84👀2