Вениамин Фишман
Как-то так. Статья прошла все рецензии и была на стадии proofs.
Нужно составить blacklist журналов, куда не берут по аффилиациям РФ (как правило это не любые аффилиации, а институты из SDN, но бывает по-разному). Пишите в комменты, буду обновлять в сообщении. Ну или может где-то уже есть такой?
Upd: немного устаревший список из зоопарка: https://t.me/ivoryzoo/2715
1. PLOS - AIRI , Сколтех
2. ACS - МФТИ
3. Optica - SDN list
4. RSC Advances - банят любых авторов из России
5.
Upd: немного устаревший список из зоопарка: https://t.me/ivoryzoo/2715
1. PLOS - AIRI , Сколтех
2. ACS - МФТИ
3. Optica - SDN list
4. RSC Advances - банят любых авторов из России
5.
👍7🫡3😱2
Вышел Nucleotide Transformer v3 - языковая модель ДНК от InstaDeep (BioNTech). Хорошая и очень подробная статья.
TL;DR - если вам нужно зафантюнить модель
+ в задаче важен длинный контекст,
NTv3 и аналогичные претренированные модели (например, наша GENA) - лучшее решение по соотношению копьют/качество. Если задачу уже решил aGenome/Borzoi/etc - без разницы кого брать.
Больше всего впечатлило, что модель может точно предсказать эффект мутации энхансеров на расстоянии 20+ Kb от промотора, причем чувствует разинцу в силе энхансера, его расстояния до промотора и осознает, в каком типе клеток это все происходит.
П.С. Картинки очень красиво у них сделаны =)
П.П.С. Традиционно привожу и ссылку на мнения критиков, которые считаю, что все эти модели - путь в никуда
TL;DR - если вам нужно зафантюнить модель
ДНК-->разметка или функция + в задаче важен длинный контекст,
NTv3 и аналогичные претренированные модели (например, наша GENA) - лучшее решение по соотношению копьют/качество. Если задачу уже решил aGenome/Borzoi/etc - без разницы кого брать.
Больше всего впечатлило, что модель может точно предсказать эффект мутации энхансеров на расстоянии 20+ Kb от промотора, причем чувствует разинцу в силе энхансера, его расстояния до промотора и осознает, в каком типе клеток это все происходит.
П.С. Картинки очень красиво у них сделаны =)
П.П.С. Традиционно привожу и ссылку на мнения критиков, которые считаю, что все эти модели - путь в никуда
❤14👍5
Чуть больше деталей:
- как я и предполагал, идет поступательное развитие области. NTv3 файнтюнится и инеферит быстрее, а точность дает выше, чем для предыдущих моделей. Но прорыва - чтобы тут все стало х10 лучше - нет.
- качество NTv3 после файнтюнинга сопоставимо с SOTA для специализированных моделей (см. сравнение с Borzoi). Претрена не помогает радикально повысить это качество, но помогает сделать фантюн быстрее и дешевле. Жаль, что нет савнения с aGenome (думаю, появится в журнальной версии). С другой стороны, даже если aGenome маргинально лучше (сильно лучше быть не может, т.к. он и в сравнении с Borzoi не на порядок лучше), вы все равно не можете взять aGenome и зафайнтюнить для своих задач.
- скейлинг до 1B подтверждается, дальше проблема скейлинга по-прежнему не решена (аворы вроде как и не пытались больше 650М модели тренить, но я уверен что это потому что не смогли улучшить качество, а не потому что не хотели). Этот (на мой взляд главный) приз ещё ждет своего победителя.
- круто, что есть функциональная валидация - пусть сетап не идеальный, но лабораторная валидация предсказаний становится важной частью для топовых статей.
Сделал себе много заметок с техническими деталями, буду постепенно дополнять ими комментарии к посту.
- как я и предполагал, идет поступательное развитие области. NTv3 файнтюнится и инеферит быстрее, а точность дает выше, чем для предыдущих моделей. Но прорыва - чтобы тут все стало х10 лучше - нет.
- качество NTv3 после файнтюнинга сопоставимо с SOTA для специализированных моделей (см. сравнение с Borzoi). Претрена не помогает радикально повысить это качество, но помогает сделать фантюн быстрее и дешевле. Жаль, что нет савнения с aGenome (думаю, появится в журнальной версии). С другой стороны, даже если aGenome маргинально лучше (сильно лучше быть не может, т.к. он и в сравнении с Borzoi не на порядок лучше), вы все равно не можете взять aGenome и зафайнтюнить для своих задач.
- скейлинг до 1B подтверждается, дальше проблема скейлинга по-прежнему не решена (аворы вроде как и не пытались больше 650М модели тренить, но я уверен что это потому что не смогли улучшить качество, а не потому что не хотели). Этот (на мой взляд главный) приз ещё ждет своего победителя.
- круто, что есть функциональная валидация - пусть сетап не идеальный, но лабораторная валидация предсказаний становится важной частью для топовых статей.
Сделал себе много заметок с техническими деталями, буду постепенно дополнять ими комментарии к посту.
Telegram
Вениамин Фишман
Прочитав бурю комментариев в разных каналах, твиттерах и прочих платформах о Evo-2, попробую ещё раз сформулировать взвешенную позицию.
Если кто-то рассматривает эту работу как решение всех проблем биологии (что можно заключить из заголовка), то, безусловно…
Если кто-то рассматривает эту работу как решение всех проблем биологии (что можно заключить из заголовка), то, безусловно…
👍6❤2
Forwarded from Timofey Lagunov
Поскольку днк очень длинная, можно предположить, колебательная мода на 10см у неё есть. Тогда при длительном регулярном воздействии (желательно такой интенсивности, чтобы "плавилась шоколадка в кармане" как в истории с открывателем этих волн) возможны проблемы с клеткой. Но первыми под удар попадут жиры.
И самый любимый факт: насколько помню изобретателя микроволновки зовут Эрих Грейнахер)))
И только русские могут оценить настолько чёткое исполнение предназначения семьи))
И самый любимый факт: насколько помню изобретателя микроволновки зовут Эрих Грейнахер)))
И только русские могут оценить настолько чёткое исполнение предназначения семьи))
🤣30😁6❤3🔥2👀2😱1
Designing AI-programmable therapeutics with the EDEN family of foundation models
https://www.biorxiv.org/content/10.64898/2026.01.12.699009v1.full
Очень интересная работа - новая претренированная языковая модель ДНК, которая может дизайнить функциональные последовательности - новые рекомбиназы, CAR для терапевтических T-клеток, антимикробные пептиды и т.д.
Внимательно ещё не разбирал, если кто читал - поделитесь впечатлениями
https://www.biorxiv.org/content/10.64898/2026.01.12.699009v1.full
Очень интересная работа - новая претренированная языковая модель ДНК, которая может дизайнить функциональные последовательности - новые рекомбиназы, CAR для терапевтических T-клеток, антимикробные пептиды и т.д.
Внимательно ещё не разбирал, если кто читал - поделитесь впечатлениями
Randomizing human genome
Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов.
Пару лет назад мы опубликовали идеологически похожую работу, хотя, конечно, и не с таким масштабом
https://pubmed.ncbi.nlm.nih.gov/36842155/
Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов.
Пару лет назад мы опубликовали идеологически похожую работу, хотя, конечно, и не с таким масштабом
https://pubmed.ncbi.nlm.nih.gov/36842155/
❤12🔥5👍3🗿3
Forwarded from Nariman
Самая необычная статья которую я когда либо видел
Она про Hi-C и искусство
Пересказывать её я не буду, но приведу несколько интересных цитат
"Abstract
Scientific data can be beautiful. ..."
"The process of chromosome folding has also inspired musicians; the composer Amir Bitran wrote a musical composition that was performed in Paris and Boston."
"DATA AVAILABILITY
Data sharing is not applicable to this article as no new data were created or analyzed in this study."
https://pubs.aip.org/aip/bpr/article/7/1/012101/3377878
Она про Hi-C и искусство
Пересказывать её я не буду, но приведу несколько интересных цитат
"Abstract
Scientific data can be beautiful. ..."
"The process of chromosome folding has also inspired musicians; the composer Amir Bitran wrote a musical composition that was performed in Paris and Boston."
"DATA AVAILABILITY
Data sharing is not applicable to this article as no new data were created or analyzed in this study."
https://pubs.aip.org/aip/bpr/article/7/1/012101/3377878
AIP Publishing
Seeing into Hi-C: How our scientific connectivity revealed the close connections in our DNA to be a work of art
Scientific data can be beautiful. An example where the data itself have a particularly striking appearance even before any scientific meaning has been ascribed
🔥9❤7
Древний вирус включается на стадии 1-2 клеток в ходе эмбрионального развития и продуцирует молекулы РНК, которая нужна для "пробуждения" генов эмбриона - включения транскрипции в ходе зиготической активацци.
Science - Endogenous retroviruses synthesize heterologous chimeric RNAs to reinforce human early embryo development
https://www.science.org/doi/10.1126/science.adv5257
Science - Endogenous retroviruses synthesize heterologous chimeric RNAs to reinforce human early embryo development
https://www.science.org/doi/10.1126/science.adv5257
Science
Endogenous retroviruses synthesize heterologous chimeric RNAs to reinforce human early embryo development
Zygotic genome activation (ZGA) failure leads to developmental arrest and poses a clinical challenge to women’s fertility. We observed that human embryos arresting at the eight-cell ZGA stage exhibited specific down-regulation of endogenous retrovirus ...
🔥13🤩10❤7
Несколько месяцев назад мы на этом канале разбирали препринт aGenome. А сегодня полноценная статья вышла в Nature!
Для тех, кто не знаком - это модель, которая предсказывает тысячи биохимических и транскрипционных сигналов по последовательности ДНК.
Одновременно вышло интервью от разработчиков:
https://youtu.be/V8lhUqKqzUc?si=0MeT6Wc-nydRT24q
Для меня самые интересные - последние 5 мин, где они обсуждают планы на будущее.
П. С. Из интервью: у топовой команды гугла ушло около 2 лет на разработку этой модели
Для тех, кто не знаком - это модель, которая предсказывает тысячи биохимических и транскрипционных сигналов по последовательности ДНК.
Одновременно вышло интервью от разработчиков:
https://youtu.be/V8lhUqKqzUc?si=0MeT6Wc-nydRT24q
Для меня самые интересные - последние 5 мин, где они обсуждают планы на будущее.
П. С. Из интервью: у топовой команды гугла ушло около 2 лет на разработку этой модели
🔥11❤6👍5😐1
Вениамин Фишман
Randomizing human genome Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов. Пару лет назад мы опубликовали…
Сегодня на лабораторном семинаре разобрали статью из Science, о которой я писал несколько дней назад. Впечатляет, насколько толерантен геном к изменениям - по крайней мере in vitro. Авторы находят не только крупные делеции и дупликации, но и даже дицентрики, которые достаточно долго присутствуют в культуре.
Артем Шадский сделал отличную презентацию. Семинар можно послушать по ссылке
https://us06web.zoom.us/rec/share/XkyJwjKReun-rrWoTWvQmDO48_ayrAMSdn-jInUplkkJ4Tr-XwJktUG79HJH3PBj.STGv5FjU2tWw8zgf
Passcode: ?L73pd.B
Артем Шадский сделал отличную презентацию. Семинар можно послушать по ссылке
https://us06web.zoom.us/rec/share/XkyJwjKReun-rrWoTWvQmDO48_ayrAMSdn-jInUplkkJ4Tr-XwJktUG79HJH3PBj.STGv5FjU2tWw8zgf
Passcode: ?L73pd.B
Zoom
Video Conferencing, Web Conferencing, Webinars, Screen Sharing
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
❤19👍7
Forwarded from Алексей Хохлов
Объявлен очередной конкурс на получение повышенных стипендий Президента РФ для аспирантов (75 тыс. руб. в месяц). Прием заявок с 29 января до 27 февраля (14:00 по Москве) в электронном виде на сайте:
https://aspirant.extech.ru/
В этот раз предполагается назначить 800 стипендий. Соискатели стипендий выдвигаются научным руководителем. Объявление и конкурсную документацию можно посмотреть здесь:
https://aspirant.extech.ru/documents/100/view
https://aspirant.extech.ru/
В этот раз предполагается назначить 800 стипендий. Соискатели стипендий выдвигаются научным руководителем. Объявление и конкурсную документацию можно посмотреть здесь:
https://aspirant.extech.ru/documents/100/view
Что будет с мотивами сайтов связывания TF, если на них не будет действовать отбор? Эксперимент - перемешаем все буквы в геноме и будем искать мотивы связывания используя известные PWM. Ваше предсказание: для большинства TF после перемешивания:
Anonymous Poll
13%
количество мотивов в разы уменьшится
48%
количество мотивов в разы уменьшится, но для некоторых TF станет больш мотивов
37%
количество найденных мотивов изменится немного (в несколько раз)
2%
Свой вариант в комментариях
Вениамин Фишман
Что будет с мотивами сайтов связывания TF, если на них не будет действовать отбор? Эксперимент - перемешаем все буквы в геноме и будем искать мотивы связывания используя известные PWM. Ваше предсказание: для большинства TF после перемешивания:
Голосуем! Ответ (шок-контент) завтра на этом канале =)
👍13❤1
Forwarded from Bioinformatics Institute
Продолжается прием заявок на программу переподготовки «Биоинформатика для биологов» Института биоинформатики | Сайт
Студентов ждет год обучения онлайн, много практики по программированию, анализу данных NGS, статистики, R и ML, научный проект с реальными данными и сокурсники из разных городов мира.
Стоимость – 83 000 руб. в семестр. Можно оформить рассрочку и налоговый вычет. При окончании выдаем диплом о профессиональной переподготовке.
Ждем студентов, аспирантов и уже состоявшихся специалистов естественно-научного профиля. Нагрузка при обучении большая, но по отзывам выпускников – оно того стоит на 100%.
Подробная программа и этапы поступления: bioinf.me/admission
Будем ждать ваших заявок!
#bioinf_education #bioinf_online @bioinformatics_institute
Студентов ждет год обучения онлайн, много практики по программированию, анализу данных NGS, статистики, R и ML, научный проект с реальными данными и сокурсники из разных городов мира.
Стоимость – 83 000 руб. в семестр. Можно оформить рассрочку и налоговый вычет. При окончании выдаем диплом о профессиональной переподготовке.
Ждем студентов, аспирантов и уже состоявшихся специалистов естественно-научного профиля. Нагрузка при обучении большая, но по отзывам выпускников – оно того стоит на 100%.
Подробная программа и этапы поступления: bioinf.me/admission
Будем ждать ваших заявок!
#bioinf_education #bioinf_online @bioinformatics_institute
❤10👍2
Bioinformatics Institute
Продолжается прием заявок на программу переподготовки «Биоинформатика для биологов» Института биоинформатики | Сайт Студентов ждет год обучения онлайн, много практики по программированию, анализу данных NGS, статистики, R и ML, научный проект с реальными…
Это не личная рекомендация - попросили сделать репост. Я, честно говоря, ничего не знаю про эту программу, но в целом выского мнения об институте биоинфоматики. Если у кого-то есть отзыв, основанный на личном опыте, поделитесь в комментариях.
😁8❤6👍3
Во многих регионах России, в том числе в Сибири, мы живём в условиях йододефицита - количество этого важного элемента, которое мы получаем с пищей, недостаточно. Интересный слайд я увидел сегодня на очередной сессии института Терапии в Новосибирске - согласно их исследованию, йододефицит у подростков Новосибирска неуклонно уменьшается. Это связано, видимо, как с улучшением качества питания населения, так и с государственными программами йодификации продуктов питания
👍22❤7