Команда Ярослава Беспалова представила сегодня классный доклад и постеры по использованию AI в медицине
- медицинский ассистент, который общается с пациентом, уточняет жалобы и рекомендует, к какому врачу обратиться (70к обращений в месяц)
- интерпретатор анализов КДЛ, с которым можно обсудить результаты своих лабораторных исследований в контексте различных симптомов
- ИИ консилиум - к такому ассистенту может прийти врач, чтобы посоветоваться или, наоборот, поспорить
Проговорили с Ярославом идею совместно поработать над ИИ-интерпретатором для медико-генетических тестов. Кажется, идея нашла отклик со всех сторон.
- медицинский ассистент, который общается с пациентом, уточняет жалобы и рекомендует, к какому врачу обратиться (70к обращений в месяц)
- интерпретатор анализов КДЛ, с которым можно обсудить результаты своих лабораторных исследований в контексте различных симптомов
- ИИ консилиум - к такому ассистенту может прийти врач, чтобы посоветоваться или, наоборот, поспорить
Проговорили с Ярославом идею совместно поработать над ИИ-интерпретатором для медико-генетических тестов. Кажется, идея нашла отклик со всех сторон.
🔥25❤9🤡1
Наткнулся на дискуссию о том, что называется вайб-кодингом - когда задачу написания кода за вас полностью решает ИИ:
Пост 1.
"Если ко мне на проект приходит студент и за пару недель работы ни разу не говорит что завайбкодил какой-то кусочек работы или для литобзоров не пользуется нейропоиском, то я начинаю его этому обучать 100%..."
Пост 2.
"...в рисерче для такого нужно не забывать о дотошности, и постоянной паранойе к маленьким деталям, к дисциплине в общем, которой у новичков обычно нет. Я так собесил людей на практику недавно, ллм то они юзали с радостью, только потом не могли рассказать что за метрика на графиках, почему они ее выбрали (посоветовал чатгпт), а уж как она считается даже не представляли на самом деле (сутуация у 90% стажеров сделавших тестовое)"
Я полностью согласен с авторами обоих постов. Особенно про дотошность и паранойю к деталям в ресерче!
Меня безмерно удивляет как студенты, принципиально НЕ использующие GPT, так и те, кто не читает сгенерированный им код и/или не понимающие что там написано.
Единственный понятный мне пример, когда такой подход (сгенерить и не разбираться) имеет право на жизнь - это если нужно сделать абсолютно не интересную задачу, важность которой равна нулю, и я уверен, что приобретённые при этом знания мне не понадобятся. Но таких задач я стараюсь в принципе избегать.
Пост 1.
"Если ко мне на проект приходит студент и за пару недель работы ни разу не говорит что завайбкодил какой-то кусочек работы или для литобзоров не пользуется нейропоиском, то я начинаю его этому обучать 100%..."
Пост 2.
"...в рисерче для такого нужно не забывать о дотошности, и постоянной паранойе к маленьким деталям, к дисциплине в общем, которой у новичков обычно нет. Я так собесил людей на практику недавно, ллм то они юзали с радостью, только потом не могли рассказать что за метрика на графиках, почему они ее выбрали (посоветовал чатгпт), а уж как она считается даже не представляли на самом деле (сутуация у 90% стажеров сделавших тестовое)"
Я полностью согласен с авторами обоих постов. Особенно про дотошность и паранойю к деталям в ресерче!
Меня безмерно удивляет как студенты, принципиально НЕ использующие GPT, так и те, кто не читает сгенерированный им код и/или не понимающие что там написано.
Единственный понятный мне пример, когда такой подход (сгенерить и не разбираться) имеет право на жизнь - это если нужно сделать абсолютно не интересную задачу, важность которой равна нулю, и я уверен, что приобретённые при этом знания мне не понадобятся. Но таких задач я стараюсь в принципе избегать.
👍25❤13🤝4
Опубликовали статью в Epigenetics & Chromatin в июне
||
v
К августу мне прислали ссылку на оплату картой. Я написал, что мне для отчета за оплату нужен счет.
||
v
В декабре (!) прислали счет - при этом я трижды писал и напоминал. И уточнили, что нужно обязательно уложиться с оплатой в 1 месяц.
Естественно, никакие закупки в этом году госорганизации уже не делают. Ну... напишу в редакцию, что они сами виноваты.
П.С. Для тех, кто не знаком с масштабом - плата за публикацию твоей статьи (т.е. за то, что редактор ее прочитал, пообщался с рецензентами, которые работают бесплатно, а потом техредактор перегнал текст в шаблон журнала и выложил на сайт) - >3k евро. Кажется, за эти деньги можно было бы порасторопнее работать.
||
v
К августу мне прислали ссылку на оплату картой. Я написал, что мне для отчета за оплату нужен счет.
||
v
В декабре (!) прислали счет - при этом я трижды писал и напоминал. И уточнили, что нужно обязательно уложиться с оплатой в 1 месяц.
Естественно, никакие закупки в этом году госорганизации уже не делают. Ну... напишу в редакцию, что они сами виноваты.
П.С. Для тех, кто не знаком с масштабом - плата за публикацию твоей статьи (т.е. за то, что редактор ее прочитал, пообщался с рецензентами, которые работают бесплатно, а потом техредактор перегнал текст в шаблон журнала и выложил на сайт) - >3k евро. Кажется, за эти деньги можно было бы порасторопнее работать.
🙉28❤9😁5🤡5🤷1
Все знают, что такое ЭКО, но не все - что при ЭКО можно тестировать эмбрионы и выбрать тот, который не содержит генетических аномалий, связанных с серьезными заболеваниями. Технология сложная - требуется протестировать крошечный фрагмент эмбриона, всего 4-6 клеток.
Стандартные методы обнаруживают изменения копийности крупных фрагментов ДНК, но не перемещения (транслокации) фрагментов друг относительно друга. Хотя транслокации редко приводят к болезням, у носителей почти всегда возникают проблемы с формированием половых клеток. Таким людям можно помочь завести ребенка с помощью ЭКО, но поскольку отличить эмбрион-носитель транслокации от нормы нельзя в следующем поколении проблема воспроизводится.
В большом многоцентровом исследовании в партнерстве сведущими центрами ЭКО мы решили эту проблему, показав, что метод Hi-C позволяет обнаружить транслокации в биоптатах эмбрионов. Теперь статья ищет место на страницах журналов, а мы ищем партнерства с клиниками и компаниями, готовыми внедрять новый метод в практику
Стандартные методы обнаруживают изменения копийности крупных фрагментов ДНК, но не перемещения (транслокации) фрагментов друг относительно друга. Хотя транслокации редко приводят к болезням, у носителей почти всегда возникают проблемы с формированием половых клеток. Таким людям можно помочь завести ребенка с помощью ЭКО, но поскольку отличить эмбрион-носитель транслокации от нормы нельзя в следующем поколении проблема воспроизводится.
В большом многоцентровом исследовании в партнерстве сведущими центрами ЭКО мы решили эту проблему, показав, что метод Hi-C позволяет обнаружить транслокации в биоптатах эмбрионов. Теперь статья ищет место на страницах журналов, а мы ищем партнерства с клиниками и компаниями, готовыми внедрять новый метод в практику
🔥62👍16😍8❤3
Вениамин Фишман
Все знают, что такое ЭКО, но не все - что при ЭКО можно тестировать эмбрионы и выбрать тот, который не содержит генетических аномалий, связанных с серьезными заболеваниями. Технология сложная - требуется протестировать крошечный фрагмент эмбриона, всего 4…
Одной из сложных задач, которую нам пришлось решить в ходе этого проекта - отсутствие большого числа контролей. Для методов, основанных на секвенировании, аномалии копийности ДНК обычно ищут на основе сравнения образца с контрольной группой без отклонений в копийности. Но в случае эмбрионов человека такую группу очень сложно собрать - ведь эмбрионы без нарушений чаще всего оставляют для переноса матери и рождения ребенка.
Эту проблему мы решили, используя AI-подходы. Совместно с AIRI и при поддержке фонда Blue Sky Research мы сделали метод, который выявляет особенности пробоподготовки и аномалии копийности каждого локуса используя данные о копийности других участков в этом том же образце. Такой метод (мы назвали его GENATECTOR) - работает существенно лучше стандартных биоинф инструментов, запущенных в режиме "без контрольного образца" и чуть-чуть лучше, чем если сделать контроль усредняя нескольких образцов с разными (не совпадающими) хромосомными перестройками.
Эту проблему мы решили, используя AI-подходы. Совместно с AIRI и при поддержке фонда Blue Sky Research мы сделали метод, который выявляет особенности пробоподготовки и аномалии копийности каждого локуса используя данные о копийности других участков в этом том же образце. Такой метод (мы назвали его GENATECTOR) - работает существенно лучше стандартных биоинф инструментов, запущенных в режиме "без контрольного образца" и чуть-чуть лучше, чем если сделать контроль усредняя нескольких образцов с разными (не совпадающими) хромосомными перестройками.
🔥40❤11
Немного сумбурно попытался уложить в час то, что сейчас в фокусе моих интересов из ML в геномике. Получилось хаотично, но может быть кому-то будет интересно послушть.
❤24🥰1
Forwarded from V K
Друзья, всем привет!
Мы подготовили финальный в этом году дайджест трендов.
Весь год смотрели и анализировали генИИ и в этом материале подводим итоги года – главные тренды и выводы развития ИИ-ассистентов на международных рынках.
А также наш новый, пока экспериментальный, формат анализа –продуктовых и маркетинговых активностей ИИ-сервисов и их влияния на пользовательские метрики приложения.
Многое еще нужно будет доработать — на важно стартовать.
В качестве главных трендов и итогов 2025 года для ИИ-ассистентов мы выделяем 8-мь:
1) Главный итог года - генеративный ИИ стал частью повседневной жизни. Результаты опросов людей показывают, что уровень проникновения GenAI в развитых странах (Европа, Америка и др.) уже превышает 60%. В России картина аналогична.
2) ИИ-ассистенты постепенно превращаются в платформы для повседневной жизни, объединяя всё больше сервисов экосистем и внешних партнеров внутри своих интерфейсов. Это создает новые возможности и опыт для пользователей. Также на рынке развивается тренд интеграции ИИ-ассистентов в новые носимые устройства – в первую очередь наушники и диктофоны.
3) Гигиеническим минимум ИИ-ассистентов становятся образовательные функции. Это и специальные режимы для обучения новому и собственные инструменты для обучения работе с генИИ
4) Конкуренция среди ИИ-ассистентов усиливается. ПокаChatGPT остается безусловным лидером по аудитории с более чем 800 млн пользователей в месяц на мобильных устройствах. Но Gemini агрессивно наращивает аудиторию. Ключевой драйвер Gemini – выпуск новых моделей, зачастую лучших в категории в момент выхода (графическая Nano Banana, видео Veo 3, общая Gemini3). Кроме того, Gemini имеет преимущество в дистрибуции за счет встраивания в экосистему Google и активно использует маркетинг для продвижения.
Также на глобальных рынках представлено много решений от китайских разработчиков.
5) Новое направление развития ИИ-ассистентов в 2025 году –развитие агентности. Пока это первые эксперименты в области лайфстайл, офисной и личной продуктивности, кодинга.
Тренд будет развиваться следующие несколько лет. Игроки рынка уже начинают адаптировать инфраструктуру в области безопасности, финансов, бизнес моделей под будущее ИИ-агентов
6) в 2025 году на рынке сформировался новый отраслевой стандарт продукта. Им стали ИИ-браузеры, которые в концу года запустили все крупнейшие разработчики. Именно в таком интерфейсе пользователи получают привычный и при этом новый удобный для себя опыт взаимодействия с генИИ
7) Главный вопрос года в сфере генИИ – экономика индустрии, которая пока отрицательная. В 2025 году на рынке не было много экспериментов с моделями ценообразования, но было много партнерских сделок для привлечения финансирования и создания общей уникальной ценности продукта
8) В 2025 году было много виральных кейсов, которые способствовали вовлечению пользователей в категорию и давали рост продуктам. Большая их часть связана с графической модальностью. Более подробно о главных итогах 2025 года в сфере генИИ, в полной версии дайджеста.
Мы подготовили финальный в этом году дайджест трендов.
Весь год смотрели и анализировали генИИ и в этом материале подводим итоги года – главные тренды и выводы развития ИИ-ассистентов на международных рынках.
А также наш новый, пока экспериментальный, формат анализа –продуктовых и маркетинговых активностей ИИ-сервисов и их влияния на пользовательские метрики приложения.
Многое еще нужно будет доработать — на важно стартовать.
В качестве главных трендов и итогов 2025 года для ИИ-ассистентов мы выделяем 8-мь:
1) Главный итог года - генеративный ИИ стал частью повседневной жизни. Результаты опросов людей показывают, что уровень проникновения GenAI в развитых странах (Европа, Америка и др.) уже превышает 60%. В России картина аналогична.
2) ИИ-ассистенты постепенно превращаются в платформы для повседневной жизни, объединяя всё больше сервисов экосистем и внешних партнеров внутри своих интерфейсов. Это создает новые возможности и опыт для пользователей. Также на рынке развивается тренд интеграции ИИ-ассистентов в новые носимые устройства – в первую очередь наушники и диктофоны.
3) Гигиеническим минимум ИИ-ассистентов становятся образовательные функции. Это и специальные режимы для обучения новому и собственные инструменты для обучения работе с генИИ
4) Конкуренция среди ИИ-ассистентов усиливается. ПокаChatGPT остается безусловным лидером по аудитории с более чем 800 млн пользователей в месяц на мобильных устройствах. Но Gemini агрессивно наращивает аудиторию. Ключевой драйвер Gemini – выпуск новых моделей, зачастую лучших в категории в момент выхода (графическая Nano Banana, видео Veo 3, общая Gemini3). Кроме того, Gemini имеет преимущество в дистрибуции за счет встраивания в экосистему Google и активно использует маркетинг для продвижения.
Также на глобальных рынках представлено много решений от китайских разработчиков.
5) Новое направление развития ИИ-ассистентов в 2025 году –развитие агентности. Пока это первые эксперименты в области лайфстайл, офисной и личной продуктивности, кодинга.
Тренд будет развиваться следующие несколько лет. Игроки рынка уже начинают адаптировать инфраструктуру в области безопасности, финансов, бизнес моделей под будущее ИИ-агентов
6) в 2025 году на рынке сформировался новый отраслевой стандарт продукта. Им стали ИИ-браузеры, которые в концу года запустили все крупнейшие разработчики. Именно в таком интерфейсе пользователи получают привычный и при этом новый удобный для себя опыт взаимодействия с генИИ
7) Главный вопрос года в сфере генИИ – экономика индустрии, которая пока отрицательная. В 2025 году на рынке не было много экспериментов с моделями ценообразования, но было много партнерских сделок для привлечения финансирования и создания общей уникальной ценности продукта
8) В 2025 году было много виральных кейсов, которые способствовали вовлечению пользователей в категорию и давали рост продуктам. Большая их часть связана с графической модальностью. Более подробно о главных итогах 2025 года в сфере генИИ, в полной версии дайджеста.
❤9👌4👏1
Вениамин Фишман
Как-то так. Статья прошла все рецензии и была на стадии proofs.
Нужно составить blacklist журналов, куда не берут по аффилиациям РФ (как правило это не любые аффилиации, а институты из SDN, но бывает по-разному). Пишите в комменты, буду обновлять в сообщении. Ну или может где-то уже есть такой?
Upd: немного устаревший список из зоопарка: https://t.me/ivoryzoo/2715
1. PLOS - AIRI , Сколтех
2. ACS - МФТИ
3. Optica - SDN list
4. RSC Advances - банят любых авторов из России
5.
Upd: немного устаревший список из зоопарка: https://t.me/ivoryzoo/2715
1. PLOS - AIRI , Сколтех
2. ACS - МФТИ
3. Optica - SDN list
4. RSC Advances - банят любых авторов из России
5.
👍7🫡3😱2
Вышел Nucleotide Transformer v3 - языковая модель ДНК от InstaDeep (BioNTech). Хорошая и очень подробная статья.
TL;DR - если вам нужно зафантюнить модель
+ в задаче важен длинный контекст,
NTv3 и аналогичные претренированные модели (например, наша GENA) - лучшее решение по соотношению копьют/качество. Если задачу уже решил aGenome/Borzoi/etc - без разницы кого брать.
Больше всего впечатлило, что модель может точно предсказать эффект мутации энхансеров на расстоянии 20+ Kb от промотора, причем чувствует разинцу в силе энхансера, его расстояния до промотора и осознает, в каком типе клеток это все происходит.
П.С. Картинки очень красиво у них сделаны =)
П.П.С. Традиционно привожу и ссылку на мнения критиков, которые считаю, что все эти модели - путь в никуда
TL;DR - если вам нужно зафантюнить модель
ДНК-->разметка или функция + в задаче важен длинный контекст,
NTv3 и аналогичные претренированные модели (например, наша GENA) - лучшее решение по соотношению копьют/качество. Если задачу уже решил aGenome/Borzoi/etc - без разницы кого брать.
Больше всего впечатлило, что модель может точно предсказать эффект мутации энхансеров на расстоянии 20+ Kb от промотора, причем чувствует разинцу в силе энхансера, его расстояния до промотора и осознает, в каком типе клеток это все происходит.
П.С. Картинки очень красиво у них сделаны =)
П.П.С. Традиционно привожу и ссылку на мнения критиков, которые считаю, что все эти модели - путь в никуда
❤14👍5
Чуть больше деталей:
- как я и предполагал, идет поступательное развитие области. NTv3 файнтюнится и инеферит быстрее, а точность дает выше, чем для предыдущих моделей. Но прорыва - чтобы тут все стало х10 лучше - нет.
- качество NTv3 после файнтюнинга сопоставимо с SOTA для специализированных моделей (см. сравнение с Borzoi). Претрена не помогает радикально повысить это качество, но помогает сделать фантюн быстрее и дешевле. Жаль, что нет савнения с aGenome (думаю, появится в журнальной версии). С другой стороны, даже если aGenome маргинально лучше (сильно лучше быть не может, т.к. он и в сравнении с Borzoi не на порядок лучше), вы все равно не можете взять aGenome и зафайнтюнить для своих задач.
- скейлинг до 1B подтверждается, дальше проблема скейлинга по-прежнему не решена (аворы вроде как и не пытались больше 650М модели тренить, но я уверен что это потому что не смогли улучшить качество, а не потому что не хотели). Этот (на мой взляд главный) приз ещё ждет своего победителя.
- круто, что есть функциональная валидация - пусть сетап не идеальный, но лабораторная валидация предсказаний становится важной частью для топовых статей.
Сделал себе много заметок с техническими деталями, буду постепенно дополнять ими комментарии к посту.
- как я и предполагал, идет поступательное развитие области. NTv3 файнтюнится и инеферит быстрее, а точность дает выше, чем для предыдущих моделей. Но прорыва - чтобы тут все стало х10 лучше - нет.
- качество NTv3 после файнтюнинга сопоставимо с SOTA для специализированных моделей (см. сравнение с Borzoi). Претрена не помогает радикально повысить это качество, но помогает сделать фантюн быстрее и дешевле. Жаль, что нет савнения с aGenome (думаю, появится в журнальной версии). С другой стороны, даже если aGenome маргинально лучше (сильно лучше быть не может, т.к. он и в сравнении с Borzoi не на порядок лучше), вы все равно не можете взять aGenome и зафайнтюнить для своих задач.
- скейлинг до 1B подтверждается, дальше проблема скейлинга по-прежнему не решена (аворы вроде как и не пытались больше 650М модели тренить, но я уверен что это потому что не смогли улучшить качество, а не потому что не хотели). Этот (на мой взляд главный) приз ещё ждет своего победителя.
- круто, что есть функциональная валидация - пусть сетап не идеальный, но лабораторная валидация предсказаний становится важной частью для топовых статей.
Сделал себе много заметок с техническими деталями, буду постепенно дополнять ими комментарии к посту.
Telegram
Вениамин Фишман
Прочитав бурю комментариев в разных каналах, твиттерах и прочих платформах о Evo-2, попробую ещё раз сформулировать взвешенную позицию.
Если кто-то рассматривает эту работу как решение всех проблем биологии (что можно заключить из заголовка), то, безусловно…
Если кто-то рассматривает эту работу как решение всех проблем биологии (что можно заключить из заголовка), то, безусловно…
👍6❤2
Forwarded from Timofey Lagunov
Поскольку днк очень длинная, можно предположить, колебательная мода на 10см у неё есть. Тогда при длительном регулярном воздействии (желательно такой интенсивности, чтобы "плавилась шоколадка в кармане" как в истории с открывателем этих волн) возможны проблемы с клеткой. Но первыми под удар попадут жиры.
И самый любимый факт: насколько помню изобретателя микроволновки зовут Эрих Грейнахер)))
И только русские могут оценить настолько чёткое исполнение предназначения семьи))
И самый любимый факт: насколько помню изобретателя микроволновки зовут Эрих Грейнахер)))
И только русские могут оценить настолько чёткое исполнение предназначения семьи))
🤣30😁6❤3🔥2👀2😱1
Designing AI-programmable therapeutics with the EDEN family of foundation models
https://www.biorxiv.org/content/10.64898/2026.01.12.699009v1.full
Очень интересная работа - новая претренированная языковая модель ДНК, которая может дизайнить функциональные последовательности - новые рекомбиназы, CAR для терапевтических T-клеток, антимикробные пептиды и т.д.
Внимательно ещё не разбирал, если кто читал - поделитесь впечатлениями
https://www.biorxiv.org/content/10.64898/2026.01.12.699009v1.full
Очень интересная работа - новая претренированная языковая модель ДНК, которая может дизайнить функциональные последовательности - новые рекомбиназы, CAR для терапевтических T-клеток, антимикробные пептиды и т.д.
Внимательно ещё не разбирал, если кто читал - поделитесь впечатлениями
Randomizing human genome
Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов.
Пару лет назад мы опубликовали идеологически похожую работу, хотя, конечно, и не с таким масштабом
https://pubmed.ncbi.nlm.nih.gov/36842155/
Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов.
Пару лет назад мы опубликовали идеологически похожую работу, хотя, конечно, и не с таким масштабом
https://pubmed.ncbi.nlm.nih.gov/36842155/
❤12🔥5👍3🗿3