Вениамин Фишман
1.23K subscribers
406 photos
73 videos
26 files
164 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Команда Ярослава Беспалова представила сегодня классный доклад и постеры по использованию AI в медицине

- медицинский ассистент, который общается с пациентом, уточняет жалобы и рекомендует, к какому врачу обратиться (70к обращений в месяц)
- интерпретатор анализов КДЛ, с которым можно обсудить результаты своих лабораторных исследований в контексте различных симптомов
- ИИ консилиум - к такому ассистенту может прийти врач, чтобы посоветоваться или, наоборот, поспорить

Проговорили с Ярославом идею совместно поработать над ИИ-интерпретатором для медико-генетических тестов. Кажется, идея нашла отклик со всех сторон.
🔥259🤡1
Наткнулся на дискуссию о том, что называется вайб-кодингом - когда задачу написания кода за вас полностью решает ИИ:

Пост 1.

"Если ко мне на проект приходит студент и за пару недель работы ни разу не говорит что завайбкодил какой-то кусочек работы или для литобзоров не пользуется нейропоиском, то я начинаю его этому обучать 100%..."


Пост 2.

"...в рисерче для такого нужно не забывать о дотошности, и постоянной паранойе к маленьким деталям, к дисциплине в общем, которой у новичков обычно нет. Я так собесил людей на практику недавно, ллм то они юзали с радостью, только потом не могли рассказать что за метрика на графиках, почему они ее выбрали (посоветовал чатгпт), а уж как она считается даже не представляли на самом деле (сутуация у 90% стажеров сделавших тестовое)"

Я полностью согласен с авторами обоих постов. Особенно про дотошность и паранойю к деталям в ресерче!

Меня безмерно удивляет как студенты, принципиально НЕ использующие GPT, так и те, кто не читает сгенерированный им код и/или не понимающие что там написано.

Единственный понятный мне пример, когда такой подход (сгенерить и не разбираться) имеет право на жизнь - это если нужно сделать абсолютно не интересную задачу, важность которой равна нулю, и я уверен, что приобретённые при этом знания мне не понадобятся. Но таких задач я стараюсь в принципе избегать.
👍2513🤝4
Опубликовали статью в Epigenetics & Chromatin в июне
||
v
К августу мне прислали ссылку на оплату картой. Я написал, что мне для отчета за оплату нужен счет.
||
v
В декабре (!) прислали счет - при этом я трижды писал и напоминал. И уточнили, что нужно обязательно уложиться с оплатой в 1 месяц.

Естественно, никакие закупки в этом году госорганизации уже не делают. Ну... напишу в редакцию, что они сами виноваты.

П.С. Для тех, кто не знаком с масштабом - плата за публикацию твоей статьи (т.е. за то, что редактор ее прочитал, пообщался с рецензентами, которые работают бесплатно, а потом техредактор перегнал текст в шаблон журнала и выложил на сайт) - >3k евро. Кажется, за эти деньги можно было бы порасторопнее работать.
🙉289😁5🤡5🤷1
Все знают, что такое ЭКО, но не все - что при ЭКО можно тестировать эмбрионы и выбрать тот, который не содержит генетических аномалий, связанных с серьезными заболеваниями. Технология сложная - требуется протестировать крошечный фрагмент эмбриона, всего 4-6 клеток.

Стандартные методы обнаруживают изменения копийности крупных фрагментов ДНК, но не перемещения (транслокации) фрагментов друг относительно друга. Хотя транслокации редко приводят к болезням, у носителей почти всегда возникают проблемы с формированием половых клеток. Таким людям можно помочь завести ребенка с помощью ЭКО, но поскольку отличить эмбрион-носитель транслокации от нормы нельзя в следующем поколении проблема воспроизводится.

В большом многоцентровом исследовании в партнерстве сведущими центрами ЭКО мы решили эту проблему, показав, что метод Hi-C позволяет обнаружить транслокации в биоптатах эмбрионов. Теперь статья ищет место на страницах журналов, а мы ищем партнерства с клиниками и компаниями, готовыми внедрять новый метод в практику
🔥62👍16😍83
Вениамин Фишман
Все знают, что такое ЭКО, но не все - что при ЭКО можно тестировать эмбрионы и выбрать тот, который не содержит генетических аномалий, связанных с серьезными заболеваниями. Технология сложная - требуется протестировать крошечный фрагмент эмбриона, всего 4…
Одной из сложных задач, которую нам пришлось решить в ходе этого проекта - отсутствие большого числа контролей. Для методов, основанных на секвенировании, аномалии копийности ДНК обычно ищут на основе сравнения образца с контрольной группой без отклонений в копийности. Но в случае эмбрионов человека такую группу очень сложно собрать - ведь эмбрионы без нарушений чаще всего оставляют для переноса матери и рождения ребенка.

Эту проблему мы решили, используя AI-подходы. Совместно с AIRI и при поддержке фонда Blue Sky Research мы сделали метод, который выявляет особенности пробоподготовки и аномалии копийности каждого локуса используя данные о копийности других участков в этом том же образце. Такой метод (мы назвали его GENATECTOR) - работает существенно лучше стандартных биоинф инструментов, запущенных в режиме "без контрольного образца" и чуть-чуть лучше, чем если сделать контроль усредняя нескольких образцов с разными (не совпадающими) хромосомными перестройками.
🔥4011
Немного сумбурно попытался уложить в час то, что сейчас в фокусе моих интересов из ML в геномике. Получилось хаотично, но может быть кому-то будет интересно послушть.
24🥰1
Forwarded from V K
Друзья, всем привет!

Мы подготовили финальный в этом году дайджест трендов.

Весь год смотрели и анализировали генИИ и в этом материале подводим итоги года – главные тренды и выводы развития ИИ-ассистентов на международных рынках.
А также наш новый, пока экспериментальный, формат анализа –продуктовых и маркетинговых активностей ИИ-сервисов и их влияния на пользовательские метрики приложения.
Многое еще нужно будет доработать — на важно стартовать.

В качестве главных трендов и итогов 2025 года для ИИ-ассистентов мы выделяем 8-мь:
1) Главный итог года - генеративный ИИ стал частью повседневной жизни. Результаты опросов людей показывают, что уровень проникновения GenAI в развитых странах (Европа, Америка и др.) уже превышает 60%. В России картина аналогична.
2) ИИ-ассистенты постепенно превращаются в платформы для повседневной жизни, объединяя всё больше сервисов экосистем и внешних партнеров внутри своих интерфейсов. Это создает новые возможности и опыт для пользователей. Также на рынке развивается тренд интеграции ИИ-ассистентов в новые носимые устройства – в первую очередь наушники и диктофоны.
3) Гигиеническим минимум ИИ-ассистентов становятся образовательные функции. Это и специальные режимы для обучения новому и собственные инструменты для обучения работе с генИИ
4) Конкуренция среди ИИ-ассистентов усиливается. ПокаChatGPT остается безусловным лидером по аудитории с более чем 800 млн пользователей в месяц на мобильных устройствах. Но Gemini агрессивно наращивает аудиторию. Ключевой драйвер Gemini – выпуск новых моделей, зачастую лучших в категории в момент выхода (графическая Nano Banana, видео Veo 3, общая Gemini3). Кроме того, Gemini имеет преимущество в дистрибуции за счет встраивания в экосистему Google и активно использует маркетинг для продвижения.
Также на глобальных рынках представлено много решений от китайских разработчиков.
5) Новое направление развития ИИ-ассистентов в 2025 году –развитие агентности. Пока это первые эксперименты в области лайфстайл, офисной и личной продуктивности, кодинга.
Тренд будет развиваться следующие несколько лет. Игроки рынка уже начинают адаптировать инфраструктуру в области безопасности, финансов, бизнес моделей под будущее ИИ-агентов
6) в 2025 году на рынке сформировался новый отраслевой стандарт продукта. Им стали ИИ-браузеры, которые в концу года запустили все крупнейшие разработчики. Именно в таком интерфейсе пользователи получают привычный и при этом новый удобный для себя опыт взаимодействия с генИИ
7) Главный вопрос года в сфере генИИ – экономика индустрии, которая пока отрицательная. В 2025 году на рынке не было много экспериментов с моделями ценообразования, но было много партнерских сделок для привлечения финансирования и создания общей уникальной ценности продукта
8) В 2025 году было много виральных кейсов, которые способствовали вовлечению пользователей в категорию и давали рост продуктам. Большая их часть связана с графической модальностью. Более подробно о главных итогах 2025 года в сфере генИИ, в полной версии дайджеста.
9👌4👏1
Как-то так. Статья прошла все рецензии и была на стадии proofs.
💔39😭32🔥2🤔2
Вениамин Фишман
Как-то так. Статья прошла все рецензии и была на стадии proofs.
Нужно составить blacklist журналов, куда не берут по аффилиациям РФ (как правило это не любые аффилиации, а институты из SDN, но бывает по-разному). Пишите в комменты, буду обновлять в сообщении. Ну или может где-то уже есть такой?

Upd: немного устаревший список из зоопарка: https://t.me/ivoryzoo/2715

1. PLOS - AIRI , Сколтех
2. ACS - МФТИ
3. Optica - SDN list
4. RSC Advances - банят любых авторов из России
5.
👍7🫡3😱2
Вышел Nucleotide Transformer v3 - языковая модель ДНК от InstaDeep (BioNTech). Хорошая и очень подробная статья.

TL;DR - если вам нужно зафантюнить модель
ДНК-->разметка или функция
+ в задаче важен длинный контекст,
NTv3 и аналогичные претренированные модели (например, наша GENA) - лучшее решение по соотношению копьют/качество. Если задачу уже решил aGenome/Borzoi/etc - без разницы кого брать.

Больше всего впечатлило, что модель может точно предсказать эффект мутации энхансеров на расстоянии 20+ Kb от промотора, причем чувствует разинцу в силе энхансера, его расстояния до промотора и осознает, в каком типе клеток это все происходит.

П.С. Картинки очень красиво у них сделаны =)
П.П.С. Традиционно привожу и ссылку на мнения критиков, которые считаю, что все эти модели - путь в никуда
14👍5
Чуть больше деталей:

- как я и предполагал, идет поступательное развитие области. NTv3 файнтюнится и инеферит быстрее, а точность дает выше, чем для предыдущих моделей. Но прорыва - чтобы тут все стало х10 лучше - нет.

- качество NTv3 после файнтюнинга сопоставимо с SOTA для специализированных моделей (см. сравнение с Borzoi). Претрена не помогает радикально повысить это качество, но помогает сделать фантюн быстрее и дешевле. Жаль, что нет савнения с aGenome (думаю, появится в журнальной версии). С другой стороны, даже если aGenome маргинально лучше (сильно лучше быть не может, т.к. он и в сравнении с Borzoi не на порядок лучше), вы все равно не можете взять aGenome и зафайнтюнить для своих задач.

- скейлинг до 1B подтверждается, дальше проблема скейлинга по-прежнему не решена (аворы вроде как и не пытались больше 650М модели тренить, но я уверен что это потому что не смогли улучшить качество, а не потому что не хотели). Этот (на мой взляд главный) приз ещё ждет своего победителя.

- круто, что есть функциональная валидация - пусть сетап не идеальный, но лабораторная валидация предсказаний становится важной частью для топовых статей.

Сделал себе много заметок с техническими деталями, буду постепенно дополнять ими комментарии к посту.
👍62
Forwarded from Timofey Lagunov
Поскольку днк очень длинная, можно предположить, колебательная мода на 10см у неё есть. Тогда при длительном регулярном воздействии (желательно такой интенсивности, чтобы "плавилась шоколадка в кармане" как в истории с открывателем этих волн) возможны проблемы с клеткой. Но первыми под удар попадут жиры.

И самый любимый факт: насколько помню изобретателя микроволновки зовут Эрих Грейнахер)))
И только русские могут оценить настолько чёткое исполнение предназначения семьи))
🤣30😁63🔥2👀2😱1
Designing AI-programmable therapeutics with the EDEN family of foundation models

https://www.biorxiv.org/content/10.64898/2026.01.12.699009v1.full

Очень интересная работа - новая претренированная языковая модель ДНК, которая может дизайнить функциональные последовательности - новые рекомбиназы, CAR для терапевтических T-клеток, антимикробные пептиды и т.д.

Внимательно ещё не разбирал, если кто читал - поделитесь впечатлениями
Randomizing human genome

Классная работа вышла в Science. При помощи prime editing вставили Cre-рекомбиназу в тысячи L1 повторов, а потом сгерировали сотни различных хромосомных перестроек и оценили, как они влияют на работу генов.

Пару лет назад мы опубликовали идеологически похожую работу, хотя, конечно, и не с таким масштабом

https://pubmed.ncbi.nlm.nih.gov/36842155/
12🔥5👍3🗿3
От коллег