Вениамин Фишман
1.23K subscribers
406 photos
73 videos
26 files
164 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Наверное, для большинства "не открою Америку" , но поделюсь вариантом использования курсора/других ИИ инструментов, который мне последнее время понравился.

Когда я пишу сложные скрипты, где в коде есть куча нюансов, связанных с биологией (например, что-то нарезать на чанки, склеить по сайтам сплайсинга, найти рамки считывания и т.п.), я обычно не доверяю их ИИ. Эти штуки почти неизбежно косячит в паре мест, а разбирать и проверять их код дольше, чем писать самому. Помогает разве что пользоваться IDE, где сразу предлагается дописать несколько строчек и подсказывают синтаксис - это немного ускоряет процесс. Но в целом большую часть я пишу сам.

Последнее время после написания кода прошу курсор или GPT проверить, есть ли ошибки - и он часто подсвечивает косяки, которые в противном случае пришлось бы долго искать дебагом. Хорошо экономит время.
👍168🔥1
Update: пока рекомендаций достаточно, всем спасибо, буду пробовать!

А ещё вопрос в аудиторию. У меня на моем личном VDS сервере долго бесперебойно работал VPN на ocserv, но в последнее время у части провайдеров он отрубается (соединяет с VPN-хотстом, но доступа в интернет нет - видимо блочится на уровне пакетов). Если кто-то знает, что можно поставить на VDS, чтобы в РФ работало, напишите. В коменты такое лучше не писать (у нас вроде публичные советы по настройке VPN запрещены законом), так что пишите в лс @minjafish

П.С. Готовые платные VPN от сторонних сервисов меня не интересуют, вопрос именно в том, что поставить на свой личный VDS на Ubuntu, желательно с хорошей инструкцией.
6
Посчитал по небольшой выборке грантов РНФ, которые подавала моя группа, разницу в среднем балле успешных и неуспешных заявок.

- У трех успешных баллы (усреднение по 3 экспертам) = 4.56, 4.71, 4.83 (один из экспертов поставил все (!) пятерки). Интересно, что у некоторых 2 экспертизы, у некоторых три.

- У неуспешных = 4.3, 4.14, 3.86

Итого, кажется проходной балл был в районе 4.5

А вы писали РНФ на 1.5 млн? Поделитесь баллами в комментарии! Можно кинуть мне рецензию, если лень считать среднее, я попрошу GPT посчитать.

Коллеги прислали свои оценки, пост обновил.
🔥10👀8🤔52😭1
Принимаю участие в отчётной сессии AIRI. Каждый год впечатляет широта применения ИИ:

- создание .cad файла с инженерными коммуникациями из картинок, дизайн планировок помещений
- перевод древнеегипетских текстов
- анонимизация голоса
- создание ИИ агентов с общей памятью
- создание робота-домохозяйки

Это только первые три доклада! Буду интересное дополнять в комментариях.

В цифрах: 100 статей уровня А* за год.
🔥278🤯1
Всем привет! Мы активно ищем постдока (возможен вариант защиты в 2026) для работы в университете Сириус с нашей группой. Бэкграунд в биоинформатике и/или ML. Будем делать новые AI-архитектуры для решения геномных задач в тесной коллаборации с ИЦиГ и AIRI.

Проживание в Сочи (в Сириусе), дадут служебное жильё с бассейном, в 5 минутах от моря, кому это важно. Писать мне:

@minjafish (ТГ)
minja-f@ya.ru
🔥19😁104😎3👀2🤩1
Команда Ярослава Беспалова представила сегодня классный доклад и постеры по использованию AI в медицине

- медицинский ассистент, который общается с пациентом, уточняет жалобы и рекомендует, к какому врачу обратиться (70к обращений в месяц)
- интерпретатор анализов КДЛ, с которым можно обсудить результаты своих лабораторных исследований в контексте различных симптомов
- ИИ консилиум - к такому ассистенту может прийти врач, чтобы посоветоваться или, наоборот, поспорить

Проговорили с Ярославом идею совместно поработать над ИИ-интерпретатором для медико-генетических тестов. Кажется, идея нашла отклик со всех сторон.
🔥259🤡1
Наткнулся на дискуссию о том, что называется вайб-кодингом - когда задачу написания кода за вас полностью решает ИИ:

Пост 1.

"Если ко мне на проект приходит студент и за пару недель работы ни разу не говорит что завайбкодил какой-то кусочек работы или для литобзоров не пользуется нейропоиском, то я начинаю его этому обучать 100%..."


Пост 2.

"...в рисерче для такого нужно не забывать о дотошности, и постоянной паранойе к маленьким деталям, к дисциплине в общем, которой у новичков обычно нет. Я так собесил людей на практику недавно, ллм то они юзали с радостью, только потом не могли рассказать что за метрика на графиках, почему они ее выбрали (посоветовал чатгпт), а уж как она считается даже не представляли на самом деле (сутуация у 90% стажеров сделавших тестовое)"

Я полностью согласен с авторами обоих постов. Особенно про дотошность и паранойю к деталям в ресерче!

Меня безмерно удивляет как студенты, принципиально НЕ использующие GPT, так и те, кто не читает сгенерированный им код и/или не понимающие что там написано.

Единственный понятный мне пример, когда такой подход (сгенерить и не разбираться) имеет право на жизнь - это если нужно сделать абсолютно не интересную задачу, важность которой равна нулю, и я уверен, что приобретённые при этом знания мне не понадобятся. Но таких задач я стараюсь в принципе избегать.
👍2513🤝4
Опубликовали статью в Epigenetics & Chromatin в июне
||
v
К августу мне прислали ссылку на оплату картой. Я написал, что мне для отчета за оплату нужен счет.
||
v
В декабре (!) прислали счет - при этом я трижды писал и напоминал. И уточнили, что нужно обязательно уложиться с оплатой в 1 месяц.

Естественно, никакие закупки в этом году госорганизации уже не делают. Ну... напишу в редакцию, что они сами виноваты.

П.С. Для тех, кто не знаком с масштабом - плата за публикацию твоей статьи (т.е. за то, что редактор ее прочитал, пообщался с рецензентами, которые работают бесплатно, а потом техредактор перегнал текст в шаблон журнала и выложил на сайт) - >3k евро. Кажется, за эти деньги можно было бы порасторопнее работать.
🙉289😁5🤡5🤷1
Все знают, что такое ЭКО, но не все - что при ЭКО можно тестировать эмбрионы и выбрать тот, который не содержит генетических аномалий, связанных с серьезными заболеваниями. Технология сложная - требуется протестировать крошечный фрагмент эмбриона, всего 4-6 клеток.

Стандартные методы обнаруживают изменения копийности крупных фрагментов ДНК, но не перемещения (транслокации) фрагментов друг относительно друга. Хотя транслокации редко приводят к болезням, у носителей почти всегда возникают проблемы с формированием половых клеток. Таким людям можно помочь завести ребенка с помощью ЭКО, но поскольку отличить эмбрион-носитель транслокации от нормы нельзя в следующем поколении проблема воспроизводится.

В большом многоцентровом исследовании в партнерстве сведущими центрами ЭКО мы решили эту проблему, показав, что метод Hi-C позволяет обнаружить транслокации в биоптатах эмбрионов. Теперь статья ищет место на страницах журналов, а мы ищем партнерства с клиниками и компаниями, готовыми внедрять новый метод в практику
🔥62👍16😍83
Вениамин Фишман
Все знают, что такое ЭКО, но не все - что при ЭКО можно тестировать эмбрионы и выбрать тот, который не содержит генетических аномалий, связанных с серьезными заболеваниями. Технология сложная - требуется протестировать крошечный фрагмент эмбриона, всего 4…
Одной из сложных задач, которую нам пришлось решить в ходе этого проекта - отсутствие большого числа контролей. Для методов, основанных на секвенировании, аномалии копийности ДНК обычно ищут на основе сравнения образца с контрольной группой без отклонений в копийности. Но в случае эмбрионов человека такую группу очень сложно собрать - ведь эмбрионы без нарушений чаще всего оставляют для переноса матери и рождения ребенка.

Эту проблему мы решили, используя AI-подходы. Совместно с AIRI и при поддержке фонда Blue Sky Research мы сделали метод, который выявляет особенности пробоподготовки и аномалии копийности каждого локуса используя данные о копийности других участков в этом том же образце. Такой метод (мы назвали его GENATECTOR) - работает существенно лучше стандартных биоинф инструментов, запущенных в режиме "без контрольного образца" и чуть-чуть лучше, чем если сделать контроль усредняя нескольких образцов с разными (не совпадающими) хромосомными перестройками.
🔥4011
Немного сумбурно попытался уложить в час то, что сейчас в фокусе моих интересов из ML в геномике. Получилось хаотично, но может быть кому-то будет интересно послушть.
24🥰1
Forwarded from V K
Друзья, всем привет!

Мы подготовили финальный в этом году дайджест трендов.

Весь год смотрели и анализировали генИИ и в этом материале подводим итоги года – главные тренды и выводы развития ИИ-ассистентов на международных рынках.
А также наш новый, пока экспериментальный, формат анализа –продуктовых и маркетинговых активностей ИИ-сервисов и их влияния на пользовательские метрики приложения.
Многое еще нужно будет доработать — на важно стартовать.

В качестве главных трендов и итогов 2025 года для ИИ-ассистентов мы выделяем 8-мь:
1) Главный итог года - генеративный ИИ стал частью повседневной жизни. Результаты опросов людей показывают, что уровень проникновения GenAI в развитых странах (Европа, Америка и др.) уже превышает 60%. В России картина аналогична.
2) ИИ-ассистенты постепенно превращаются в платформы для повседневной жизни, объединяя всё больше сервисов экосистем и внешних партнеров внутри своих интерфейсов. Это создает новые возможности и опыт для пользователей. Также на рынке развивается тренд интеграции ИИ-ассистентов в новые носимые устройства – в первую очередь наушники и диктофоны.
3) Гигиеническим минимум ИИ-ассистентов становятся образовательные функции. Это и специальные режимы для обучения новому и собственные инструменты для обучения работе с генИИ
4) Конкуренция среди ИИ-ассистентов усиливается. ПокаChatGPT остается безусловным лидером по аудитории с более чем 800 млн пользователей в месяц на мобильных устройствах. Но Gemini агрессивно наращивает аудиторию. Ключевой драйвер Gemini – выпуск новых моделей, зачастую лучших в категории в момент выхода (графическая Nano Banana, видео Veo 3, общая Gemini3). Кроме того, Gemini имеет преимущество в дистрибуции за счет встраивания в экосистему Google и активно использует маркетинг для продвижения.
Также на глобальных рынках представлено много решений от китайских разработчиков.
5) Новое направление развития ИИ-ассистентов в 2025 году –развитие агентности. Пока это первые эксперименты в области лайфстайл, офисной и личной продуктивности, кодинга.
Тренд будет развиваться следующие несколько лет. Игроки рынка уже начинают адаптировать инфраструктуру в области безопасности, финансов, бизнес моделей под будущее ИИ-агентов
6) в 2025 году на рынке сформировался новый отраслевой стандарт продукта. Им стали ИИ-браузеры, которые в концу года запустили все крупнейшие разработчики. Именно в таком интерфейсе пользователи получают привычный и при этом новый удобный для себя опыт взаимодействия с генИИ
7) Главный вопрос года в сфере генИИ – экономика индустрии, которая пока отрицательная. В 2025 году на рынке не было много экспериментов с моделями ценообразования, но было много партнерских сделок для привлечения финансирования и создания общей уникальной ценности продукта
8) В 2025 году было много виральных кейсов, которые способствовали вовлечению пользователей в категорию и давали рост продуктам. Большая их часть связана с графической модальностью. Более подробно о главных итогах 2025 года в сфере генИИ, в полной версии дайджеста.
9👌4👏1
Как-то так. Статья прошла все рецензии и была на стадии proofs.
💔39😭32🔥2🤔2
Вениамин Фишман
Как-то так. Статья прошла все рецензии и была на стадии proofs.
Нужно составить blacklist журналов, куда не берут по аффилиациям РФ (как правило это не любые аффилиации, а институты из SDN, но бывает по-разному). Пишите в комменты, буду обновлять в сообщении. Ну или может где-то уже есть такой?

Upd: немного устаревший список из зоопарка: https://t.me/ivoryzoo/2715

1. PLOS - AIRI , Сколтех
2. ACS - МФТИ
3. Optica - SDN list
4. RSC Advances - банят любых авторов из России
5.
👍7🫡3😱2
Вышел Nucleotide Transformer v3 - языковая модель ДНК от InstaDeep (BioNTech). Хорошая и очень подробная статья.

TL;DR - если вам нужно зафантюнить модель
ДНК-->разметка или функция
+ в задаче важен длинный контекст,
NTv3 и аналогичные претренированные модели (например, наша GENA) - лучшее решение по соотношению копьют/качество. Если задачу уже решил aGenome/Borzoi/etc - без разницы кого брать.

Больше всего впечатлило, что модель может точно предсказать эффект мутации энхансеров на расстоянии 20+ Kb от промотора, причем чувствует разинцу в силе энхансера, его расстояния до промотора и осознает, в каком типе клеток это все происходит.

П.С. Картинки очень красиво у них сделаны =)
П.П.С. Традиционно привожу и ссылку на мнения критиков, которые считаю, что все эти модели - путь в никуда
14👍5
Чуть больше деталей:

- как я и предполагал, идет поступательное развитие области. NTv3 файнтюнится и инеферит быстрее, а точность дает выше, чем для предыдущих моделей. Но прорыва - чтобы тут все стало х10 лучше - нет.

- качество NTv3 после файнтюнинга сопоставимо с SOTA для специализированных моделей (см. сравнение с Borzoi). Претрена не помогает радикально повысить это качество, но помогает сделать фантюн быстрее и дешевле. Жаль, что нет савнения с aGenome (думаю, появится в журнальной версии). С другой стороны, даже если aGenome маргинально лучше (сильно лучше быть не может, т.к. он и в сравнении с Borzoi не на порядок лучше), вы все равно не можете взять aGenome и зафайнтюнить для своих задач.

- скейлинг до 1B подтверждается, дальше проблема скейлинга по-прежнему не решена (аворы вроде как и не пытались больше 650М модели тренить, но я уверен что это потому что не смогли улучшить качество, а не потому что не хотели). Этот (на мой взляд главный) приз ещё ждет своего победителя.

- круто, что есть функциональная валидация - пусть сетап не идеальный, но лабораторная валидация предсказаний становится важной частью для топовых статей.

Сделал себе много заметок с техническими деталями, буду постепенно дополнять ими комментарии к посту.
👍62
Forwarded from Timofey Lagunov
Поскольку днк очень длинная, можно предположить, колебательная мода на 10см у неё есть. Тогда при длительном регулярном воздействии (желательно такой интенсивности, чтобы "плавилась шоколадка в кармане" как в истории с открывателем этих волн) возможны проблемы с клеткой. Но первыми под удар попадут жиры.

И самый любимый факт: насколько помню изобретателя микроволновки зовут Эрих Грейнахер)))
И только русские могут оценить настолько чёткое исполнение предназначения семьи))
🤣30😁63🔥2👀2😱1