Вениамин Фишман
1.23K subscribers
406 photos
73 videos
26 files
165 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Как бы там ни было, China Eastern Airlines приветствует меня на борту. Впереди - 8-часовой перелёт в Шанхай, оттуда, с короткой пересадкой, вылетаю в Сингапур.

Кстати, прочитав сводку об истории этого государства, искренне впечатлён "азиатским тигром", который за 40-50 лет - время жизни одного поколения - превратился из бедной постколониальной страны в технологического гиганта.
🔥20👍2
Лечу над территорией Китая, в двух часах лета от Шанхая. Господи, ну когда уже и у нас будет интернет на борту самолётов?
На подлёте к Шанхаю - огромные площади заняты этими конструкциями, которые мне напоминают парники. Что это?
Персональный VPS сервер не только позволяет открывать IGV и bioxriv в РФ, но и запустить телеграм и вотсап в Китае. Интересно, что теле2 предлагает для этого отдельную услугу - VPN в роуминге.
Пока пара слов о том, как получить визу в Сингапур.

В целом - это очень просто. Можно очно обратиться в авторизованный визовый центр. В случае РФ - это VFS Global. Но не все отделения VFS могут делать визу в сингапур, например, Новосибирское не может. Поэтому я пошел другим путем и заказал визу через один из многочисленных онлайн-сервисов, которые позволяют вообще не появляться очно в визовом центре - достаточно просто отправить им сканы документов. Сверился с отзывами и даже нашел коллег на работе, которые пользовались этим сервисом в прошлом году. Через несколько часов, как прилечу, узнаю, развод это или нет =)
👍2
Паспортный контроль в Сингапуре - топ. Никаких очередей, никаких людей, никаких вопросов. Приложил паспорт, через 15 секунд прошёл турникеты под надписью welcome.
🔥84
Наши друзья и колабораторы из Санкт-Петербургского Университета завели блог "Хромосомы и кофе ", где рассказывают новости об устройстве хромосом:
https://t.me/chromosome_news
😁52👍1
Первое впечатления от города — тут очень чисто на улицах. Нигде не видел такой чистоты. Ни одного фантика не нашёл.

А ещё тут люди вокруг такого роста как я (или даже ниже). Это очень непривычное ощущение для моих 166 см.
😁39👍64
Заметки с конференции:
Agreement of similarly trained classifiers as measure of out of distribution error w/o out of distribution data
10
Обратил внимание, что на этой конференции одним из трендов являются работы по unlearning - по технологиям, как заставить модель "забыть" какую-то информацию, которая присутствовала во время обучения.
👍18😁10
Вениамин Фишман
Коллеги отправили две занятные статьи: 1) https://www.nature.com/articles/s41467-025-58699-1/ 2) https://www.biorxiv.org/content/10.1101/2025.04.14.648850v1.full.pdf Разные по своей природе, мне они показались близкими с точки зрения двух идей: 1) анализа…
Выше я писал о моделях, которые используют описания биологических объектов - гены, изменения их активности, болезни, лекарства - используя обычный текст. На конференции несколько примеров таких моделей.👇
2👍1
Ещё один вариант архитектуры для языковых моделей ДНК. Чем-то похоже на state space models. Статья:

https://arxiv.org/abs/2411.04165
Прекрасный доклад, в котором показано (вообще говоря далеко не в первый раз), что полно модных моделей для предсказания экспрессии, которые ничем не лучше (хуже!) усреднения по уже известным клеточным типам.
😁62
Вот эта идея давно у меня сидит в голове: почему бы в транскриптомных моделях, которые на входе используют эмбединг гена (вроде scGPT), не использовать эмбединг из днк? А то люди что только не берут - эмбединг белка, эмбединг текста с описанием гена...
👍10
Автобус для наработки вирусных частиц
😁37🤣11❤‍🔥1
Один из очень впечатляющих докладов на ICLR был о специализированной биологической модели, которая имеет доступ к >200 биологическим инструментам и базам данных. Эта модель может действовать как учёный — сама предлагает гипотезу, ставит эксперименты с данными или, если публичных данных недостаточно, пишет протоколы для лабораторной работы, анализирует полученные результаты, делает вывод подтвердилось ли гипотеза.

На днях авторы выложили несколько демок и открыли форму регистрации для тестирования этой модели:

https://www.actoslab.com/biomni
🤯14👍9🥴2❤‍🔥1
Прилетел на XI съезд Российского общества медицинских генетиков.

Уже и забыл как красив Питер!
👍18🥰53🔥2
Пока воспоминания свежи, короткий отчёт об ICLR и фото нашей делегации.

Основные тренды в биологических работах: - агенты (это когда одна нейросеть управляет другими, "агентами", у которых, как правило, есть возможности совершать какие-то действия - запускать софт , выходить в интернет, скачивать данные из публичных репозиториев и т.п.)
- предсказание эффектов пертурбаций - это когда есть какой-то параметр, измеряемый в норме и после определённого воздействия. Зная воздействие — нужно предсказать как изменится параметр. Типичный дизайн такого эксперимента — есть транскриптомные данные в норме и после обработки химическим агентом, нужно предсказать, как химический ген повлияет на экспрессию генов
- анализ медицинских изображений (например, выбор химиотерапии на основе анализа фотографий гистологических препаратов опухолей).
👍152🤗1
В целом, очень много интересных биологических работ, видно, что люди заинтересованы в решении биомедицинских задач. Хотя, к сожалению, лишь малая часть из них делается с пониманием особенностей биологических данных. Все больше работ в стиле кагл - мы что-то скачали с ncbi и давай перебирать архитектуры. А то, что эти данные сами по себе не очень, и никакие архитектуры этому не помогут - никто не разбирает. Из-за отсутствия биологической экспертизы и желания "выжать максимальный скор" много скрытых дата ликов (когда в модель в неявной форме подается информация о правильных ответах и ее метрики оказываются сильно завышенными).

Но, на мой взгляд, это нормально для такой новой и развивающейся области. Со временем вся шелуха отсеется, останутся только ценные работы.

И уже сейчас есть очень амбициозные и вдохновляющие проекты, как, например, biomni о которой я писал выше. Ясно, что всё это ещё нужно настраивать и дорабатывать, и не факт что в итоге всё получится. Но если что-то получится, это может стать большим прорывом в биологии.
👍214💯1