Вениамин Фишман
1.24K subscribers
406 photos
73 videos
26 files
165 links
Генетика через призму AI, а также о науке (и в целом о жизни) в РФ и за рубежом
Download Telegram
Коллеги из Бразилии просят распространить информацию о грантах для иностранных ученых. Пятилетний грант для работы в университетах/институтах Сан-Пауло, объем финансирования около 85 тыс. USD в год + зарплата руководителя проекта.

https://fapesp.br/17470/call-for-proposals-fapesp-grant-for-international-researchers
🔥102👍2
Коллеги отправили две занятные статьи:

1) https://www.nature.com/articles/s41467-025-58699-1/
2) https://www.biorxiv.org/content/10.1101/2025.04.14.648850v1.full.pdf

Разные по своей природе, мне они показались близкими с точки зрения двух идей:
1) анализа single-cell RNA-seq данных (кстати, обе делают акцент на использовании БД cell x gene)
2) возможности объединять биологические данные (измеренные на специальном приборе уровни активности генов в клетке) с текстовой информацией, описывающей клетки и гены понятным человеку языком.

Во второй статье описывается модель C2S, основанная на Gemini от google (27В параметров), которая вообще может полноценно "разговаривать" с пользователем на человеческом языке, отвечая на запросы вроде "вот список работающих в клетке генов, скажи мне, что это за тип клеток и чем болеет донор? А что будет с этой клеткой, если я дам донору такое-то лекарство?".

C2S это, с моей точки зрения, скорее пиарная статья, чем реально работающий инструмент. Но ведь и глядя на первые языковые модели мало кто думал, что они дорастут до сегодняшнего уровня?
👍6💩1
П.С. Вот тут можно посмотреть пример "разговора" с C2S

https://storage.googleapis.com/gweb-research2023-media/media/CellToSent3_ExamplesFinal.mp4
Я вылетаю в Сингапур на конференцию ICLR. Жду с нетерпением новых впечатлений от прогресса в области ML за прошедший год.

А пока - опробовал автоматические терминалы паспортного контроля в Шереметьево. Задумка хорошая, но они сканируют паспорт по 2-3 минуты - дольше чем это делал человек в кабинке. Так что проблему очередей только усугубляют.
11👾3🔥2
Как бы там ни было, China Eastern Airlines приветствует меня на борту. Впереди - 8-часовой перелёт в Шанхай, оттуда, с короткой пересадкой, вылетаю в Сингапур.

Кстати, прочитав сводку об истории этого государства, искренне впечатлён "азиатским тигром", который за 40-50 лет - время жизни одного поколения - превратился из бедной постколониальной страны в технологического гиганта.
🔥20👍2
Лечу над территорией Китая, в двух часах лета от Шанхая. Господи, ну когда уже и у нас будет интернет на борту самолётов?
На подлёте к Шанхаю - огромные площади заняты этими конструкциями, которые мне напоминают парники. Что это?
Персональный VPS сервер не только позволяет открывать IGV и bioxriv в РФ, но и запустить телеграм и вотсап в Китае. Интересно, что теле2 предлагает для этого отдельную услугу - VPN в роуминге.
Пока пара слов о том, как получить визу в Сингапур.

В целом - это очень просто. Можно очно обратиться в авторизованный визовый центр. В случае РФ - это VFS Global. Но не все отделения VFS могут делать визу в сингапур, например, Новосибирское не может. Поэтому я пошел другим путем и заказал визу через один из многочисленных онлайн-сервисов, которые позволяют вообще не появляться очно в визовом центре - достаточно просто отправить им сканы документов. Сверился с отзывами и даже нашел коллег на работе, которые пользовались этим сервисом в прошлом году. Через несколько часов, как прилечу, узнаю, развод это или нет =)
👍2
Паспортный контроль в Сингапуре - топ. Никаких очередей, никаких людей, никаких вопросов. Приложил паспорт, через 15 секунд прошёл турникеты под надписью welcome.
🔥84
Наши друзья и колабораторы из Санкт-Петербургского Университета завели блог "Хромосомы и кофе ", где рассказывают новости об устройстве хромосом:
https://t.me/chromosome_news
😁52👍1
Первое впечатления от города — тут очень чисто на улицах. Нигде не видел такой чистоты. Ни одного фантика не нашёл.

А ещё тут люди вокруг такого роста как я (или даже ниже). Это очень непривычное ощущение для моих 166 см.
😁39👍64
Заметки с конференции:
Agreement of similarly trained classifiers as measure of out of distribution error w/o out of distribution data
10
Обратил внимание, что на этой конференции одним из трендов являются работы по unlearning - по технологиям, как заставить модель "забыть" какую-то информацию, которая присутствовала во время обучения.
👍18😁10
Вениамин Фишман
Коллеги отправили две занятные статьи: 1) https://www.nature.com/articles/s41467-025-58699-1/ 2) https://www.biorxiv.org/content/10.1101/2025.04.14.648850v1.full.pdf Разные по своей природе, мне они показались близкими с точки зрения двух идей: 1) анализа…
Выше я писал о моделях, которые используют описания биологических объектов - гены, изменения их активности, болезни, лекарства - используя обычный текст. На конференции несколько примеров таких моделей.👇
2👍1
Ещё один вариант архитектуры для языковых моделей ДНК. Чем-то похоже на state space models. Статья:

https://arxiv.org/abs/2411.04165
Прекрасный доклад, в котором показано (вообще говоря далеко не в первый раз), что полно модных моделей для предсказания экспрессии, которые ничем не лучше (хуже!) усреднения по уже известным клеточным типам.
😁62
Вот эта идея давно у меня сидит в голове: почему бы в транскриптомных моделях, которые на входе используют эмбединг гена (вроде scGPT), не использовать эмбединг из днк? А то люди что только не берут - эмбединг белка, эмбединг текста с описанием гена...
👍10
Автобус для наработки вирусных частиц
😁37🤣11❤‍🔥1