Коллеги из ЛабИИ Сбера (также известной как Центр Практического ИИ) рассказали о нашем совместном проекте на Семинаре AIRI:
Forwarded from ИИ Песочница | RnD про ML, AI, Data Science
Иван Поддъяков - DS из нашей Лабы - представил крутую работу на семинаре Молекулярная кухня от AIRI
Доклад посвящен мультиагентному подходу для генерации малых химических молекул. Суть исследования в том, чтобы построить систему ИИ-агентов, способную выполнять:
- «Понимание» запросов из области молекулярных наук на естественном языке
- Запуск каскада генеративных моделей и расчетных химических инструментов для выполнения задачи
- Формирование для исследователя отчёта с результатами
Такие системы позволят ускорить поиск новых соединений, однако есть важное уточнение:
Подобные исследования не всегда доходят до лабораторных тестов — нужны партнерства с химиками и серьезные ресурсы. Без экспериментов сложно оценить реальную пользу, — комментирует Иван.
Исследование выполнено совместно с друзьями из центра «Сильный искусственный интеллект в промышленности», ИТМО
📄 Статья
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Forwarded from ФТИИ ИТМО
Секреты успеха от наших лучших выпускников🤩
Поздравляем наших ребят! Абдурахимов Муслимбек и Стрелков Леон победили в номинации «Лучший выпускник ИТМО 2025», а Гусаров Дмитрий покорил «Научный эверест»! Мы улучили момент на ITMO Family Day и взяли у ребят небольшое интервью сразу после награждения: https://vk.com/video-38025481_456239127
🔥 Гордимся! 🔥
Поздравляем наших ребят! Абдурахимов Муслимбек и Стрелков Леон победили в номинации «Лучший выпускник ИТМО 2025», а Гусаров Дмитрий покорил «Научный эверест»! Мы улучили момент на ITMO Family Day и взяли у ребят небольшое интервью сразу после награждения: https://vk.com/video-38025481_456239127
🔥 Гордимся! 🔥
VK Видео
Короткое интервью с выдающимися выпускниками 2025
Интервью с победителями конкурса «Лучший выпускник ИТМО 2025»: — Абдурахимов Муслимбек — Стрелков Леон А также с победителем конкурса «Научный эверест» — Гусаровым Дмитрием!
🔥5
Forwarded from Научный опенсорс (Nikolay Nikitin)
Недавно обещал рассказать про так, как статью о нашем инструменте OSA приняли на воркшоп CODEML конференции ICML 2025.
Формат воркшопа любопытный - рассматривают статьи про новые ML-проекты с открытым кодом, багфиксы и улучшения в существующих, опыт разработки и предложения по улучшению процессов.
Поэтому написали туда короткую статью с описанием Осы и небольшими экспериментами по оценка качества генерации README и его сравнению с аналогами (ReadmeAI и др.). Получилось, на мой взгляд неплохо - с чем рецензенты и согласились.
Публикации non-archival - так что учтем полученные рецензии (довольно содержательные и позитивные) и подадим куда-нибудь ещё. Из минусов - нужна анонимизация (мне кажется, что для статей про опенсорс это несколько излишне).
Порадовало что организаторы отнесли нашу статью к категории spotlight - т.е. предложили выступить с докладом, а не только с постером. К сожалению, вживую добраться до ICML не удалось (получить визу в Канаду непросто) - но с доставкой постера помогли коллеги из AIRI, так что на воркшопе мы засветились (см. фото).
Текст статьи доступен на openreview, код - всё в том же репозитории https://github.com/aimclub/OSA.
Формат воркшопа любопытный - рассматривают статьи про новые ML-проекты с открытым кодом, багфиксы и улучшения в существующих, опыт разработки и предложения по улучшению процессов.
Поэтому написали туда короткую статью с описанием Осы и небольшими экспериментами по оценка качества генерации README и его сравнению с аналогами (ReadmeAI и др.). Получилось, на мой взгляд неплохо - с чем рецензенты и согласились.
Публикации non-archival - так что учтем полученные рецензии (довольно содержательные и позитивные) и подадим куда-нибудь ещё. Из минусов - нужна анонимизация (мне кажется, что для статей про опенсорс это несколько излишне).
Порадовало что организаторы отнесли нашу статью к категории spotlight - т.е. предложили выступить с докладом, а не только с постером. К сожалению, вживую добраться до ICML не удалось (получить визу в Канаду непросто) - но с доставкой постера помогли коллеги из AIRI, так что на воркшопе мы засветились (см. фото).
Текст статьи доступен на openreview, код - всё в том же репозитории https://github.com/aimclub/OSA.
🔥9
Открыт набор молодых исследователей и разработчиков в Институт ИИ ИТМО!
Институт ИИ и Исследовательский Центр "Сильный ИИ в промышленности" ИТМО открывают набор на позицию AI Researcher / AI Developer
З/п: Junior от 70 000-100 000 ₽, Middle 150 000-200 000 ₽.
Работа в крупнейших лабораториях Института ИИ:
- NSS Lab - https://itmo-nss-team.github.io/
- AI Industrial Research
Над какими задачами можно будет работать?
Институт ИИ занимается разработками с крупнейшими технологическими (Сбер, Яндекс) и индустриальными (Роснефть, Газпромнефть, Газпром, Татнефть) компаниями России и исследовательскими проектами. Темы можно разделить на 3 основных трека: по AI4Science, AI4Industry и по мультиагентным LLM.
Требования:
- уверенное чтение и владение английским языком на уровне, достаточном для чтения статей и технической документации (B1+);
- программирование на Python на продвинутом уровне (пакеты PyTorch, Numpy, Pandas, Matplotlib); также в понимание программной документации
- опыт работы с системами версионирования кода (GitHub/GitLab);
- знания и практические навыки решения ML/DL задач
- понимание основных принципов работы LLM
Отклики направлять в гугл-форму.
Институт ИИ и Исследовательский Центр "Сильный ИИ в промышленности" ИТМО открывают набор на позицию AI Researcher / AI Developer
З/п: Junior от 70 000-100 000 ₽, Middle 150 000-200 000 ₽.
Работа в крупнейших лабораториях Института ИИ:
- NSS Lab - https://itmo-nss-team.github.io/
- AI Industrial Research
Над какими задачами можно будет работать?
Институт ИИ занимается разработками с крупнейшими технологическими (Сбер, Яндекс) и индустриальными (Роснефть, Газпромнефть, Газпром, Татнефть) компаниями России и исследовательскими проектами. Темы можно разделить на 3 основных трека: по AI4Science, AI4Industry и по мультиагентным LLM.
Требования:
- уверенное чтение и владение английским языком на уровне, достаточном для чтения статей и технической документации (B1+);
- программирование на Python на продвинутом уровне (пакеты PyTorch, Numpy, Pandas, Matplotlib); также в понимание программной документации
- опыт работы с системами версионирования кода (GitHub/GitLab);
- знания и практические навыки решения ML/DL задач
- понимание основных принципов работы LLM
Отклики направлять в гугл-форму.
🔥10🥰2😁2❤1
Всем привет! По свежим следам рассказываем о вышедшей статье Low-Cost Microalgae Cell Concentration Estimation in Hydrochemistry Applications Using Computer Vision в журнале Sensors (Q1).
Работа посвящена методике подсчета концентрации клеток микроводорослей с помощью CV.
Эти культуры уже во всю используются для очищения водоемов, синтеза биомассы и в качестве альтернативных источников топлива. Экологи из ИТМО (GreenTech) занимаются этой темой с точки зрения оптимизации условий их культивации в лаборатории. При этом лаборанты тратят уйму времени на ежедневный ручной подсчет клеток и прочую обработку образцов.
Казалось бы идея считать клетки по снимкам с микроскопа давно избита, но просто пронумеровать объекты недостаточно, чтобы получить концентрацию для всего образца.
Мы предложили коллегам метод, который будет 1) сам считать клетки вместо лаборанта и 2) сам считать концентрацию на основе характеристик оборудования (увеличения микроскопа, объема счетной камеры, разрешения снимков).
Клетки микроводорослей (Chlorella vulgaris) имеют круглую форму, поэтому классическое CV справилось лучше нейросетей (еще и в условиях ограниченности размеченных данных для обучения).
В результате получился автоматизированный (и легковесный) метод подсчета концентрации, позволяющий лаборантам работать быстрее - код доступен на GitHub. Использование счетных камер распространено в микроскопии разных предметных областей, так что метод универсальный, будем искать на чем еще его можно апробировать🌿 🌿 🌿
В приложении небольшой фотоотчет из мокрой лаборатории (той где люди ходят в халатах и соблюдают стерильность))
Команда проекта: Борисова Юлия, Иван Морщинин, Вероника Назарова, Нелли Молодкина и Николай Никитин
Работа посвящена методике подсчета концентрации клеток микроводорослей с помощью CV.
Эти культуры уже во всю используются для очищения водоемов, синтеза биомассы и в качестве альтернативных источников топлива. Экологи из ИТМО (GreenTech) занимаются этой темой с точки зрения оптимизации условий их культивации в лаборатории. При этом лаборанты тратят уйму времени на ежедневный ручной подсчет клеток и прочую обработку образцов.
Казалось бы идея считать клетки по снимкам с микроскопа давно избита, но просто пронумеровать объекты недостаточно, чтобы получить концентрацию для всего образца.
Мы предложили коллегам метод, который будет 1) сам считать клетки вместо лаборанта и 2) сам считать концентрацию на основе характеристик оборудования (увеличения микроскопа, объема счетной камеры, разрешения снимков).
Клетки микроводорослей (Chlorella vulgaris) имеют круглую форму, поэтому классическое CV справилось лучше нейросетей (еще и в условиях ограниченности размеченных данных для обучения).
В результате получился автоматизированный (и легковесный) метод подсчета концентрации, позволяющий лаборантам работать быстрее - код доступен на GitHub. Использование счетных камер распространено в микроскопии разных предметных областей, так что метод универсальный, будем искать на чем еще его можно апробировать
В приложении небольшой фотоотчет из мокрой лаборатории (той где люди ходят в халатах и соблюдают стерильность))
Команда проекта: Борисова Юлия, Иван Морщинин, Вероника Назарова, Нелли Молодкина и Николай Никитин
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤3
Forwarded from ФТИИ ИТМО
🎉 Поздравляем нашего аспиранта Иллариона Иова!
27 июля, на церемонии закрытия Летней школы машинного обучения SMILES-2025 в Харбине (HIT, Китай), его постер «Оптимизация графов в AutoML с помощью больших языковых моделей» получил приз от Сбера как одна из лучших работ школы.
Исследование Иллариона показывает, как LLM помогают быстрее искать оптимальные вычислительные графы в AutoML-процессах — а значит, экономить часы экспериментов.
SMILES-2025 стала первой школой цикла, прошедшей за пределами России, и объединила более 120 очных и сотни онлайн-участников. Программа была посвящена генеративным методам, мультимодальным моделям и работе с LLM.
Гордимся успехом Иллариона и ждём новых публикаций и проектов!
27 июля, на церемонии закрытия Летней школы машинного обучения SMILES-2025 в Харбине (HIT, Китай), его постер «Оптимизация графов в AutoML с помощью больших языковых моделей» получил приз от Сбера как одна из лучших работ школы.
Исследование Иллариона показывает, как LLM помогают быстрее искать оптимальные вычислительные графы в AutoML-процессах — а значит, экономить часы экспериментов.
SMILES-2025 стала первой школой цикла, прошедшей за пределами России, и объединила более 120 очных и сотни онлайн-участников. Программа была посвящена генеративным методам, мультимодальным моделям и работе с LLM.
Гордимся успехом Иллариона и ждём новых публикаций и проектов!
🔥18👍5
Всем привет. Начинаем день с бодрящих рекомендаций в гиперболических координатах.
Мы конечно не Сбер, в контестах не побеждаем (но коллег поздравляем). Но тем не менее у нас тоже естьпробитие принятие статьи на RecSys в этом году.
Суть такова: обычно, для учёта геометрии в модельках (включая рексисы), нужно архитектуру модели поменять, иногда и довольно критично. Такие изменения, как правило, замедляют инференс, а в рекомендациях надо выдавать ответ быстро. Собрав волю в кулак, мы использовали постановку manifold regularization для задания нестрогих ограничений на геометрию при этом основная архитектура не меняется - это вообще win-win. В реальных данных геометрия неточная, да ещё и архитектура остаётся неизменная. Конечно, природу не обманешь, и нужно на этапе обучения тратить дополнительное время и ресурсы.
Что интересно, никто из нас не разбирается в рекомендательных системах (это вообще первая статья в нашей лабе по ним), мы просто применили математический аппарат там, где было уместно. Вот оно, вот зачем математика пригодилась, выходит.
Пока что у нас есть красивый репо: https://github.com/ITMO-NSS-team/RECMAN_recsys2025
А скоро будет и сама статья (пока не опубликовали) https://doi.org/10.1145/3705328.3759323
Мы конечно не Сбер, в контестах не побеждаем (но коллег поздравляем). Но тем не менее у нас тоже есть
Суть такова: обычно, для учёта геометрии в модельках (включая рексисы), нужно архитектуру модели поменять, иногда и довольно критично. Такие изменения, как правило, замедляют инференс, а в рекомендациях надо выдавать ответ быстро. Собрав волю в кулак, мы использовали постановку manifold regularization для задания нестрогих ограничений на геометрию при этом основная архитектура не меняется - это вообще win-win. В реальных данных геометрия неточная, да ещё и архитектура остаётся неизменная. Конечно, природу не обманешь, и нужно на этапе обучения тратить дополнительное время и ресурсы.
Что интересно, никто из нас не разбирается в рекомендательных системах (это вообще первая статья в нашей лабе по ним), мы просто применили математический аппарат там, где было уместно. Вот оно, вот зачем математика пригодилась, выходит.
Пока что у нас есть красивый репо: https://github.com/ITMO-NSS-team/RECMAN_recsys2025
А скоро будет и сама статья (пока не опубликовали) https://doi.org/10.1145/3705328.3759323
🔥10❤3
Про ресерч Юлии Борисовой пишут. Про связанную с ним статью как раз недавно рассказывали.
Forwarded from Корень из ИТМО
Найдите на картинке кота 👀
Мы, конечно, шутим. Кота здесь нет, зато есть вот такие полезные крохи — микроводоросли, которые используют в пищевой промышленности, косметологии, для очистки водоемов и в качестве экологичного топлива.
Но массово выращивать их не так просто — надо подобрать подходящие условия для роста клеток и постоянно следить за их концентрацией. Это довольно долго и трудозатратно.
🟢 В ИТМО придумали, как справляться с этой задачей всего за 30 секунд — с помощью компьютерного зрения. Метод не только быстрый, но и более простой: для подсчетов не нужно использовать специальное оборудование, достаточно обычного ПК.
Как всё работает? Насколько точен метод? И как ученые будут развивать разработку — читайте в материале ITMO NEWS!🔙
#разработки #наукавИТМО
Мы, конечно, шутим. Кота здесь нет, зато есть вот такие полезные крохи — микроводоросли, которые используют в пищевой промышленности, косметологии, для очистки водоемов и в качестве экологичного топлива.
Но массово выращивать их не так просто — надо подобрать подходящие условия для роста клеток и постоянно следить за их концентрацией. Это довольно долго и трудозатратно.
Как всё работает? Насколько точен метод? И как ученые будут развивать разработку — читайте в материале ITMO NEWS!
#разработки #наукавИТМО
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤1
Тем временем, объявлены результаты студенческо-аспирантского конкурса Комитета по науке и высшей школе правительства Санкт-Петербурга за 2025 год.
В нашей лаборатории аспирантские гранты выиграли Юлия Борисова и Глеб Соловьев. Их проекты - про прогностическое моделирование морского льда и генеративный дизайн, неоднократно упоминали про эти работы в канале.
Полный же список из 440 победителей (220 аспирантов и 220 магистрантов) - тут.
Если подавались - можете проверить, повезло ли в этот раз. Любопытный факт: значительная доля победителей - из Политеха и ИТМО. Видимо, в них процесс сбора документов для подачи организован лучше всего)
В нашей лаборатории аспирантские гранты выиграли Юлия Борисова и Глеб Соловьев. Их проекты - про прогностическое моделирование морского льда и генеративный дизайн, неоднократно упоминали про эти работы в канале.
Полный же список из 440 победителей (220 аспирантов и 220 магистрантов) - тут.
Если подавались - можете проверить, повезло ли в этот раз. Любопытный факт: значительная доля победителей - из Политеха и ИТМО. Видимо, в них процесс сбора документов для подачи организован лучше всего)
🔥9❤3😁2🎉1
Время рассказать о публикациях нашей лаборатории на конференции GECCO 2025.
Помимо призового места в конкурсе Humies, от нас приняты две статьи на трек Late Breaking Abstracts:
Gleb Solovev, Mikhail Sokolov, Aveen Hussein, Nikolay Nikitin - Augmentation of Laser Welding Dataset through a combination of Evolutionary Optimization and Deep Learning
Работа про эволюционную генерацию синтетический данных для задачи обучения моделей, предсказывающих дефекты лазерной сварки. Делали это в рамках научной коллаборации с коллегами из Института лазерных технологий ИТМО.
Julia Borisova, Alexander Hvatov - Evolutionary Manifold Learning for Automated Extraction of Data Topology
Работа про обучения многообразий, соответствующих топологии данных - также с помощью эволюционной оптимизации.
Расширенные версии этих исследований - в работе. А пока в дополнение к статьям можно посмотреть красочные постеры, которые были представлены в Малаге.
Помимо призового места в конкурсе Humies, от нас приняты две статьи на трек Late Breaking Abstracts:
Gleb Solovev, Mikhail Sokolov, Aveen Hussein, Nikolay Nikitin - Augmentation of Laser Welding Dataset through a combination of Evolutionary Optimization and Deep Learning
Работа про эволюционную генерацию синтетический данных для задачи обучения моделей, предсказывающих дефекты лазерной сварки. Делали это в рамках научной коллаборации с коллегами из Института лазерных технологий ИТМО.
Julia Borisova, Alexander Hvatov - Evolutionary Manifold Learning for Automated Extraction of Data Topology
Работа про обучения многообразий, соответствующих топологии данных - также с помощью эволюционной оптимизации.
Расширенные версии этих исследований - в работе. А пока в дополнение к статьям можно посмотреть красочные постеры, которые были представлены в Малаге.
🔥13
Сегодня вечером пришли долгожданные решения по EMNLP! Для тех кто пока не сталкивался - это ведущая NLP-конференция уровня A*.
У нашей лаборатории приняли статью на трек Findings:
MADD: Multi-Agent Drug Discovery Orchestra
Gleb Solovev, Alina Zhidkovskaya, Anastasia Orlova, Nina Gubina, Anastasia Vepreva, Rodion Golovinskii, Ilya Tonkii, Ivan Dubrovsky, Ivan Gurev, Dmitry Gilemkhanov, Denis Chistiakov, Timur A. Aliev, Ivan Poddiakov, Galina Zubkova, Ekaterina V. Skorb, Vladimir Vinogradov, Alexander Boukhanovsky, Nikolay Nikitin, Andrei Dmitrenko, Anna Kalyuzhnaya, Andrey Savchenko
Это - результат многомесячной работы большой коллаборации подразделений ИТМО (помимо нашей лаборатории, активно участвовали представители Центра ИИ в Химии и НОЦ Инфохимии), а также коллег из Sber AI Lab. Сама статья - про мультиагентную систему, лежащую в основе новой версии ИИ-ассистента химика СhemCoScientist (уже писали про него на хабре).
Подробно (на 39 страниц, если считать приложения) описали наши идеи по эффективным архитектурам MAS LLM для такой задачи, эксперименты по оценке качества (пришлось даже сделать свой бенчмарк), сравнение с SOTA и результаты для восьми предметных кейсов из области фармакологии (например, болезни Альцгеймера).
Текст пока финализируем с учетом полученных комментариев, но доклад про суть работы можно послушать тут (это выступление на ODS DataFest). Открытый код для реализованного в статье подхода тоже скоро выложим.
У нашей лаборатории приняли статью на трек Findings:
MADD: Multi-Agent Drug Discovery Orchestra
Gleb Solovev, Alina Zhidkovskaya, Anastasia Orlova, Nina Gubina, Anastasia Vepreva, Rodion Golovinskii, Ilya Tonkii, Ivan Dubrovsky, Ivan Gurev, Dmitry Gilemkhanov, Denis Chistiakov, Timur A. Aliev, Ivan Poddiakov, Galina Zubkova, Ekaterina V. Skorb, Vladimir Vinogradov, Alexander Boukhanovsky, Nikolay Nikitin, Andrei Dmitrenko, Anna Kalyuzhnaya, Andrey Savchenko
Это - результат многомесячной работы большой коллаборации подразделений ИТМО (помимо нашей лаборатории, активно участвовали представители Центра ИИ в Химии и НОЦ Инфохимии), а также коллег из Sber AI Lab. Сама статья - про мультиагентную систему, лежащую в основе новой версии ИИ-ассистента химика СhemCoScientist (уже писали про него на хабре).
Подробно (на 39 страниц, если считать приложения) описали наши идеи по эффективным архитектурам MAS LLM для такой задачи, эксперименты по оценке качества (пришлось даже сделать свой бенчмарк), сравнение с SOTA и результаты для восьми предметных кейсов из области фармакологии (например, болезни Альцгеймера).
Текст пока финализируем с учетом полученных комментариев, но доклад про суть работы можно послушать тут (это выступление на ODS DataFest). Открытый код для реализованного в статье подхода тоже скоро выложим.
❤20🔥9