NSS Lab News
564 subscribers
269 photos
2 videos
11 files
334 links
Новостной канал лаборатории NSS Lab, Институт ИИ ИТМО.

https://itmo-nss-team.github.io/

"Ничего не понятно, но очень интересно"
Download Telegram
Ускоряем научные исследования с помощью ИИ🧬

В ИТМО разработали ChemCoScientist — цифрового ассистента, который автоматизирует исследования в области химии и помогает ученым-химикам решать рутинные научные задачи, которые занимают много времени.

Например, ИИ может сгенерировать новые и доработать существующие химические соединения, предсказать химические свойства и извлечь знания из статей по химии. При этом химикам не нужно уметь программировать — достаточно отправить запрос в чат ассистента.

Чем ChemCoScientist отличается от обычных LLM-моделей? Можно ли интегрировать ассистента в другие дисциплины?

Спросили у авторов разработки из центров «Сильный искусственный интеллект в промышленности» и «Искусственный интеллект в химии». Ответы — на ITMO NEWS 🔬

#разработки
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10🥰3
Forwarded from Ivan Dubrovsky
Media is too big
VIEW IN TELEGRAM
👍5🔥1
Cобираем мнения для нашего митапа:
Forwarded from Научный опенсорс (Nikolay Nikitin)
В плане митапа упомянули про дискуссию про поддержку научного опенсорса.

В рамках подготовки к ней мы решили заранее оценить, какие проблемы в этой области кажутся сообществу основными. Что, на ваш взгляд, важно и требует обсуждения (выберем ТОП5 тем)?
Anonymous Poll
38%
- Недостаток государственной поддержки (грантов на создание и поддержку открытых проектов)
43%
- Недостаток поддержки от частных компаний (в первую очередь - бигтеха)
32%
- Нехватка квалифицированных кадров для наукоёмкой разработки ПО
26%
- Нехватка в России сильных научных школ и направлений, как источника пользователей и контрибьюторов
49%
- Отсутствие у ученых мотивации к обеспечению открытости научных результатов
21%
Мало сообществ, возможностей для популяризации, профильных мероприятий и конференций
29%
Сложность продвижения созданных в России проектов в международную среду
30%
Недостаточный доступ научных команд к вычислительным ресурсам
18%
Ограниченный доступ к мощным ИИ-моделям
6%
Другое (напишу в комментариях)
Forwarded from Научный опенсорс (Nikolay Nikitin)
Наш опенсорс-митап начинается уже через пару часов - вся нужная информация на сайте https://openmeetup.ru.

А тем временем ссылка на трансляцию - вот. В 19-00 начинаем!

Большинство спикеров есть в нашем чате - так что если будут заочные вопросы - пишите. Ответим в процессе или после митапа.
🔥5
Недавно выступал на семинаре китайского сообщества MindSpore с рассказом про наши результаты в применение мульти-агентных LLM-решений для научных задач (в том числе - совместно с Центром ИИ в химии ИТМО).

Посмотреть запись (на английском) можно на нашем ютуб-канале https://www.youtube.com/watch?v=xSSVPmIvIoo

Другие варианты: на исходном хостинге https://www.bilibili.com/video/BV1h9QEYgEMQ или на ютубе MindSpore - https://www.youtube.com/watch?v=q5jp4rGzjeA

#nss_talk
🔥7👍1
На днях вышла наша совместная с коллегами из Арктического научного центра публикация про разработку нейросетевых методов прогнозирования динамики морского льда в Арктике (с заблаговременностью до 1 года):

Н. О. Никитин, Ю. И. Борисова, Я. В. Аксенкин, К. Башкова, Е. И. Луценко, А. В. Калюжная, Д. О. Якимушкин, А. М. Котилевская, Т. Н. Верташ, А. А. Колюбакин, Е. С. Багорьян, А. В. Бухановский
"Предвычисление ледовых условий для обеспечения хозяйственной деятельности в морях российской арк тики с помощью методов глубокого обучения"

Кратко рассказали о подготовке данных, архитектуре модели и результатах тестирования на нескольких акваториях. Постарались наглядно все показать на красочных картах и графиках.

В этом раз выбрали отечественный предметный журнал "Арктика: экология и экономика" (Q2). В русскоязычные издания подаемся не так часто, но текущий опыт скорее позитивный, редакция относится к делу очень ответственно. Пожелать можно только более широкого внедрения latex-шаблонов)
🔥142🎉1
Сегодня в Сочи стартовала конференция MathAI 2025, в которой представители нашей лаборатории выступают как докладчики и участники программного комитета.

В 15-00 мск можно послушать доклад Александра Хватова ("Finding a new inspiration within the Physics-Informed ML"), в 16-20 - доклад Николая Никитина ("Multi-Agent LLMs for Scientific Applications").
Доступ для удаленных участников - в zoom-трансляции.

Во вторник, четверг и пятницу будут выступления Владимира Латыпова, Иллариона Иова, Ксении Башковой и Марии Хильчук.

Программа - во вложенных файлах, все обновления - в канале конференции.
👍8🔥1🎉1
Всем привет.

И ещё немного о науке. Шёл декабрь 2023, мы думали о том, как же имитировать науку когнитивную деятельность эксперта по мат. моделированию, решая задачу поиска уравнений.

В целом, с помощью компьютера мы так или иначе строим граф вычислений, который сводится к дифференциальному уравнению. Главный вопрос, что знает эксперт, а компьютер - нет. Ответа два: в большинстве случаев известно уравнение целиком и эксперт просто его выписывает. Чем плохо? Мы бы хотели, чтобы компьютер помогал открывать новые законы, соответственно, надо дать ему меньше ограничений чем готовое уравнение.

Второй ответ: эксперт знает какие слагаемые скорее всего будут в уравнении. Это уже интереснее, вот тут-то мы и придумали, что надо изменять частоту появления тех или иных слагаемых в диффуре. А лучше, если компьютер сам её определит - это задача мета-обучения, как есть.

Ну и по итогу удалось сформировать такую систему, которая смотрит только на данные, а дальше всё делает сама, никаких дополнительных предположений делать не надо.

Кажется, компьютер умеет решать задачи символьной регрессии и так, и так. Но всё осложняется тем, что диффур - неявная функция, так что ошибку вычислить не так просто. Всё сложилось в красивое решение, и получилась наука.

Наука передовая, опубликована в Q1 AI журнале Information Sciences (как водится, надо сказать про IF=7.8, что совсем не стыдно). Ссылка на статью вот.
🔥20
В нашей лаборатории - одним научным проектом больше:

Выигран групповой грант РНФ под руководством Николая Никитина, тема - "Разработка методов и алгоритмов гибридного ИИ для решения наукоёмких задач
генеративного дизайна на малых выборках обучающих данных ".

Будем продолжать развивать тематику генеративного дизайна, опираясь на задел библиотек GEFEST и GOLEM.

Это один из 7 проектов конкурса ОНГ, выигранных коллективами ИТМО в этом году и единственный из них - по тематике ИИ. Отбор как обычно был плотный - из 4.5к заявок поддержали только 534.
🔥19
Небольшой анонс:

Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной:

"Научные проблемы и практические достижения агентных систем на основе LLM"
.

Ссылка на трансляцию: https://us06web.zoom.us/j/84116364928?pwd=rIAZcjbHzbWHThS9VbxA8UiKaplOzo.1

#nss_talk
🔥141
Продолжаем рубрику "разборы статей и полезные советы от Александра Хватова @sasha_hvat":

1) Попалась статья на АААI этого года по PINNам.

Основная идея в том, что сетку для "решения" нужно брать не равномерную, а по особой формуле.

Такие работы мы видели и не раз. Интересен способ как получили формулу: оказывается, что для Фурье-преобразования можно определить пространства Коробова, и если правильно подобрать степень, то ошибка будет пропорциональна не степени 1/h, а log(h)/h, то есть более точной.

Как вывод, для преобразования Фурье с точки зрения точности передачи сигнала имеет смысл брать не равномерную сетку по частоте, а зависящую от типа передаваемой информации неравномерную. Естественно, на практике проще и быстрее делать DFT.

2) Наткнулся в твиттере на пост о том как писать ребутталы. Выглядит довольно разумно. На сайте есть и гайд как писать статьи.
Напомню ещё о старой (но всё ещё актуальной) презентации о том же.

3) К моей любимой теме, дифференциальным уравнениям.

В 1900 году (аж 125 лет назад) Давид Гильберт с сотоварищами сформулировал 23 задачи, которые, по их мнению, стоят внимания.

Стоят или не стоят, до сих пор нет-нет, да кто-то да гоняется за дурной славой. Последний успешный кейс решения был в 1970, когда ак. Матиясевич (тогда аспирант нашей родной Питерской Стелковки) решил проблему с диофантовыми уравнениями.

Если посмотреть на список, все конкретные задачи уже решены, остались с нечёткой формулировкой. Сегодня нас интересует шестая.

Попробую описать её так: можно ли из стат. физики, из столкновения молекул, статистики Больцмана вывести уравнения макромасштаба, например, уравнения Навье-Стокса. Из уроков школьной физики может показаться, что где-то есть формула средней кинетической энергии молекул и она как-то должна соответствовать таковой по всему полю. Но нет, кинетическая энергия молекул не совсем связана с кинетической энергией на макромасштабе (та, которая ~mv^2/2).

Некоторые учёные в 2018 верили, что переход микро -> макро вообще невозможен.

Как водится, у любого тезиса есть антитезис и в 2025 другие учёные верят, что всё выводится из второго закона Ньютона: и микро, и мезомасштаб, и макро (это точно правда).

Правда ли первое или второе? Да чёрт его знает: первому больше веры, хотя бы потому что это публикация, а не препринт. Я хотел вот такую мысль выразить: не всё, что написано математическими значками (к сожалению) абсолютная истина. Очень много статей про теоремы об "универсальной аппроксимации архитектуры Х" и других. Вплоть до того, что PINN может бесконечно хорошо приближать решения (это точно неправда).

Что делать? Ну видимо надо верить только формулам с примерами (так же как и коду). Ну и второе, максимально скептически относиться к формулам, если в них невозможно разобраться.

#nss_paper_reading_club
5🔥4
Коллеги-химики попросили распространить "ВЫЗОВ" (получается, вызов принят). Очень ждут эту лекцию в ИТМО, может кому-то будет интересно.
👍2
Forwarded from InfoChemistry | ITMO
⚡️ Санкт-Петербург принимает «ВЫЗОВ»!

22 апреля в 13:30 приглашаем вас на лекцию Леонида Ферштата — одного из ведущих химиков России: «Много азота не бывает: зачем нужны гетероциклы с высоким содержанием азота?»

Леонид Леонидович Ферштат — доктор химических наук, лауреат Национальной премии в области будущих технологий «ВЫЗОВ», заведующий лабораторией азотсодержащих соединений Института органической химии им. Н.Д. Зелинского РАН.

На лекции вы узнаете:
▪️О передовых разработках в области азот-кислородных гетероциклических соединений.
▪️Как эти исследования помогают создавать новые лекарства — ведь такие структуры широко распространены в живой природе.
▪️Почему энергоёмкие материалы на основе связей C–N, N–N и N–O могут совершить прорыв в аэрокосмической и горнодобывающей отраслях.

После лекции — презентация заявочной кампании третьего сезона Национальной премии в области будущих технологий «ВЫЗОВ»!🪐

Вы получите всю информацию о подаче заявок, критериях отбора и возможностях для учёных и инженеров. Поэтому встреча будет особенно полезна научным сотрудникам и исследовательским коллективам, ведь это отличная возможность узнать о критериях оценки работ и требованиях к заявкам из первых рук!☄️

📍Где? Санкт-Петербург, ул. Ломоносова, 9, Университет ИТМО, актовый зал
📅 Когда? 22 апреля, 13:30–17:00
🔗 Регистрация: clck.ru/3LE39i
2
Анонсируем новый сезон программы стажировок. В этом году формат следующий:

Сначала - собираем заявки. С теми, чье CV и мотивационное письмо нас заинтересовало - встретимся для собеседования.

Первый этап - 1 месяц - стажировка неоплачиваемая. Далее мы отбираем тех кто показал себя перспективными и индивидуально обсуждаем условия второго этапа.

Мы нацелены на продуктивное и долгосрочное сотрудничество с дальнейшим трудоустройством всех хорошо себя зарекомендовавших кандидатов. Поэтому стажировка в первую очередь для тех, кто видит себя в науке, аспирантуре и наших прикладных проектах. В рамках участия в стажировке можно стать контрибьюторами открытых библиотек, со-авторами статей в топовые журналы и конференции, получить практической опыт работы над наукоёмкими задачами, найти научного руководителя для выпускных работ. Мы ориентируемся преимущественно на студентов магистратуры и бакалавриата, поэтому работа предполагает формат part-time. Работы, выполняемые на стажировке могут быть одновременно и проектом для ВКР.

Заявки можно отсылать в форму, до 15.05.2025.

Основные направления стажировок (лучше изначально выбрать какое-то конкретное и обосновать свою заинтересованность в мотивационном письма):

1) Исследования в области AI4Science

Руководитель: Глеб Соловьев https://github.com/SoloWayG

Примеры задач:
- Разработка и применение методов автоматизации предсказательного моделирования (для задач химии и не только).
- Разработка гибридных генеративных методов, основанных на методах глубокого обучения и методах эволюционной оптимизации (для задач химии и не только).
- Применение агентных LLM для автоматизации создания предметных пайплайнов

Примеры некоторых задач - тут

2) Глубокое обучение и аналитика на основе данных ДЗЗ в сфере наук о климате

Руководитель: Юлия Борисова https://github.com/ChrisLisbon

- Обучение классических ML и нейросетевых моделей для предсказательного моделирования на основе этих данных, оценки корреляций параметров атмосферы и чувствительности моделей к этим параметрам - свободная тема при особом интересе к климатическим данным и ДЗЗ.

Требуемые навыки: программирование на Python, основы статистики, понимание предметной области (машинное обучение и/или науки о земле)

- Проект по разработке прогностической системы ледовых условий в морях российской Арктики и Охотском море - стажировка в рамках индустриального проекта, включает полноценную работу в команде разработчиков на Python и исследователей в области глубокого обучения и наук о земле.

Требуемые навыки: программирование на Python на продвинутом уровне, уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных, основы статистики;

3) Разработка открытой библиотеки OSA для "обслуживания" open-source репозиториев

Руководитель: Андрей Гетманов https://github.com/andreygetmanov

Участие в создании инструмента для комплексной автоматизации работы с научным open-source, основанного на применении мульти-агентных LLM. Код можно посмотреть тут.

Общие требования: знание Python, опыт использования научных и ML-пакетов, навыки работы с git и github, отладки, тестирования.

4) Исследования и разработки в области мультиагентных LLM
Руководитель: Калюжная А.В.
Примеры задач:
- Исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных
- Разработка симулятора на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх
- Разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM
- Экспериментальное исследование методов автоматического построения графов знаний по данным

Общие требования:
- уверенное чтение и понимание статей,
- умение разбираться в программном коде
- понимание основ теории графов и графовых алгоритмов
- способность разобраться с тем как запустить код для обучения DL моделей
- будет преимуществом наличие опыта работы с агентными LLM
🔥61🤩1
🚀 Mультиагентный поиск лекарств

24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)!

На семинаре разберём мультиагентную систему MADD для открытия новых лекарств:
➡️ Покажем, как система интегрирует LLM с генеративными моделями (GAN, Transformer, FREED++) для создания эффективных молекул-кандидатов
➡️ Продемонстрируем как разработанная архитектура справляется с распределением задач между специализированными агентами
➡️ Сравним результаты с конкурирующими решениями (ChemAgent, LlasMol, ChemDFM, X-LoRA-Gemma) на тестах для шести заболеваний и покажем превосходство MADD в генерации целевых молекул

После доклада - ответы на ваши вопросы

💻 Подключайтесь онлайн


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6