NSS Lab News
564 subscribers
269 photos
2 videos
11 files
335 links
Новостной канал лаборатории NSS Lab, Институт ИИ ИТМО.

https://itmo-nss-team.github.io/

"Ничего не понятно, но очень интересно"
Download Telegram
Всем привет.

И ещё немного о науке. Шёл декабрь 2023, мы думали о том, как же имитировать науку когнитивную деятельность эксперта по мат. моделированию, решая задачу поиска уравнений.

В целом, с помощью компьютера мы так или иначе строим граф вычислений, который сводится к дифференциальному уравнению. Главный вопрос, что знает эксперт, а компьютер - нет. Ответа два: в большинстве случаев известно уравнение целиком и эксперт просто его выписывает. Чем плохо? Мы бы хотели, чтобы компьютер помогал открывать новые законы, соответственно, надо дать ему меньше ограничений чем готовое уравнение.

Второй ответ: эксперт знает какие слагаемые скорее всего будут в уравнении. Это уже интереснее, вот тут-то мы и придумали, что надо изменять частоту появления тех или иных слагаемых в диффуре. А лучше, если компьютер сам её определит - это задача мета-обучения, как есть.

Ну и по итогу удалось сформировать такую систему, которая смотрит только на данные, а дальше всё делает сама, никаких дополнительных предположений делать не надо.

Кажется, компьютер умеет решать задачи символьной регрессии и так, и так. Но всё осложняется тем, что диффур - неявная функция, так что ошибку вычислить не так просто. Всё сложилось в красивое решение, и получилась наука.

Наука передовая, опубликована в Q1 AI журнале Information Sciences (как водится, надо сказать про IF=7.8, что совсем не стыдно). Ссылка на статью вот.
🔥20
В нашей лаборатории - одним научным проектом больше:

Выигран групповой грант РНФ под руководством Николая Никитина, тема - "Разработка методов и алгоритмов гибридного ИИ для решения наукоёмких задач
генеративного дизайна на малых выборках обучающих данных ".

Будем продолжать развивать тематику генеративного дизайна, опираясь на задел библиотек GEFEST и GOLEM.

Это один из 7 проектов конкурса ОНГ, выигранных коллективами ИТМО в этом году и единственный из них - по тематике ИИ. Отбор как обычно был плотный - из 4.5к заявок поддержали только 534.
🔥19
Небольшой анонс:

Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной:

"Научные проблемы и практические достижения агентных систем на основе LLM"
.

Ссылка на трансляцию: https://us06web.zoom.us/j/84116364928?pwd=rIAZcjbHzbWHThS9VbxA8UiKaplOzo.1

#nss_talk
🔥141
Продолжаем рубрику "разборы статей и полезные советы от Александра Хватова @sasha_hvat":

1) Попалась статья на АААI этого года по PINNам.

Основная идея в том, что сетку для "решения" нужно брать не равномерную, а по особой формуле.

Такие работы мы видели и не раз. Интересен способ как получили формулу: оказывается, что для Фурье-преобразования можно определить пространства Коробова, и если правильно подобрать степень, то ошибка будет пропорциональна не степени 1/h, а log(h)/h, то есть более точной.

Как вывод, для преобразования Фурье с точки зрения точности передачи сигнала имеет смысл брать не равномерную сетку по частоте, а зависящую от типа передаваемой информации неравномерную. Естественно, на практике проще и быстрее делать DFT.

2) Наткнулся в твиттере на пост о том как писать ребутталы. Выглядит довольно разумно. На сайте есть и гайд как писать статьи.
Напомню ещё о старой (но всё ещё актуальной) презентации о том же.

3) К моей любимой теме, дифференциальным уравнениям.

В 1900 году (аж 125 лет назад) Давид Гильберт с сотоварищами сформулировал 23 задачи, которые, по их мнению, стоят внимания.

Стоят или не стоят, до сих пор нет-нет, да кто-то да гоняется за дурной славой. Последний успешный кейс решения был в 1970, когда ак. Матиясевич (тогда аспирант нашей родной Питерской Стелковки) решил проблему с диофантовыми уравнениями.

Если посмотреть на список, все конкретные задачи уже решены, остались с нечёткой формулировкой. Сегодня нас интересует шестая.

Попробую описать её так: можно ли из стат. физики, из столкновения молекул, статистики Больцмана вывести уравнения макромасштаба, например, уравнения Навье-Стокса. Из уроков школьной физики может показаться, что где-то есть формула средней кинетической энергии молекул и она как-то должна соответствовать таковой по всему полю. Но нет, кинетическая энергия молекул не совсем связана с кинетической энергией на макромасштабе (та, которая ~mv^2/2).

Некоторые учёные в 2018 верили, что переход микро -> макро вообще невозможен.

Как водится, у любого тезиса есть антитезис и в 2025 другие учёные верят, что всё выводится из второго закона Ньютона: и микро, и мезомасштаб, и макро (это точно правда).

Правда ли первое или второе? Да чёрт его знает: первому больше веры, хотя бы потому что это публикация, а не препринт. Я хотел вот такую мысль выразить: не всё, что написано математическими значками (к сожалению) абсолютная истина. Очень много статей про теоремы об "универсальной аппроксимации архитектуры Х" и других. Вплоть до того, что PINN может бесконечно хорошо приближать решения (это точно неправда).

Что делать? Ну видимо надо верить только формулам с примерами (так же как и коду). Ну и второе, максимально скептически относиться к формулам, если в них невозможно разобраться.

#nss_paper_reading_club
5🔥4
Коллеги-химики попросили распространить "ВЫЗОВ" (получается, вызов принят). Очень ждут эту лекцию в ИТМО, может кому-то будет интересно.
👍2
Forwarded from InfoChemistry | ITMO
⚡️ Санкт-Петербург принимает «ВЫЗОВ»!

22 апреля в 13:30 приглашаем вас на лекцию Леонида Ферштата — одного из ведущих химиков России: «Много азота не бывает: зачем нужны гетероциклы с высоким содержанием азота?»

Леонид Леонидович Ферштат — доктор химических наук, лауреат Национальной премии в области будущих технологий «ВЫЗОВ», заведующий лабораторией азотсодержащих соединений Института органической химии им. Н.Д. Зелинского РАН.

На лекции вы узнаете:
▪️О передовых разработках в области азот-кислородных гетероциклических соединений.
▪️Как эти исследования помогают создавать новые лекарства — ведь такие структуры широко распространены в живой природе.
▪️Почему энергоёмкие материалы на основе связей C–N, N–N и N–O могут совершить прорыв в аэрокосмической и горнодобывающей отраслях.

После лекции — презентация заявочной кампании третьего сезона Национальной премии в области будущих технологий «ВЫЗОВ»!🪐

Вы получите всю информацию о подаче заявок, критериях отбора и возможностях для учёных и инженеров. Поэтому встреча будет особенно полезна научным сотрудникам и исследовательским коллективам, ведь это отличная возможность узнать о критериях оценки работ и требованиях к заявкам из первых рук!☄️

📍Где? Санкт-Петербург, ул. Ломоносова, 9, Университет ИТМО, актовый зал
📅 Когда? 22 апреля, 13:30–17:00
🔗 Регистрация: clck.ru/3LE39i
2
Анонсируем новый сезон программы стажировок. В этом году формат следующий:

Сначала - собираем заявки. С теми, чье CV и мотивационное письмо нас заинтересовало - встретимся для собеседования.

Первый этап - 1 месяц - стажировка неоплачиваемая. Далее мы отбираем тех кто показал себя перспективными и индивидуально обсуждаем условия второго этапа.

Мы нацелены на продуктивное и долгосрочное сотрудничество с дальнейшим трудоустройством всех хорошо себя зарекомендовавших кандидатов. Поэтому стажировка в первую очередь для тех, кто видит себя в науке, аспирантуре и наших прикладных проектах. В рамках участия в стажировке можно стать контрибьюторами открытых библиотек, со-авторами статей в топовые журналы и конференции, получить практической опыт работы над наукоёмкими задачами, найти научного руководителя для выпускных работ. Мы ориентируемся преимущественно на студентов магистратуры и бакалавриата, поэтому работа предполагает формат part-time. Работы, выполняемые на стажировке могут быть одновременно и проектом для ВКР.

Заявки можно отсылать в форму, до 15.05.2025.

Основные направления стажировок (лучше изначально выбрать какое-то конкретное и обосновать свою заинтересованность в мотивационном письма):

1) Исследования в области AI4Science

Руководитель: Глеб Соловьев https://github.com/SoloWayG

Примеры задач:
- Разработка и применение методов автоматизации предсказательного моделирования (для задач химии и не только).
- Разработка гибридных генеративных методов, основанных на методах глубокого обучения и методах эволюционной оптимизации (для задач химии и не только).
- Применение агентных LLM для автоматизации создания предметных пайплайнов

Примеры некоторых задач - тут

2) Глубокое обучение и аналитика на основе данных ДЗЗ в сфере наук о климате

Руководитель: Юлия Борисова https://github.com/ChrisLisbon

- Обучение классических ML и нейросетевых моделей для предсказательного моделирования на основе этих данных, оценки корреляций параметров атмосферы и чувствительности моделей к этим параметрам - свободная тема при особом интересе к климатическим данным и ДЗЗ.

Требуемые навыки: программирование на Python, основы статистики, понимание предметной области (машинное обучение и/или науки о земле)

- Проект по разработке прогностической системы ледовых условий в морях российской Арктики и Охотском море - стажировка в рамках индустриального проекта, включает полноценную работу в команде разработчиков на Python и исследователей в области глубокого обучения и наук о земле.

Требуемые навыки: программирование на Python на продвинутом уровне, уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных, основы статистики;

3) Разработка открытой библиотеки OSA для "обслуживания" open-source репозиториев

Руководитель: Андрей Гетманов https://github.com/andreygetmanov

Участие в создании инструмента для комплексной автоматизации работы с научным open-source, основанного на применении мульти-агентных LLM. Код можно посмотреть тут.

Общие требования: знание Python, опыт использования научных и ML-пакетов, навыки работы с git и github, отладки, тестирования.

4) Исследования и разработки в области мультиагентных LLM
Руководитель: Калюжная А.В.
Примеры задач:
- Исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных
- Разработка симулятора на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх
- Разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM
- Экспериментальное исследование методов автоматического построения графов знаний по данным

Общие требования:
- уверенное чтение и понимание статей,
- умение разбираться в программном коде
- понимание основ теории графов и графовых алгоритмов
- способность разобраться с тем как запустить код для обучения DL моделей
- будет преимуществом наличие опыта работы с агентными LLM
🔥61🤩1
🚀 Mультиагентный поиск лекарств

24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)!

На семинаре разберём мультиагентную систему MADD для открытия новых лекарств:
➡️ Покажем, как система интегрирует LLM с генеративными моделями (GAN, Transformer, FREED++) для создания эффективных молекул-кандидатов
➡️ Продемонстрируем как разработанная архитектура справляется с распределением задач между специализированными агентами
➡️ Сравним результаты с конкурирующими решениями (ChemAgent, LlasMol, ChemDFM, X-LoRA-Gemma) на тестах для шести заболеваний и покажем превосходство MADD в генерации целевых молекул

После доклада - ответы на ваши вопросы

💻 Подключайтесь онлайн


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
А 25 апреля вы можете насладиться онлайн митапом от нашего сообщества ITMO Scientific OpenSource!
3
Forwarded from Научный опенсорс (Irina Deeva)
🌿 Весенний митап ITMO Opensource 🌿

Приглашаем вас на онлайн-митап, где поговорим о том, как поддерживать Open Source не только идеями, но и реальными ресурсами 💸

Что вас ждёт:
• Обзор актуальных грантов на разработку Open Source решений
• Инструкции и лайфхаки по подаче заявки
• Реальные истории успеха от победителей конкурсов вроде «КОД ИИ»
• Разбор кейсов и трудностей, с которыми сталкиваются разработчики
• Ответы на главный вопрос: что делать, когда грант заканчивается?

🔊 В программе выступят:
18:00 — Николай Никитин (ИТМО): какие формы поддержки Open Source доступны сегодня?
18:30 — Александр Нозик (МФТИ): существует ли жизнь для open source без грантов?
19:00 — Ирина Деева (ИТМО): как выиграли «КОД ИИ» и во что это вылилось
19:30 — Андрей Остроух (МАДИ): создание учебного курса по Open Source — опыт и выводы

🎯 Митап будет полезен:
— тем, кто уже работает над open source-проектом
— тем, кто планирует привлекать грантовую поддержку
— всем, кто хочет понять, как устроена инфраструктура открытой разработки в России

📢 Не пропустите встречу!
Скоро опубликуем ссылку на трансляцию, а пока — сохраняйте дату!

📅 Когда: 25 апреля, 18:00
📍 Где: онлайн (ссылка на трансляцию появится позже)
🔗 Не забудьте зарегистрироваться
4🔥2
ИИ Песочница | RnD про ML, AI, Data Science
🚀 Mультиагентный поиск лекарств 24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)! На семинаре разберём мультиагентную систему MADD для открытия новых лекарств: ➡️ Покажем, как система интегрирует LLM с генеративными…
Через пару минут начнется семинар лаборатории ИИ Сбера, на котором Анна Калюжная расскажет про разработанную нами мультиагентную систему MADD, предназначенную для создания новых лекарств.

Подключиться можно тут.
🔥6
Forwarded from Научный опенсорс (Irina Deeva)
🔥 С 24 мая по 1 июня пройдёт Data Fest 2025 — главное событие сообщества Open Data Science! Это отличная возможность выступить с докладом, найти единомышленников, завести новых друзей и просто классно провести время.

В этом году наша лаборатория представит сразу два трека:

🔹 Open Source — про открытые библиотеки и фреймворки для DS/ML, а также обмен опытом в сфере open-source разработок в целом.

🔹 PGM & CausalML — новый трек! Теория, инструменты и практика вероятностных графовых моделей и методов причинного машинного обучения.

Треки будут функционировать как онлайн, так и офлайн: города проведения - Москва, Питер, Новосибирск, Алматы и планируется площадка в Белграде.

Ждём ваши заявки на доклады! 👉 тык
Дедлайн подачи заявок - 7 мая, так что торопитесь!
👍8
На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе.

В докладе рассказали про архитектуру, реализованные функции (генерация README, документации, анализ репозиториев, авто-настройку CI/CD), а также опыт тестирования на разных научных репозиториях. По итогам мероприятия про OSA написали и в СМИ.

Попробовать OSA можно тут - https://github.com/aimclub/OSA.
Приглашаем всех желающих протестировать и дать обратную связь. Скоро также развернем публичную версию, доступную как сервис
🔥17
NSS Lab News
На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе. В докладе рассказали про архитектуру, реализованные функции (генерация README, документации…
Продолжая поднятую тему: сегодня выпустили на Хабре развернутый пост про OSA - https://habr.com/ru/companies/spbifmo/articles/906018/

В нём подробнее описали сам инструмент, примеры его применения, а также собрали первые отзывы попробовавших его коллег. В частности, OSA попробовали сотрудники лаборатории КТ ИТМО, ФКН ВШЭ и бразильского Universidade Federal de Juiz de Fora.

На репозитории уже несколько десятков звезд, но от дополнительных не откажемся)
👍11🔥21
Forwarded from Научный опенсорс (Irina Deeva)
Всем привет! 👋
Мы — команда probAI, и рады представить applybn — нашу новую библиотеку для прикладного анализа данных на базе байесовских сетей (БС) и каузальных моделей. Разработано в рамках гранта «КодИИ».

Однажды мы собрались и поняли, что существует множество классных алгоритмов на основе байесовских сетей и каузальных моделей, которые умеют детектировать выбросы, отбирать и генерировать признаки, объяснять влияние частей модели на результат и многое другое. Так почему бы не собрать лучших из них в одну удобную библиотеку? Так и появился applybn.

Что умеет applybn?

1. Обнаружение аномалий

✔️Табличные данные: сочетание байесовских сетей и методов близости для поиска плотностных аномалий и аномалий зависимостей

✔️Временные ряды: динамические БС, автоматически учитывающие временные и межпеременные зависимости

2. Генерация синтетических данных и балансировка выборок

✔️Автоматическое выравнивание несбалансированных выборок при помощи гибридных БС и гауссовских смесей с учётом взаимодействий признаков

3. Отбор и генерация признаков

✔️Каузальный отбор: ищет только те фичи, которые имеют ненулевой причинный эффект (без ручных порогов)

✔️MI‑отбор: находит марковские окружения по нормализованной взаимной информации

✔️Генерация фичей на основе БС: дополняет данные вероятностными параметрами условных зависимостей для повышения качества моделей

4. Объяснимый анализ

✔️Каузальный анализ компонентов моделей: строит структурную каузальную модель, чтобы оценить и убрать неважные компоненты модели (например, фильтры CNN)

✔️ACE‑анализ признаков в данных: рассчитывает средний эффект влияния признаков на уверенность модели для интерпретации и отладки

⚙️ Все модули библиотеки совместимы с экосистемой scikit-learn, так что её легко интегрировать в существующие пайплайны анализа данных.

Заглядывайте в репозиторий applybn, ставьте звёздочки ⭐️ и делитесь впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍53