NSS Lab News

415 viewsNikolay Nikitin, 11:51

Всем привет.

И ещё немного о науке. Шёл декабрь 2023, мы думали о том, как же имитировать ~~науку~~ когнитивную деятельность эксперта по мат. моделированию, решая задачу поиска уравнений.

В целом, с помощью компьютера мы так или иначе строим граф вычислений, который сводится к дифференциальному уравнению. Главный вопрос, что знает эксперт, а компьютер - нет. Ответа два: в большинстве случаев известно уравнение целиком и эксперт просто его выписывает. Чем плохо? Мы бы хотели, чтобы компьютер помогал открывать новые законы, соответственно, надо дать ему меньше ограничений чем готовое уравнение.

Второй ответ: эксперт знает какие слагаемые скорее всего будут в уравнении. Это уже интереснее, вот тут-то мы и придумали, что надо изменять частоту появления тех или иных слагаемых в диффуре. А лучше, если компьютер сам её определит - это задача мета-обучения, как есть.

Ну и по итогу удалось сформировать такую систему, которая смотрит только на данные, а дальше всё делает сама, никаких дополнительных предположений делать не надо.

Кажется, компьютер умеет решать задачи символьной регрессии и так, и так. Но всё осложняется тем, что диффур - неявная функция, так что ошибку вычислить не так просто. Всё сложилось в красивое решение, и получилась наука.

Наука передовая, опубликована в Q1 AI журнале Information Sciences (как водится, надо сказать про IF=7.8, что совсем не стыдно). Ссылка на статью вот.

🔥20

383 viewsSasha Hvatov, 09:46

NSS Lab News

Корень из ИТМО

Ускоряем научные исследования с помощью ИИ🧬 В ИТМО разработали ChemCoScientist — цифрового ассистента, который автоматизирует исследования в области химии и помогает ученым-химикам решать рутинные научные задачи, которые занимают много времени. Например…

Вышел наш пост на Хабре с подробностями про разработку ИИ-ассистента ChemCoScientist, про которого недавно рассказывали - https://habr.com/ru/companies/spbifmo/articles/896868/

Хабр

Разгружаем ученых: история разработки одного мультиагентного ИИ-ассистента для химиков

Современная наука генерирует большие объемы данных, доступны значительные вычислительные мощности, но парадоксальным образом скорость научных открытий не растет пропорционально этим ресурсам. Основное...

🔥10❤2

378 viewsNikolay Nikitin, edited 13:51

NSS Lab News

В нашей лаборатории - одним научным проектом больше:

Выигран групповой грант РНФ под руководством Николая Никитина, тема - "Разработка методов и алгоритмов гибридного ИИ для решения наукоёмких задач
генеративного дизайна на малых выборках обучающих данных ".

Будем продолжать развивать тематику генеративного дизайна, опираясь на задел библиотек GEFEST и GOLEM.

Это один из 7 проектов конкурса ОНГ, выигранных коллективами ИТМО в этом году и единственный из них - по тематике ИИ. Отбор как обычно был плотный - из 4.5к заявок поддержали только 534.

🔥19

429 viewsNikolay Nikitin, edited 10:39

NSS Lab News

Небольшой анонс:

Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной:

"Научные проблемы и практические достижения агентных систем на основе LLM".

Ссылка на трансляцию: https://us06web.zoom.us/j/84116364928?pwd=rIAZcjbHzbWHThS9VbxA8UiKaplOzo.1

#nss_talk

🔥14❤1

373 viewsNikolay Nikitin, 12:33

NSS Lab News

Продолжаем рубрику "разборы статей и полезные советы от Александра Хватова @sasha_hvat":

1) Попалась статья на АААI этого года по PINNам.

Основная идея в том, что сетку для "решения" нужно брать не равномерную, а по особой формуле.

Такие работы мы видели и не раз. Интересен способ как получили формулу: оказывается, что для Фурье-преобразования можно определить пространства Коробова, и если правильно подобрать степень, то ошибка будет пропорциональна не степени 1/h, а log(h)/h, то есть более точной.

Как вывод, для преобразования Фурье с точки зрения точности передачи сигнала имеет смысл брать не равномерную сетку по частоте, а зависящую от типа передаваемой информации неравномерную. Естественно, на практике проще и быстрее делать DFT.

2) Наткнулся в твиттере на пост о том как писать ребутталы. Выглядит довольно разумно. На сайте есть и гайд как писать статьи.
Напомню ещё о старой (но всё ещё актуальной) презентации о том же.

3) К моей любимой теме, дифференциальным уравнениям.

В 1900 году (аж 125 лет назад) Давид Гильберт с сотоварищами сформулировал 23 задачи, которые, по их мнению, стоят внимания.

Стоят или не стоят, до сих пор нет-нет, да кто-то да гоняется за ~~дурной~~ славой. Последний успешный кейс решения был в 1970, когда ак. Матиясевич (тогда аспирант нашей родной Питерской Стелковки) решил проблему с диофантовыми уравнениями.

Если посмотреть на список, все конкретные задачи уже решены, остались с нечёткой формулировкой. Сегодня нас интересует шестая.

Попробую описать её так: можно ли из стат. физики, из столкновения молекул, статистики Больцмана вывести уравнения макромасштаба, например, уравнения Навье-Стокса. Из уроков школьной физики может показаться, что где-то есть формула средней кинетической энергии молекул и она как-то должна соответствовать таковой по всему полю. Но нет, кинетическая энергия молекул не совсем связана с кинетической энергией на макромасштабе (та, которая ~mv^2/2).

Некоторые учёные в 2018 верили, что переход микро -> макро вообще невозможен.

Как водится, у любого тезиса есть антитезис и в 2025 другие учёные верят, что всё выводится из второго закона Ньютона: и микро, и мезомасштаб, и макро (это точно правда).

Правда ли первое или второе? Да чёрт его знает: первому больше веры, хотя бы потому что это публикация, а не препринт. Я хотел вот такую мысль выразить: не всё, что написано математическими значками (к сожалению) абсолютная истина. Очень много статей про теоремы об "универсальной аппроксимации архитектуры Х" и других. Вплоть до того, что PINN может бесконечно хорошо приближать решения (это точно неправда).

Что делать? Ну видимо надо верить только формулам с примерами (так же как и коду). Ну и второе, максимально скептически относиться к формулам, если в них невозможно разобраться.

#nss_paper_reading_club

❤5🔥4

327 viewsNikolay Nikitin, edited 14:35

NSS Lab News

Небольшой анонс: Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной: "Научные проблемы и практические достижения агентных систем на основе LLM". Ссылка на трансляцию: https://us06web.zoom.us/…

Начинаем, можно подключаться.

Zoom Video

Join our Cloud HD Video Meeting

Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…

🔥2

311 viewsNikolay Nikitin, edited 16:00

NSS Lab News

Коллеги-химики попросили распространить "ВЫЗОВ" (получается, вызов принят). Очень ждут эту лекцию в ИТМО, может кому-то будет интересно.

👍2

285 viewsSasha Hvatov, 09:21

NSS Lab News

Forwarded from InfoChemistry | ITMO

⚡️ Санкт-Петербург принимает «ВЫЗОВ»!

22 апреля в 13:30 приглашаем вас на лекцию Леонида Ферштата — одного из ведущих химиков России: «Много азота не бывает: зачем нужны гетероциклы с высоким содержанием азота?»

Леонид Леонидович Ферштат — доктор химических наук, лауреат Национальной премии в области будущих технологий «ВЫЗОВ», заведующий лабораторией азотсодержащих соединений Института органической химии им. Н.Д. Зелинского РАН.

На лекции вы узнаете:
▪️О передовых разработках в области азот-кислородных гетероциклических соединений.
▪️Как эти исследования помогают создавать новые лекарства — ведь такие структуры широко распространены в живой природе.
▪️Почему энергоёмкие материалы на основе связей C–N, N–N и N–O могут совершить прорыв в аэрокосмической и горнодобывающей отраслях.

После лекции — презентация заявочной кампании третьего сезона Национальной премии в области будущих технологий «ВЫЗОВ»!🪐

Вы получите всю информацию о подаче заявок, критериях отбора и возможностях для учёных и инженеров. Поэтому встреча будет особенно полезна научным сотрудникам и исследовательским коллективам, ведь это отличная возможность узнать о критериях оценки работ и требованиях к заявкам из первых рук!☄️

📍Где? Санкт-Петербург, ул. Ломоносова, 9, Университет ИТМО, актовый зал
📅 Когда? 22 апреля, 13:30–17:00
🔗 Регистрация: clck.ru/3LE39i

❤2

314 viewsSasha Hvatov, 09:21

NSS Lab News

Анонсируем новый сезон программы стажировок. В этом году формат следующий:

Сначала - собираем заявки. С теми, чье CV и мотивационное письмо нас заинтересовало - встретимся для собеседования.

Первый этап - 1 месяц - стажировка неоплачиваемая. Далее мы отбираем тех кто показал себя перспективными и индивидуально обсуждаем условия второго этапа.

Мы нацелены на продуктивное и долгосрочное сотрудничество с дальнейшим трудоустройством всех хорошо себя зарекомендовавших кандидатов. Поэтому стажировка в первую очередь для тех, кто видит себя в науке, аспирантуре и наших прикладных проектах. В рамках участия в стажировке можно стать контрибьюторами открытых библиотек, со-авторами статей в топовые журналы и конференции, получить практической опыт работы над наукоёмкими задачами, найти научного руководителя для выпускных работ. Мы ориентируемся преимущественно на студентов магистратуры и бакалавриата, поэтому работа предполагает формат part-time. Работы, выполняемые на стажировке могут быть одновременно и проектом для ВКР.

Заявки можно отсылать в форму, до 15.05.2025.

Основные направления стажировок (лучше изначально выбрать какое-то конкретное и обосновать свою заинтересованность в мотивационном письма):

1) Исследования в области AI4Science

Руководитель: Глеб Соловьев https://github.com/SoloWayG

Примеры задач:
- Разработка и применение методов автоматизации предсказательного моделирования (для задач химии и не только).
- Разработка гибридных генеративных методов, основанных на методах глубокого обучения и методах эволюционной оптимизации (для задач химии и не только).
- Применение агентных LLM для автоматизации создания предметных пайплайнов

Примеры некоторых задач - тут

2) Глубокое обучение и аналитика на основе данных ДЗЗ в сфере наук о климате

Руководитель: Юлия Борисова https://github.com/ChrisLisbon

- Обучение классических ML и нейросетевых моделей для предсказательного моделирования на основе этих данных, оценки корреляций параметров атмосферы и чувствительности моделей к этим параметрам - свободная тема при особом интересе к климатическим данным и ДЗЗ.

Требуемые навыки: программирование на Python, основы статистики, понимание предметной области (машинное обучение и/или науки о земле)

- Проект по разработке прогностической системы ледовых условий в морях российской Арктики и Охотском море - стажировка в рамках индустриального проекта, включает полноценную работу в команде разработчиков на Python и исследователей в области глубокого обучения и наук о земле.

Требуемые навыки: программирование на Python на продвинутом уровне, уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных, основы статистики;

3) Разработка открытой библиотеки OSA для "обслуживания" open-source репозиториев

Руководитель: Андрей Гетманов https://github.com/andreygetmanov

Участие в создании инструмента для комплексной автоматизации работы с научным open-source, основанного на применении мульти-агентных LLM. Код можно посмотреть тут.

Общие требования: знание Python, опыт использования научных и ML-пакетов, навыки работы с git и github, отладки, тестирования.

4) Исследования и разработки в области мультиагентных LLM
Руководитель: Калюжная А.В.
Примеры задач:
- Исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных
- Разработка симулятора на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх
- Разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM
- Экспериментальное исследование методов автоматического построения графов знаний по данным

Общие требования:
- уверенное чтение и понимание статей,
- умение разбираться в программном коде
- понимание основ теории графов и графовых алгоритмов
- способность разобраться с тем как запустить код для обучения DL моделей
- будет преимуществом наличие опыта работы с агентными LLM

🔥6❤1🤩1

798 viewsNikolay Nikitin, 07:47

NSS Lab News

Forwarded from ИИ Песочница | RnD про ML, AI, Data Science

🚀 Mультиагентный поиск лекарств

24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)!

На семинаре разберём мультиагентную систему MADD для открытия новых лекарств:
➡️ Покажем, как система интегрирует LLM с генеративными моделями (GAN, Transformer, FREED++) для создания эффективных молекул-кандидатов
➡️ Продемонстрируем как разработанная архитектура справляется с распределением задач между специализированными агентами
➡️ Сравним результаты с конкурирующими решениями (ChemAgent, LlasMol, ChemDFM, X-LoRA-Gemma) на тестах для шести заболеваний и покажем превосходство MADD в генерации целевых молекул

После доклада - ответы на ваши вопросы

💻

Подключайтесь онлайн

#анонс

❤

@sb_ai_lab

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6

253 viewsNikolay Nikitin, 12:48

NSS Lab News

А 25 апреля вы можете насладиться онлайн митапом от нашего сообщества ITMO Scientific OpenSource!

❤3

239 viewsIrina Deeva, 15:05

NSS Lab News

Forwarded from Научный опенсорс (Irina Deeva)

🌿 Весенний митап ITMO Opensource 🌿

Приглашаем вас на онлайн-митап, где поговорим о том, как поддерживать Open Source не только идеями, но и реальными ресурсами 💸

Что вас ждёт:
• Обзор актуальных грантов на разработку Open Source решений
• Инструкции и лайфхаки по подаче заявки
• Реальные истории успеха от победителей конкурсов вроде «КОД ИИ»
• Разбор кейсов и трудностей, с которыми сталкиваются разработчики
• Ответы на главный вопрос: что делать, когда грант заканчивается?

🔊 В программе выступят:
18:00 — Николай Никитин (ИТМО): какие формы поддержки Open Source доступны сегодня?
18:30 — Александр Нозик (МФТИ): существует ли жизнь для open source без грантов?
19:00 — Ирина Деева (ИТМО): как выиграли «КОД ИИ» и во что это вылилось
19:30 — Андрей Остроух (МАДИ): создание учебного курса по Open Source — опыт и выводы

🎯 Митап будет полезен:
— тем, кто уже работает над open source-проектом
— тем, кто планирует привлекать грантовую поддержку
— всем, кто хочет понять, как устроена инфраструктура открытой разработки в России

📢 Не пропустите встречу!
Скоро опубликуем ссылку на трансляцию, а пока — сохраняйте дату!

📅 Когда: 25 апреля, 18:00
📍 Где: онлайн (ссылка на трансляцию появится позже)
🔗 Не забудьте зарегистрироваться

Google Docs

Онлайн-митап 25 апреля

Регистрация на митап, который пройдет в онлайн-формате 25-го апреля в 18:00.
Митап будет посвящен теме грантов для поддержки Open Source решений.

Ссылка на подключение: https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию: https://www.youtube.co…

❤4🔥2

228 viewsIrina Deeva, 15:05

NSS Lab News

Для тех кто пропустил семинар про агентные системы на основе LLM - подьехала запись: https://www.youtube.com/watch?v=vmoDG_EurwE

YouTube

Мультиагентные системы | Анна Калюжная в ЛЕЯ

На семинаре в Лаборатории Естественного Языка ВШЭ-Яндекс выступила Анна Калюжная с докладом "Научные проблемы и практические достижения агентных систем на основе LLM".

Анна Калюжная является:
- старшим научным сотрудником Лаборатории Композитного Искусственного…

🔥10🥰1

374 viewsNikolay Nikitin, 10:03

NSS Lab News

ИИ Песочница | RnD про ML, AI, Data Science

🚀 Mультиагентный поиск лекарств 24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)! На семинаре разберём мультиагентную систему MADD для открытия новых лекарств: ➡️ Покажем, как система интегрирует LLM с генеративными…

Через пару минут начнется семинар лаборатории ИИ Сбера, на котором Анна Калюжная расскажет про разработанную нами мультиагентную систему MADD, предназначенную для создания новых лекарств.

Подключиться можно тут.

🔥6

417 viewsNikolay Nikitin, 14:00

NSS Lab News

Forwarded from Научный опенсорс (Irina Deeva)

А мы начинаем наш ITMO Opensource Meetup уже через 15 минут!
Ссылка на подключение - https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию в youtube - https://www.youtube.com/live/y3ef9TgBhlI

telemost.yandex.ru

Яндекс Телемост — бесплатные видеовстречи без регистрации и ограничения по времени

Бесплатные видеоконференции и встречи прямо в браузере. Подключение без регистрации, удобно с ПК и телефона. Работайте, учитесь и общайтесь онлайн

❤5

301 viewsIrina Deeva, 14:46

NSS Lab News

Forwarded from Научный опенсорс (Irina Deeva)

🔥 С 24 мая по 1 июня пройдёт Data Fest 2025 — главное событие сообщества Open Data Science! Это отличная возможность выступить с докладом, найти единомышленников, завести новых друзей и просто классно провести время.

В этом году наша лаборатория представит сразу два трека:

🔹 Open Source — про открытые библиотеки и фреймворки для DS/ML, а также обмен опытом в сфере open-source разработок в целом.

🔹 PGM & CausalML — новый трек! Теория, инструменты и практика вероятностных графовых моделей и методов причинного машинного обучения.

Треки будут функционировать как онлайн, так и офлайн: города проведения - Москва, Питер, Новосибирск, Алматы и планируется площадка в Белграде.

Ждём ваши заявки на доклады! 👉 тык
Дедлайн подачи заявок - 7 мая, так что торопитесь!

👍8

244 viewsIrina Deeva, 17:56

NSS Lab News

На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе.

В докладе рассказали про архитектуру, реализованные функции (генерация README, документации, анализ репозиториев, авто-настройку CI/CD), а также опыт тестирования на разных научных репозиториях. По итогам мероприятия про OSA написали и в СМИ.

Попробовать OSA можно тут - https://github.com/aimclub/OSA.
Приглашаем всех желающих протестировать и дать обратную связь. Скоро также развернем публичную версию, доступную как сервис

🔥17

509 viewsNikolay Nikitin, 12:18

NSS Lab News

На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе. В докладе рассказали про архитектуру, реализованные функции (генерация README, документации…

Продолжая поднятую тему: сегодня выпустили на Хабре развернутый пост про OSA - https://habr.com/ru/companies/spbifmo/articles/906018/

В нём подробнее описали сам инструмент, примеры его применения, а также собрали первые отзывы попробовавших его коллег. В частности, OSA попробовали сотрудники лаборатории КТ ИТМО, ФКН ВШЭ и бразильского Universidade Federal de Juiz de Fora.

На репозитории уже несколько десятков звезд, но от дополнительных не откажемся)

Хабр

OSA: ИИ-помощник для разработчиков научного open source кода

Привет, Хабр! Меня зовут Андрей Гетманов, я работаю ML-инженером в Исследовательском центре «Сильный ИИ в промышленности» в ИТМО, а кроме того выступаю энтузиастом open source. В этой статье хочу...

👍11🔥2❤1

342 viewsNikolay Nikitin, 19:56

NSS Lab News

Forwarded from Научный опенсорс (Irina Deeva)

Всем привет! 👋
Мы — команда probAI, и рады представить applybn — нашу новую библиотеку для прикладного анализа данных на базе байесовских сетей (БС) и каузальных моделей. Разработано в рамках гранта «КодИИ».

Однажды мы собрались и поняли, что существует множество классных алгоритмов на основе байесовских сетей и каузальных моделей, которые умеют детектировать выбросы, отбирать и генерировать признаки, объяснять влияние частей модели на результат и многое другое. Так почему бы не собрать лучших из них в одну удобную библиотеку? Так и появился applybn.

Что умеет applybn?

1. Обнаружение аномалий

✔️Табличные данные: сочетание байесовских сетей и методов близости для поиска плотностных аномалий и аномалий зависимостей

✔️Временные ряды: динамические БС, автоматически учитывающие временные и межпеременные зависимости

2. Генерация синтетических данных и балансировка выборок

✔️Автоматическое выравнивание несбалансированных выборок при помощи гибридных БС и гауссовских смесей с учётом взаимодействий признаков

3. Отбор и генерация признаков

✔️Каузальный отбор: ищет только те фичи, которые имеют ненулевой причинный эффект (без ручных порогов)

✔️MI‑отбор: находит марковские окружения по нормализованной взаимной информации

✔️Генерация фичей на основе БС: дополняет данные вероятностными параметрами условных зависимостей для повышения качества моделей

4. Объяснимый анализ

✔️Каузальный анализ компонентов моделей: строит структурную каузальную модель, чтобы оценить и убрать неважные компоненты модели (например, фильтры CNN)

✔️ACE‑анализ признаков в данных: рассчитывает средний эффект влияния признаков на уверенность модели для интерпретации и отладки

⚙️ Все модули библиотеки совместимы с экосистемой scikit-learn, так что её легко интегрировать в существующие пайплайны анализа данных.

Заглядывайте в репозиторий applybn, ставьте звёздочки ⭐️ и делитесь впечатлениями!

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - Anaxagor/applybn: Multi-purpose data analysis framework based on Bayesian networks and Causal models

Multi-purpose data analysis framework based on Bayesian networks and Causal models - Anaxagor/applybn

🔥11👍5❤3

297 viewsIrina Deeva, 12:10

About

Blog

Apps

Platform