NSS Lab News
563 subscribers
269 photos
2 videos
11 files
335 links
Новостной канал лаборатории NSS Lab, Институт ИИ ИТМО.

https://itmo-nss-team.github.io/

"Ничего не понятно, но очень интересно"
Download Telegram
Forwarded from InfoChemistry | ITMO
⚡️ Санкт-Петербург принимает «ВЫЗОВ»!

22 апреля в 13:30 приглашаем вас на лекцию Леонида Ферштата — одного из ведущих химиков России: «Много азота не бывает: зачем нужны гетероциклы с высоким содержанием азота?»

Леонид Леонидович Ферштат — доктор химических наук, лауреат Национальной премии в области будущих технологий «ВЫЗОВ», заведующий лабораторией азотсодержащих соединений Института органической химии им. Н.Д. Зелинского РАН.

На лекции вы узнаете:
▪️О передовых разработках в области азот-кислородных гетероциклических соединений.
▪️Как эти исследования помогают создавать новые лекарства — ведь такие структуры широко распространены в живой природе.
▪️Почему энергоёмкие материалы на основе связей C–N, N–N и N–O могут совершить прорыв в аэрокосмической и горнодобывающей отраслях.

После лекции — презентация заявочной кампании третьего сезона Национальной премии в области будущих технологий «ВЫЗОВ»!🪐

Вы получите всю информацию о подаче заявок, критериях отбора и возможностях для учёных и инженеров. Поэтому встреча будет особенно полезна научным сотрудникам и исследовательским коллективам, ведь это отличная возможность узнать о критериях оценки работ и требованиях к заявкам из первых рук!☄️

📍Где? Санкт-Петербург, ул. Ломоносова, 9, Университет ИТМО, актовый зал
📅 Когда? 22 апреля, 13:30–17:00
🔗 Регистрация: clck.ru/3LE39i
2
Анонсируем новый сезон программы стажировок. В этом году формат следующий:

Сначала - собираем заявки. С теми, чье CV и мотивационное письмо нас заинтересовало - встретимся для собеседования.

Первый этап - 1 месяц - стажировка неоплачиваемая. Далее мы отбираем тех кто показал себя перспективными и индивидуально обсуждаем условия второго этапа.

Мы нацелены на продуктивное и долгосрочное сотрудничество с дальнейшим трудоустройством всех хорошо себя зарекомендовавших кандидатов. Поэтому стажировка в первую очередь для тех, кто видит себя в науке, аспирантуре и наших прикладных проектах. В рамках участия в стажировке можно стать контрибьюторами открытых библиотек, со-авторами статей в топовые журналы и конференции, получить практической опыт работы над наукоёмкими задачами, найти научного руководителя для выпускных работ. Мы ориентируемся преимущественно на студентов магистратуры и бакалавриата, поэтому работа предполагает формат part-time. Работы, выполняемые на стажировке могут быть одновременно и проектом для ВКР.

Заявки можно отсылать в форму, до 15.05.2025.

Основные направления стажировок (лучше изначально выбрать какое-то конкретное и обосновать свою заинтересованность в мотивационном письма):

1) Исследования в области AI4Science

Руководитель: Глеб Соловьев https://github.com/SoloWayG

Примеры задач:
- Разработка и применение методов автоматизации предсказательного моделирования (для задач химии и не только).
- Разработка гибридных генеративных методов, основанных на методах глубокого обучения и методах эволюционной оптимизации (для задач химии и не только).
- Применение агентных LLM для автоматизации создания предметных пайплайнов

Примеры некоторых задач - тут

2) Глубокое обучение и аналитика на основе данных ДЗЗ в сфере наук о климате

Руководитель: Юлия Борисова https://github.com/ChrisLisbon

- Обучение классических ML и нейросетевых моделей для предсказательного моделирования на основе этих данных, оценки корреляций параметров атмосферы и чувствительности моделей к этим параметрам - свободная тема при особом интересе к климатическим данным и ДЗЗ.

Требуемые навыки: программирование на Python, основы статистики, понимание предметной области (машинное обучение и/или науки о земле)

- Проект по разработке прогностической системы ледовых условий в морях российской Арктики и Охотском море - стажировка в рамках индустриального проекта, включает полноценную работу в команде разработчиков на Python и исследователей в области глубокого обучения и наук о земле.

Требуемые навыки: программирование на Python на продвинутом уровне, уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных, основы статистики;

3) Разработка открытой библиотеки OSA для "обслуживания" open-source репозиториев

Руководитель: Андрей Гетманов https://github.com/andreygetmanov

Участие в создании инструмента для комплексной автоматизации работы с научным open-source, основанного на применении мульти-агентных LLM. Код можно посмотреть тут.

Общие требования: знание Python, опыт использования научных и ML-пакетов, навыки работы с git и github, отладки, тестирования.

4) Исследования и разработки в области мультиагентных LLM
Руководитель: Калюжная А.В.
Примеры задач:
- Исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных
- Разработка симулятора на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх
- Разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM
- Экспериментальное исследование методов автоматического построения графов знаний по данным

Общие требования:
- уверенное чтение и понимание статей,
- умение разбираться в программном коде
- понимание основ теории графов и графовых алгоритмов
- способность разобраться с тем как запустить код для обучения DL моделей
- будет преимуществом наличие опыта работы с агентными LLM
🔥61🤩1
🚀 Mультиагентный поиск лекарств

24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)!

На семинаре разберём мультиагентную систему MADD для открытия новых лекарств:
➡️ Покажем, как система интегрирует LLM с генеративными моделями (GAN, Transformer, FREED++) для создания эффективных молекул-кандидатов
➡️ Продемонстрируем как разработанная архитектура справляется с распределением задач между специализированными агентами
➡️ Сравним результаты с конкурирующими решениями (ChemAgent, LlasMol, ChemDFM, X-LoRA-Gemma) на тестах для шести заболеваний и покажем превосходство MADD в генерации целевых молекул

После доклада - ответы на ваши вопросы

💻 Подключайтесь онлайн


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
А 25 апреля вы можете насладиться онлайн митапом от нашего сообщества ITMO Scientific OpenSource!
3
Forwarded from Научный опенсорс (Irina Deeva)
🌿 Весенний митап ITMO Opensource 🌿

Приглашаем вас на онлайн-митап, где поговорим о том, как поддерживать Open Source не только идеями, но и реальными ресурсами 💸

Что вас ждёт:
• Обзор актуальных грантов на разработку Open Source решений
• Инструкции и лайфхаки по подаче заявки
• Реальные истории успеха от победителей конкурсов вроде «КОД ИИ»
• Разбор кейсов и трудностей, с которыми сталкиваются разработчики
• Ответы на главный вопрос: что делать, когда грант заканчивается?

🔊 В программе выступят:
18:00 — Николай Никитин (ИТМО): какие формы поддержки Open Source доступны сегодня?
18:30 — Александр Нозик (МФТИ): существует ли жизнь для open source без грантов?
19:00 — Ирина Деева (ИТМО): как выиграли «КОД ИИ» и во что это вылилось
19:30 — Андрей Остроух (МАДИ): создание учебного курса по Open Source — опыт и выводы

🎯 Митап будет полезен:
— тем, кто уже работает над open source-проектом
— тем, кто планирует привлекать грантовую поддержку
— всем, кто хочет понять, как устроена инфраструктура открытой разработки в России

📢 Не пропустите встречу!
Скоро опубликуем ссылку на трансляцию, а пока — сохраняйте дату!

📅 Когда: 25 апреля, 18:00
📍 Где: онлайн (ссылка на трансляцию появится позже)
🔗 Не забудьте зарегистрироваться
4🔥2
ИИ Песочница | RnD про ML, AI, Data Science
🚀 Mультиагентный поиск лекарств 24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)! На семинаре разберём мультиагентную систему MADD для открытия новых лекарств: ➡️ Покажем, как система интегрирует LLM с генеративными…
Через пару минут начнется семинар лаборатории ИИ Сбера, на котором Анна Калюжная расскажет про разработанную нами мультиагентную систему MADD, предназначенную для создания новых лекарств.

Подключиться можно тут.
🔥6
Forwarded from Научный опенсорс (Irina Deeva)
🔥 С 24 мая по 1 июня пройдёт Data Fest 2025 — главное событие сообщества Open Data Science! Это отличная возможность выступить с докладом, найти единомышленников, завести новых друзей и просто классно провести время.

В этом году наша лаборатория представит сразу два трека:

🔹 Open Source — про открытые библиотеки и фреймворки для DS/ML, а также обмен опытом в сфере open-source разработок в целом.

🔹 PGM & CausalML — новый трек! Теория, инструменты и практика вероятностных графовых моделей и методов причинного машинного обучения.

Треки будут функционировать как онлайн, так и офлайн: города проведения - Москва, Питер, Новосибирск, Алматы и планируется площадка в Белграде.

Ждём ваши заявки на доклады! 👉 тык
Дедлайн подачи заявок - 7 мая, так что торопитесь!
👍8
На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе.

В докладе рассказали про архитектуру, реализованные функции (генерация README, документации, анализ репозиториев, авто-настройку CI/CD), а также опыт тестирования на разных научных репозиториях. По итогам мероприятия про OSA написали и в СМИ.

Попробовать OSA можно тут - https://github.com/aimclub/OSA.
Приглашаем всех желающих протестировать и дать обратную связь. Скоро также развернем публичную версию, доступную как сервис
🔥17
NSS Lab News
На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе. В докладе рассказали про архитектуру, реализованные функции (генерация README, документации…
Продолжая поднятую тему: сегодня выпустили на Хабре развернутый пост про OSA - https://habr.com/ru/companies/spbifmo/articles/906018/

В нём подробнее описали сам инструмент, примеры его применения, а также собрали первые отзывы попробовавших его коллег. В частности, OSA попробовали сотрудники лаборатории КТ ИТМО, ФКН ВШЭ и бразильского Universidade Federal de Juiz de Fora.

На репозитории уже несколько десятков звезд, но от дополнительных не откажемся)
👍11🔥21
Forwarded from Научный опенсорс (Irina Deeva)
Всем привет! 👋
Мы — команда probAI, и рады представить applybn — нашу новую библиотеку для прикладного анализа данных на базе байесовских сетей (БС) и каузальных моделей. Разработано в рамках гранта «КодИИ».

Однажды мы собрались и поняли, что существует множество классных алгоритмов на основе байесовских сетей и каузальных моделей, которые умеют детектировать выбросы, отбирать и генерировать признаки, объяснять влияние частей модели на результат и многое другое. Так почему бы не собрать лучших из них в одну удобную библиотеку? Так и появился applybn.

Что умеет applybn?

1. Обнаружение аномалий

✔️Табличные данные: сочетание байесовских сетей и методов близости для поиска плотностных аномалий и аномалий зависимостей

✔️Временные ряды: динамические БС, автоматически учитывающие временные и межпеременные зависимости

2. Генерация синтетических данных и балансировка выборок

✔️Автоматическое выравнивание несбалансированных выборок при помощи гибридных БС и гауссовских смесей с учётом взаимодействий признаков

3. Отбор и генерация признаков

✔️Каузальный отбор: ищет только те фичи, которые имеют ненулевой причинный эффект (без ручных порогов)

✔️MI‑отбор: находит марковские окружения по нормализованной взаимной информации

✔️Генерация фичей на основе БС: дополняет данные вероятностными параметрами условных зависимостей для повышения качества моделей

4. Объяснимый анализ

✔️Каузальный анализ компонентов моделей: строит структурную каузальную модель, чтобы оценить и убрать неважные компоненты модели (например, фильтры CNN)

✔️ACE‑анализ признаков в данных: рассчитывает средний эффект влияния признаков на уверенность модели для интерпретации и отладки

⚙️ Все модули библиотеки совместимы с экосистемой scikit-learn, так что её легко интегрировать в существующие пайплайны анализа данных.

Заглядывайте в репозиторий applybn, ставьте звёздочки ⭐️ и делитесь впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍53
В канале факультета - мини-интервью нашего выпускника и ex-стажера NSS Lab.

Кстати, наш текущий набор на стажерские позиции ещё открыт - темы есть и про DL для геоданных, и про AI4Science, и про LLM-агентов.
🔥3
Forwarded from ФТИИ ИТМО
📝 Рубрика «Отзывы выпускников»

Мы поговорили с Ильёй Дриго — выпускником магистратуры «Большие данные и машинное обучение» 2020 года. Сейчас Илья работает Senior Research Meteorologist в «Яндекс Погоде» 🌧️

Почему выбрал эту программу?
После бакалавриата‑океанологии в МГУ Илья понял: для работы с океанологическими данными не хватает технических знаний. Магистратура дала фундамент по машинному обучению и статистике и позволила работать на стыке CS и наук о Земле — как раз то, что нужно в weather/climate tech.

Как удавалось совмещать учебу и работу?
Днём — лаборатория и диплом, вечером — проекты Windy.App. Пришлось жонглировать задачами, но знания с семинаров сразу применялись на работе. Перед защитой Илья взял отпуск и спокойно довёл диплом до ума 📚

Как изменилась карьера?
После выпуска Илья перешёл в Windy.App на фул‑тайм, а позже перешёл в «Яндекс Погоду». Ежедневно работает с терабайтами данных, ML‑моделями и численными прогнозами — всё, чему учился в ИТМО.

Что запомнилось из учёбы?
• Максимальная практичность полученных знаний. Писали параллельный код, который ускорял задачи в десятки раз.
• Разворачивали собственный вычислительный кластер.
• Изучали статистику не «на пальцах», а на реальных моделях.
• И, конечно же, переезд в Санкт‑Петербург.

🎁 Бонус‑история
В Windy.App Илью позвали настроить приливную модель для яхтсменов. Общие интересы и увлечение парусным спортом сделали своё дело — и он остался в команде. В компании даже дают отгулы «когда дует» 🌬️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
Всем привет! Мы обновили и расширили документацию с примерами нашей библиотеки TorchCNNBuilder. Инструмент довольно простой в освоении, позволяет быстро создавать сверточные сети для любых целей не задумываясь о внутренних размерностях - достаточно задать размер входных и выходных данных.

Модельки можно собрать легковесные, но в качестве бейзлайнов для прогнозирования, сегментации, автоэнкодеров - отличный вариант. Кто еще не пробовал, но внезапно почувствует потребность в свертках, приглашаем затестировать или поконтрибьютить) ну и поддержите звездочками, нам будет очень приятно ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥83👍1
Наш аспирант Иов Илларион выступает с докладом про alignment в обучении LLM на конференции IML 2025. Для интересующихся тематикой - презентацию можно посмотреть тут.
#доклады

Alignment for All

ℹ️ О чем доклад: Как выбрать подходящий alignment-метод для своих задач, сократить вычислительные затраты и сделать обучение LLM доступнее. LLM сложно контролировать с помощью обычного файнтюнинга, а RL-based подходы требуют много ресурсов.

Поищем альтернативу — разберем методы оптимизации предпочтений, которые позволяют достичь качественного alignment без огромных затрат. Увидим, как адаптировать эти методы для LLM, лучше использовать синтетику, контролировать прокси-награду и избегать ошибок при обучении.

🗣 Спикер: Илларион Иов развивает в Точке LLM alignment и дообучает модели для банковских задач. Пишет диссертацию в ИТМО о применении LLM в AutoML. Ранее ресерчил применения ML в физических исследованиях и продолжает следить за новостями в области.

Подробности и билеты
🔥9