Небольшой анонс:
Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной:
"Научные проблемы и практические достижения агентных систем на основе LLM".
Ссылка на трансляцию: https://us06web.zoom.us/j/84116364928?pwd=rIAZcjbHzbWHThS9VbxA8UiKaplOzo.1
#nss_talk
Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной:
"Научные проблемы и практические достижения агентных систем на основе LLM".
Ссылка на трансляцию: https://us06web.zoom.us/j/84116364928?pwd=rIAZcjbHzbWHThS9VbxA8UiKaplOzo.1
#nss_talk
🔥14❤1
Продолжаем рубрику "разборы статей и полезные советы от Александра Хватова @sasha_hvat":
1) Попалась статья на АААI этого года по PINNам.
Основная идея в том, что сетку для "решения" нужно брать не равномерную, а по особой формуле.
Такие работы мы видели и не раз. Интересен способ как получили формулу: оказывается, что для Фурье-преобразования можно определить пространства Коробова, и если правильно подобрать степень, то ошибка будет пропорциональна не степени 1/h, а log(h)/h, то есть более точной.
Как вывод, для преобразования Фурье с точки зрения точности передачи сигнала имеет смысл брать не равномерную сетку по частоте, а зависящую от типа передаваемой информации неравномерную. Естественно, на практике проще и быстрее делать DFT.
2) Наткнулся в твиттере на пост о том как писать ребутталы. Выглядит довольно разумно. На сайте есть и гайд как писать статьи.
Напомню ещё о старой (но всё ещё актуальной) презентации о том же.
3) К моей любимой теме, дифференциальным уравнениям.
В 1900 году (аж 125 лет назад) Давид Гильберт с сотоварищами сформулировал 23 задачи, которые, по их мнению, стоят внимания.
Стоят или не стоят, до сих пор нет-нет, да кто-то да гоняется задурной славой. Последний успешный кейс решения был в 1970, когда ак. Матиясевич (тогда аспирант нашей родной Питерской Стелковки) решил проблему с диофантовыми уравнениями.
Если посмотреть на список, все конкретные задачи уже решены, остались с нечёткой формулировкой. Сегодня нас интересует шестая.
Попробую описать её так: можно ли из стат. физики, из столкновения молекул, статистики Больцмана вывести уравнения макромасштаба, например, уравнения Навье-Стокса. Из уроков школьной физики может показаться, что где-то есть формула средней кинетической энергии молекул и она как-то должна соответствовать таковой по всему полю. Но нет, кинетическая энергия молекул не совсем связана с кинетической энергией на макромасштабе (та, которая ~mv^2/2).
Некоторые учёные в 2018 верили, что переход микро -> макро вообще невозможен.
Как водится, у любого тезиса есть антитезис и в 2025 другие учёные верят, что всё выводится из второго закона Ньютона: и микро, и мезомасштаб, и макро (это точно правда).
Правда ли первое или второе? Да чёрт его знает: первому больше веры, хотя бы потому что это публикация, а не препринт. Я хотел вот такую мысль выразить: не всё, что написано математическими значками (к сожалению) абсолютная истина. Очень много статей про теоремы об "универсальной аппроксимации архитектуры Х" и других. Вплоть до того, что PINN может бесконечно хорошо приближать решения (это точно неправда).
Что делать? Ну видимо надо верить только формулам с примерами (так же как и коду). Ну и второе, максимально скептически относиться к формулам, если в них невозможно разобраться.
#nss_paper_reading_club
1) Попалась статья на АААI этого года по PINNам.
Основная идея в том, что сетку для "решения" нужно брать не равномерную, а по особой формуле.
Такие работы мы видели и не раз. Интересен способ как получили формулу: оказывается, что для Фурье-преобразования можно определить пространства Коробова, и если правильно подобрать степень, то ошибка будет пропорциональна не степени 1/h, а log(h)/h, то есть более точной.
Как вывод, для преобразования Фурье с точки зрения точности передачи сигнала имеет смысл брать не равномерную сетку по частоте, а зависящую от типа передаваемой информации неравномерную. Естественно, на практике проще и быстрее делать DFT.
2) Наткнулся в твиттере на пост о том как писать ребутталы. Выглядит довольно разумно. На сайте есть и гайд как писать статьи.
Напомню ещё о старой (но всё ещё актуальной) презентации о том же.
3) К моей любимой теме, дифференциальным уравнениям.
В 1900 году (аж 125 лет назад) Давид Гильберт с сотоварищами сформулировал 23 задачи, которые, по их мнению, стоят внимания.
Стоят или не стоят, до сих пор нет-нет, да кто-то да гоняется за
Если посмотреть на список, все конкретные задачи уже решены, остались с нечёткой формулировкой. Сегодня нас интересует шестая.
Попробую описать её так: можно ли из стат. физики, из столкновения молекул, статистики Больцмана вывести уравнения макромасштаба, например, уравнения Навье-Стокса. Из уроков школьной физики может показаться, что где-то есть формула средней кинетической энергии молекул и она как-то должна соответствовать таковой по всему полю. Но нет, кинетическая энергия молекул не совсем связана с кинетической энергией на макромасштабе (та, которая ~mv^2/2).
Некоторые учёные в 2018 верили, что переход микро -> макро вообще невозможен.
Как водится, у любого тезиса есть антитезис и в 2025 другие учёные верят, что всё выводится из второго закона Ньютона: и микро, и мезомасштаб, и макро (это точно правда).
Правда ли первое или второе? Да чёрт его знает: первому больше веры, хотя бы потому что это публикация, а не препринт. Я хотел вот такую мысль выразить: не всё, что написано математическими значками (к сожалению) абсолютная истина. Очень много статей про теоремы об "универсальной аппроксимации архитектуры Х" и других. Вплоть до того, что PINN может бесконечно хорошо приближать решения (это точно неправда).
Что делать? Ну видимо надо верить только формулам с примерами (так же как и коду). Ну и второе, максимально скептически относиться к формулам, если в них невозможно разобраться.
#nss_paper_reading_club
❤5🔥4
NSS Lab News
Небольшой анонс: Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной: "Научные проблемы и практические достижения агентных систем на основе LLM". Ссылка на трансляцию: https://us06web.zoom.us/…
Начинаем, можно подключаться.
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
🔥2
Коллеги-химики попросили распространить "ВЫЗОВ" (получается, вызов принят). Очень ждут эту лекцию в ИТМО, может кому-то будет интересно.
👍2
Forwarded from InfoChemistry | ITMO
⚡️ Санкт-Петербург принимает «ВЫЗОВ»!
22 апреля в 13:30 приглашаем вас на лекцию Леонида Ферштата — одного из ведущих химиков России: «Много азота не бывает: зачем нужны гетероциклы с высоким содержанием азота?»
Леонид Леонидович Ферштат — доктор химических наук, лауреат Национальной премии в области будущих технологий «ВЫЗОВ», заведующий лабораторией азотсодержащих соединений Института органической химии им. Н.Д. Зелинского РАН.
На лекции вы узнаете:
▪️О передовых разработках в области азот-кислородных гетероциклических соединений.
▪️Как эти исследования помогают создавать новые лекарства — ведь такие структуры широко распространены в живой природе.
▪️Почему энергоёмкие материалы на основе связей C–N, N–N и N–O могут совершить прорыв в аэрокосмической и горнодобывающей отраслях.
После лекции — презентация заявочной кампании третьего сезона Национальной премии в области будущих технологий «ВЫЗОВ»!🪐
Вы получите всю информацию о подаче заявок, критериях отбора и возможностях для учёных и инженеров. Поэтому встреча будет особенно полезна научным сотрудникам и исследовательским коллективам, ведь это отличная возможность узнать о критериях оценки работ и требованиях к заявкам из первых рук!☄️
📍Где? Санкт-Петербург, ул. Ломоносова, 9, Университет ИТМО, актовый зал
📅 Когда? 22 апреля, 13:30–17:00
🔗 Регистрация: clck.ru/3LE39i
22 апреля в 13:30 приглашаем вас на лекцию Леонида Ферштата — одного из ведущих химиков России: «Много азота не бывает: зачем нужны гетероциклы с высоким содержанием азота?»
Леонид Леонидович Ферштат — доктор химических наук, лауреат Национальной премии в области будущих технологий «ВЫЗОВ», заведующий лабораторией азотсодержащих соединений Института органической химии им. Н.Д. Зелинского РАН.
На лекции вы узнаете:
▪️О передовых разработках в области азот-кислородных гетероциклических соединений.
▪️Как эти исследования помогают создавать новые лекарства — ведь такие структуры широко распространены в живой природе.
▪️Почему энергоёмкие материалы на основе связей C–N, N–N и N–O могут совершить прорыв в аэрокосмической и горнодобывающей отраслях.
После лекции — презентация заявочной кампании третьего сезона Национальной премии в области будущих технологий «ВЫЗОВ»!🪐
Вы получите всю информацию о подаче заявок, критериях отбора и возможностях для учёных и инженеров. Поэтому встреча будет особенно полезна научным сотрудникам и исследовательским коллективам, ведь это отличная возможность узнать о критериях оценки работ и требованиях к заявкам из первых рук!☄️
📍Где? Санкт-Петербург, ул. Ломоносова, 9, Университет ИТМО, актовый зал
📅 Когда? 22 апреля, 13:30–17:00
🔗 Регистрация: clck.ru/3LE39i
❤2
Анонсируем новый сезон программы стажировок. В этом году формат следующий:
Сначала - собираем заявки. С теми, чье CV и мотивационное письмо нас заинтересовало - встретимся для собеседования.
Первый этап - 1 месяц - стажировка неоплачиваемая. Далее мы отбираем тех кто показал себя перспективными и индивидуально обсуждаем условия второго этапа.
Мы нацелены на продуктивное и долгосрочное сотрудничество с дальнейшим трудоустройством всех хорошо себя зарекомендовавших кандидатов. Поэтому стажировка в первую очередь для тех, кто видит себя в науке, аспирантуре и наших прикладных проектах. В рамках участия в стажировке можно стать контрибьюторами открытых библиотек, со-авторами статей в топовые журналы и конференции, получить практической опыт работы над наукоёмкими задачами, найти научного руководителя для выпускных работ. Мы ориентируемся преимущественно на студентов магистратуры и бакалавриата, поэтому работа предполагает формат part-time. Работы, выполняемые на стажировке могут быть одновременно и проектом для ВКР.
Заявки можно отсылать в форму, до 15.05.2025.
Основные направления стажировок (лучше изначально выбрать какое-то конкретное и обосновать свою заинтересованность в мотивационном письма):
1) Исследования в области AI4Science
Руководитель: Глеб Соловьев https://github.com/SoloWayG
Примеры задач:
- Разработка и применение методов автоматизации предсказательного моделирования (для задач химии и не только).
- Разработка гибридных генеративных методов, основанных на методах глубокого обучения и методах эволюционной оптимизации (для задач химии и не только).
- Применение агентных LLM для автоматизации создания предметных пайплайнов
Примеры некоторых задач - тут
2) Глубокое обучение и аналитика на основе данных ДЗЗ в сфере наук о климате
Руководитель: Юлия Борисова https://github.com/ChrisLisbon
- Обучение классических ML и нейросетевых моделей для предсказательного моделирования на основе этих данных, оценки корреляций параметров атмосферы и чувствительности моделей к этим параметрам - свободная тема при особом интересе к климатическим данным и ДЗЗ.
Требуемые навыки: программирование на Python, основы статистики, понимание предметной области (машинное обучение и/или науки о земле)
- Проект по разработке прогностической системы ледовых условий в морях российской Арктики и Охотском море - стажировка в рамках индустриального проекта, включает полноценную работу в команде разработчиков на Python и исследователей в области глубокого обучения и наук о земле.
Требуемые навыки: программирование на Python на продвинутом уровне, уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных, основы статистики;
3) Разработка открытой библиотеки OSA для "обслуживания" open-source репозиториев
Руководитель: Андрей Гетманов https://github.com/andreygetmanov
Участие в создании инструмента для комплексной автоматизации работы с научным open-source, основанного на применении мульти-агентных LLM. Код можно посмотреть тут.
Общие требования: знание Python, опыт использования научных и ML-пакетов, навыки работы с git и github, отладки, тестирования.
4) Исследования и разработки в области мультиагентных LLM
Руководитель: Калюжная А.В.
Примеры задач:
- Исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных
- Разработка симулятора на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх
- Разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM
- Экспериментальное исследование методов автоматического построения графов знаний по данным
Общие требования:
- уверенное чтение и понимание статей,
- умение разбираться в программном коде
- понимание основ теории графов и графовых алгоритмов
- способность разобраться с тем как запустить код для обучения DL моделей
- будет преимуществом наличие опыта работы с агентными LLM
Сначала - собираем заявки. С теми, чье CV и мотивационное письмо нас заинтересовало - встретимся для собеседования.
Первый этап - 1 месяц - стажировка неоплачиваемая. Далее мы отбираем тех кто показал себя перспективными и индивидуально обсуждаем условия второго этапа.
Мы нацелены на продуктивное и долгосрочное сотрудничество с дальнейшим трудоустройством всех хорошо себя зарекомендовавших кандидатов. Поэтому стажировка в первую очередь для тех, кто видит себя в науке, аспирантуре и наших прикладных проектах. В рамках участия в стажировке можно стать контрибьюторами открытых библиотек, со-авторами статей в топовые журналы и конференции, получить практической опыт работы над наукоёмкими задачами, найти научного руководителя для выпускных работ. Мы ориентируемся преимущественно на студентов магистратуры и бакалавриата, поэтому работа предполагает формат part-time. Работы, выполняемые на стажировке могут быть одновременно и проектом для ВКР.
Заявки можно отсылать в форму, до 15.05.2025.
Основные направления стажировок (лучше изначально выбрать какое-то конкретное и обосновать свою заинтересованность в мотивационном письма):
1) Исследования в области AI4Science
Руководитель: Глеб Соловьев https://github.com/SoloWayG
Примеры задач:
- Разработка и применение методов автоматизации предсказательного моделирования (для задач химии и не только).
- Разработка гибридных генеративных методов, основанных на методах глубокого обучения и методах эволюционной оптимизации (для задач химии и не только).
- Применение агентных LLM для автоматизации создания предметных пайплайнов
Примеры некоторых задач - тут
2) Глубокое обучение и аналитика на основе данных ДЗЗ в сфере наук о климате
Руководитель: Юлия Борисова https://github.com/ChrisLisbon
- Обучение классических ML и нейросетевых моделей для предсказательного моделирования на основе этих данных, оценки корреляций параметров атмосферы и чувствительности моделей к этим параметрам - свободная тема при особом интересе к климатическим данным и ДЗЗ.
Требуемые навыки: программирование на Python, основы статистики, понимание предметной области (машинное обучение и/или науки о земле)
- Проект по разработке прогностической системы ледовых условий в морях российской Арктики и Охотском море - стажировка в рамках индустриального проекта, включает полноценную работу в команде разработчиков на Python и исследователей в области глубокого обучения и наук о земле.
Требуемые навыки: программирование на Python на продвинутом уровне, уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных, основы статистики;
3) Разработка открытой библиотеки OSA для "обслуживания" open-source репозиториев
Руководитель: Андрей Гетманов https://github.com/andreygetmanov
Участие в создании инструмента для комплексной автоматизации работы с научным open-source, основанного на применении мульти-агентных LLM. Код можно посмотреть тут.
Общие требования: знание Python, опыт использования научных и ML-пакетов, навыки работы с git и github, отладки, тестирования.
4) Исследования и разработки в области мультиагентных LLM
Руководитель: Калюжная А.В.
Примеры задач:
- Исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных
- Разработка симулятора на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх
- Разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM
- Экспериментальное исследование методов автоматического построения графов знаний по данным
Общие требования:
- уверенное чтение и понимание статей,
- умение разбираться в программном коде
- понимание основ теории графов и графовых алгоритмов
- способность разобраться с тем как запустить код для обучения DL моделей
- будет преимуществом наличие опыта работы с агентными LLM
🔥6❤1🤩1
Forwarded from ИИ Песочница | RnD про ML, AI, Data Science
🚀 Mультиагентный поиск лекарств
24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)!
На семинаре разберём мультиагентную систему MADD для открытия новых лекарств:
➡️ Покажем, как система интегрирует LLM с генеративными моделями (GAN, Transformer, FREED++) для создания эффективных молекул-кандидатов
➡️ Продемонстрируем как разработанная архитектура справляется с распределением задач между специализированными агентами
➡️ Сравним результаты с конкурирующими решениями (ChemAgent, LlasMol, ChemDFM, X-LoRA-Gemma) на тестах для шести заболеваний и покажем превосходство MADD в генерации целевых молекул
После доклада - ответы на ваши вопросы
💻 Подключайтесь онлайн
#анонс
❤ @sb_ai_lab
24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)!
На семинаре разберём мультиагентную систему MADD для открытия новых лекарств:
После доклада - ответы на ваши вопросы
#анонс
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
А 25 апреля вы можете насладиться онлайн митапом от нашего сообщества ITMO Scientific OpenSource!
❤3
Forwarded from Научный опенсорс (Irina Deeva)
🌿 Весенний митап ITMO Opensource 🌿
Приглашаем вас на онлайн-митап, где поговорим о том, как поддерживать Open Source не только идеями, но и реальными ресурсами 💸
Что вас ждёт:
• Обзор актуальных грантов на разработку Open Source решений
• Инструкции и лайфхаки по подаче заявки
• Реальные истории успеха от победителей конкурсов вроде «КОД ИИ»
• Разбор кейсов и трудностей, с которыми сталкиваются разработчики
• Ответы на главный вопрос: что делать, когда грант заканчивается?
🔊 В программе выступят:
18:00 — Николай Никитин (ИТМО): какие формы поддержки Open Source доступны сегодня?
18:30 — Александр Нозик (МФТИ): существует ли жизнь для open source без грантов?
19:00 — Ирина Деева (ИТМО): как выиграли «КОД ИИ» и во что это вылилось
19:30 — Андрей Остроух (МАДИ): создание учебного курса по Open Source — опыт и выводы
🎯 Митап будет полезен:
— тем, кто уже работает над open source-проектом
— тем, кто планирует привлекать грантовую поддержку
— всем, кто хочет понять, как устроена инфраструктура открытой разработки в России
📢 Не пропустите встречу!
Скоро опубликуем ссылку на трансляцию, а пока — сохраняйте дату!
📅 Когда: 25 апреля, 18:00
📍 Где: онлайн (ссылка на трансляцию появится позже)
🔗 Не забудьте зарегистрироваться
Приглашаем вас на онлайн-митап, где поговорим о том, как поддерживать Open Source не только идеями, но и реальными ресурсами 💸
Что вас ждёт:
• Обзор актуальных грантов на разработку Open Source решений
• Инструкции и лайфхаки по подаче заявки
• Реальные истории успеха от победителей конкурсов вроде «КОД ИИ»
• Разбор кейсов и трудностей, с которыми сталкиваются разработчики
• Ответы на главный вопрос: что делать, когда грант заканчивается?
🔊 В программе выступят:
18:00 — Николай Никитин (ИТМО): какие формы поддержки Open Source доступны сегодня?
18:30 — Александр Нозик (МФТИ): существует ли жизнь для open source без грантов?
19:00 — Ирина Деева (ИТМО): как выиграли «КОД ИИ» и во что это вылилось
19:30 — Андрей Остроух (МАДИ): создание учебного курса по Open Source — опыт и выводы
🎯 Митап будет полезен:
— тем, кто уже работает над open source-проектом
— тем, кто планирует привлекать грантовую поддержку
— всем, кто хочет понять, как устроена инфраструктура открытой разработки в России
📢 Не пропустите встречу!
Скоро опубликуем ссылку на трансляцию, а пока — сохраняйте дату!
📅 Когда: 25 апреля, 18:00
📍 Где: онлайн (ссылка на трансляцию появится позже)
🔗 Не забудьте зарегистрироваться
Google Docs
Онлайн-митап 25 апреля
Регистрация на митап, который пройдет в онлайн-формате 25-го апреля в 18:00.
Митап будет посвящен теме грантов для поддержки Open Source решений.
Ссылка на подключение: https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию: https://www.youtube.co…
Митап будет посвящен теме грантов для поддержки Open Source решений.
Ссылка на подключение: https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию: https://www.youtube.co…
❤4🔥2
NSS Lab News
Небольшой анонс: Завтра (15.04) в 19-00 мск на семинаре Лаборатории Естественного Языка ВШЭ-ЯНДЕКС пройдет доклад Анны Калюжной: "Научные проблемы и практические достижения агентных систем на основе LLM". Ссылка на трансляцию: https://us06web.zoom.us/…
Для тех кто пропустил семинар про агентные системы на основе LLM - подьехала запись: https://www.youtube.com/watch?v=vmoDG_EurwE
YouTube
Мультиагентные системы | Анна Калюжная в ЛЕЯ
На семинаре в Лаборатории Естественного Языка ВШЭ-Яндекс выступила Анна Калюжная с докладом "Научные проблемы и практические достижения агентных систем на основе LLM".
Анна Калюжная является:
- старшим научным сотрудником Лаборатории Композитного Искусственного…
Анна Калюжная является:
- старшим научным сотрудником Лаборатории Композитного Искусственного…
🔥10🥰1
ИИ Песочница | RnD про ML, AI, Data Science
🚀 Mультиагентный поиск лекарств 24 апреля в 17:00 ждём всех на научном семинаре с Анной Калюжной и Андреем Дмитренко (ИТМО)! На семинаре разберём мультиагентную систему MADD для открытия новых лекарств: ➡️ Покажем, как система интегрирует LLM с генеративными…
Через пару минут начнется семинар лаборатории ИИ Сбера, на котором Анна Калюжная расскажет про разработанную нами мультиагентную систему MADD, предназначенную для создания новых лекарств.
Подключиться можно тут.
Подключиться можно тут.
🔥6
Forwarded from Научный опенсорс (Irina Deeva)
А мы начинаем наш ITMO Opensource Meetup уже через 15 минут!
Ссылка на подключение - https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию в youtube - https://www.youtube.com/live/y3ef9TgBhlI
Ссылка на подключение - https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию в youtube - https://www.youtube.com/live/y3ef9TgBhlI
telemost.yandex.ru
Яндекс Телемост — бесплатные видеовстречи без регистрации и ограничения по времени
Бесплатные видеоконференции и встречи прямо в браузере. Подключение без регистрации, удобно с ПК и телефона. Работайте, учитесь и общайтесь онлайн
❤5
Forwarded from Научный опенсорс (Irina Deeva)
🔥 С 24 мая по 1 июня пройдёт Data Fest 2025 — главное событие сообщества Open Data Science! Это отличная возможность выступить с докладом, найти единомышленников, завести новых друзей и просто классно провести время.
В этом году наша лаборатория представит сразу два трека:
🔹 Open Source — про открытые библиотеки и фреймворки для DS/ML, а также обмен опытом в сфере open-source разработок в целом.
🔹 PGM & CausalML — новый трек! Теория, инструменты и практика вероятностных графовых моделей и методов причинного машинного обучения.
Треки будут функционировать как онлайн, так и офлайн: города проведения - Москва, Питер, Новосибирск, Алматы и планируется площадка в Белграде.
Ждём ваши заявки на доклады! 👉 тык
Дедлайн подачи заявок - 7 мая, так что торопитесь!
В этом году наша лаборатория представит сразу два трека:
🔹 Open Source — про открытые библиотеки и фреймворки для DS/ML, а также обмен опытом в сфере open-source разработок в целом.
🔹 PGM & CausalML — новый трек! Теория, инструменты и практика вероятностных графовых моделей и методов причинного машинного обучения.
Треки будут функционировать как онлайн, так и офлайн: города проведения - Москва, Питер, Новосибирск, Алматы и планируется площадка в Белграде.
Ждём ваши заявки на доклады! 👉 тык
Дедлайн подачи заявок - 7 мая, так что торопитесь!
👍8
На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе.
В докладе рассказали про архитектуру, реализованные функции (генерация README, документации, анализ репозиториев, авто-настройку CI/CD), а также опыт тестирования на разных научных репозиториях. По итогам мероприятия про OSA написали и в СМИ.
Попробовать OSA можно тут - https://github.com/aimclub/OSA.
Приглашаем всех желающих протестировать и дать обратную связь. Скоро также развернем публичную версию, доступную как сервис
В докладе рассказали про архитектуру, реализованные функции (генерация README, документации, анализ репозиториев, авто-настройку CI/CD), а также опыт тестирования на разных научных репозиториях. По итогам мероприятия про OSA написали и в СМИ.
Попробовать OSA можно тут - https://github.com/aimclub/OSA.
Приглашаем всех желающих протестировать и дать обратную связь. Скоро также развернем публичную версию, доступную как сервис
🔥17
NSS Lab News
На прошлой неделе Андрей Гетманов представил наш новый LLM-инструмент для поддержки научного открытого кода OSA (Open Source Advisor) на конференции Merge в Иннополисе. В докладе рассказали про архитектуру, реализованные функции (генерация README, документации…
Продолжая поднятую тему: сегодня выпустили на Хабре развернутый пост про OSA - https://habr.com/ru/companies/spbifmo/articles/906018/
В нём подробнее описали сам инструмент, примеры его применения, а также собрали первые отзывы попробовавших его коллег. В частности, OSA попробовали сотрудники лаборатории КТ ИТМО, ФКН ВШЭ и бразильского Universidade Federal de Juiz de Fora.
На репозитории уже несколько десятков звезд, но от дополнительных не откажемся)
В нём подробнее описали сам инструмент, примеры его применения, а также собрали первые отзывы попробовавших его коллег. В частности, OSA попробовали сотрудники лаборатории КТ ИТМО, ФКН ВШЭ и бразильского Universidade Federal de Juiz de Fora.
На репозитории уже несколько десятков звезд, но от дополнительных не откажемся)
Хабр
OSA: ИИ-помощник для разработчиков научного open source кода
Привет, Хабр! Меня зовут Андрей Гетманов, я работаю ML-инженером в Исследовательском центре «Сильный ИИ в промышленности» в ИТМО, а кроме того выступаю энтузиастом open source. В этой статье хочу...
👍11🔥2❤1
Forwarded from Научный опенсорс (Irina Deeva)
Всем привет! 👋
Мы — команда probAI, и рады представить applybn — нашу новую библиотеку для прикладного анализа данных на базе байесовских сетей (БС) и каузальных моделей. Разработано в рамках гранта «КодИИ».
Однажды мы собрались и поняли, что существует множество классных алгоритмов на основе байесовских сетей и каузальных моделей, которые умеют детектировать выбросы, отбирать и генерировать признаки, объяснять влияние частей модели на результат и многое другое. Так почему бы не собрать лучших из них в одну удобную библиотеку? Так и появился applybn.
Что умеет applybn?
1. Обнаружение аномалий
✔️ Табличные данные: сочетание байесовских сетей и методов близости для поиска плотностных аномалий и аномалий зависимостей
✔️ Временные ряды: динамические БС, автоматически учитывающие временные и межпеременные зависимости
2. Генерация синтетических данных и балансировка выборок
✔️ Автоматическое выравнивание несбалансированных выборок при помощи гибридных БС и гауссовских смесей с учётом взаимодействий признаков
3. Отбор и генерация признаков
✔️ Каузальный отбор: ищет только те фичи, которые имеют ненулевой причинный эффект (без ручных порогов)
✔️ MI‑отбор: находит марковские окружения по нормализованной взаимной информации
✔️ Генерация фичей на основе БС: дополняет данные вероятностными параметрами условных зависимостей для повышения качества моделей
4. Объяснимый анализ
✔️ Каузальный анализ компонентов моделей: строит структурную каузальную модель, чтобы оценить и убрать неважные компоненты модели (например, фильтры CNN)
✔️ ACE‑анализ признаков в данных: рассчитывает средний эффект влияния признаков на уверенность модели для интерпретации и отладки
⚙️ Все модули библиотеки совместимы с экосистемой scikit-learn, так что её легко интегрировать в существующие пайплайны анализа данных.
Заглядывайте в репозиторий applybn, ставьте звёздочки ⭐️ и делитесь впечатлениями!
Мы — команда probAI, и рады представить applybn — нашу новую библиотеку для прикладного анализа данных на базе байесовских сетей (БС) и каузальных моделей. Разработано в рамках гранта «КодИИ».
Однажды мы собрались и поняли, что существует множество классных алгоритмов на основе байесовских сетей и каузальных моделей, которые умеют детектировать выбросы, отбирать и генерировать признаки, объяснять влияние частей модели на результат и многое другое. Так почему бы не собрать лучших из них в одну удобную библиотеку? Так и появился applybn.
Что умеет applybn?
1. Обнаружение аномалий
2. Генерация синтетических данных и балансировка выборок
3. Отбор и генерация признаков
4. Объяснимый анализ
Заглядывайте в репозиторий applybn, ставьте звёздочки ⭐️ и делитесь впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - Anaxagor/applybn: Multi-purpose data analysis framework based on Bayesian networks and Causal models
Multi-purpose data analysis framework based on Bayesian networks and Causal models - Anaxagor/applybn
🔥11👍5❤3
В канале факультета - мини-интервью нашего выпускника и ex-стажера NSS Lab.
Кстати, наш текущий набор на стажерские позиции ещё открыт - темы есть и про DL для геоданных, и про AI4Science, и про LLM-агентов.
Кстати, наш текущий набор на стажерские позиции ещё открыт - темы есть и про DL для геоданных, и про AI4Science, и про LLM-агентов.
🔥3
Forwarded from ФТИИ ИТМО
Мы поговорили с Ильёй Дриго — выпускником магистратуры «Большие данные и машинное обучение» 2020 года. Сейчас Илья работает Senior Research Meteorologist в «Яндекс Погоде»
Почему выбрал эту программу?
После бакалавриата‑океанологии в МГУ Илья понял: для работы с океанологическими данными не хватает технических знаний. Магистратура дала фундамент по машинному обучению и статистике и позволила работать на стыке CS и наук о Земле — как раз то, что нужно в weather/climate tech.
Как удавалось совмещать учебу и работу?
Днём — лаборатория и диплом, вечером — проекты Windy.App. Пришлось жонглировать задачами, но знания с семинаров сразу применялись на работе. Перед защитой Илья взял отпуск и спокойно довёл диплом до ума
Как изменилась карьера?
После выпуска Илья перешёл в Windy.App на фул‑тайм, а позже перешёл в «Яндекс Погоду». Ежедневно работает с терабайтами данных, ML‑моделями и численными прогнозами — всё, чему учился в ИТМО.
Что запомнилось из учёбы?
• Максимальная практичность полученных знаний. Писали параллельный код, который ускорял задачи в десятки раз.
• Разворачивали собственный вычислительный кластер.
• Изучали статистику не «на пальцах», а на реальных моделях.
• И, конечно же, переезд в Санкт‑Петербург.
🎁 Бонус‑история
В Windy.App Илью позвали настроить приливную модель для яхтсменов. Общие интересы и увлечение парусным спортом сделали своё дело — и он остался в команде. В компании даже дают отгулы «когда дует» 🌬️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5