Научный опенсорс
567 subscribers
46 photos
1 video
87 links
Канал сообщества ITMO OpenSource, посвященного созданию и использованию наукоёмких open-source проектов, в том числе в области AI/ML.

Чат: https://t.me/itmo_opensource

По всем вопросам - @nicl_nno
Download Telegram
По мотивам моего летнего выступления на SaintHighload++ 2024 коллеги из блога ИТМО сегодня выпустили пост с расширенной текстовой версией:

"Почему мы топим за открытый код в науке ― несколько слов о воспроизводимости результатов научных исследований",
https://habr.com/ru/companies/spbifmo/articles/867236.

Добавил в текст подробностей, также постарались учесть некоторые замечания из чата. Любые дополнения - приветствуются)
Минутка саморекламы: вчера неожиданно получил "звезду GitVerse" в номинации "за развитие opensource в науке".

Награждение состоялась в Москве на мероприятии GitVerse All Stars. Формат необычный - "звезды" в нескольких номинациях вручали управляющий директор СберТеха Анатолий Шипов и космонавт Денис Матвеев. Помимо награждений, рассказывали и о новых возможностях платформы.

Спасибо организаторам из gitverse.ru - призы это всегда приятно, плюс удалось увидеться вживую с несколькими активными участниками нашего чата)
Можно начать понедельник с лонгрида:

Дмитрий Кабанов опубликовал на Хабре пост "Этот год в open source", в котором собраны мнения экспертов о ключевых событиях, корпоративном прогрессе и развитии open source в России в 2024-м, а также ожиданиях на 2k25.

Я тоже немного поучаствовал - в части обсуждения перспектив опенсорса в науке и роли ИИ-инструментов в его развитии.

Обсудить публикацию и задать вопросы Дмитрию можно в комментариях поста на Хабре или прямо тут - он есть в нашем чате.
Вышел в паблик ещё один совместный проект Лаборатории ИИ Сбера и ИТМО - библиотека RIDE (новость, описание).

RIDE позволяет повысить производительность логистических расчётов произвольного масштаба от городского до регионального или масштаба целой страны за счет сокращения время на поиск кратчайшего пути на графе. В основе подхода лежит идея кластеризации графа. Благодаря ей RIDE существенно сокращает область поиска решения и заранее исключает неоптимальные варианты маршрутов. В итоге на больших графах результат достигается до 30 раз быстрее относительно базовых алгоритмов. Реализация сделана на Python.

Отзывы и звездочки как всегда приветствуются - https://github.com/sb-ai-lab/Ride.

Это не первый наш совместный проект - например, недавно в чате писали про библиотеку для федеративного обучения stalactite.
Коллеги из "Базальт СПО" и ИПС РАН анонсировали XX-ю конференцию "Свободное программное обеспечение в высшей школе" (OSEDUCONF-2025) - https://www.basealt.ru/20edu-conf.

Состоится 7-9 февраля 2025 года в Институте программных систем РАН в Переславле-Залесском Ярославской области.
Заявки на доклады - до 12 января.

Тематики заявлены такие:

"- Использование свободного ПО в учебном процессе: разработка, внедрение, преподавание.
- Научные проекты, связанные с разработкой и использованием свободного программного обеспечения.
- Внедрение СПО в инфраструктуру образовательной организации: проблемы и решения.
- Социальные и экономико-правовые особенности применения свободного программного обеспечения в высшей школе.
- Студенческие проекты разработки СПО.

"Доклады принимаются только по тематике свободного ПО. Доклады о бизнесе, рекламные и о проприетарном ПО запрещены. Если тема доклада связана с разработкой ПО, заявка должна содержать ссылку на сам код, опубликованный в любом общедоступном репозитории под любой свободной лицензией."

Наш опыт с этой конференцией вполне позитивный: мероприятие интересное и содержательное, позволяет пересечься с довольно разнообразным срезом опенсорсных движений, существующих в России. От нас в прошлом году был доклад Андрея Гетманова про опенсорс-сообщество ИТМО. Нетворкинг тоже оказался довольно полезен - например, узнали о опенсорс-сообществе коллег из ФКН ВШЭ. Плюс необычная локация, конечно)
Узнал тут о интересном международном сообществе https://www.pyopensci.org. Его фокус - поддержка открытых инструментов для обработки научных данных, реализованных на Python.
Базируются, судя по всему, в Сан-Франциско.

- Самое интересное: предлагается опция peer-review опенсорсных проектов. При этом ревью потом зачитывается в открытом Journal of Open Source Software.
Cами ревью делаются на гитхабе, их можно посмотреть.

- Также есть довольно обширные руководства по тому как создавать научные пакеты.

- Организуют виртуальные мероприятия в духе "фестивалей открытой науки".

- В блоге тоже всякое интересное пишут. Например, размышляют про свою финансовую модель.

В общем, выглядит очень достойно и полезно. Если кто-то попробует туда что-то закинуть на ревью или как-то ещё поучаствует - поделитесь потом своим опытом.
В качестве подведения итогов года от нашего сообщества ITMO.OpenSource:

- Провели пять митапов, онлайновых и очных;
- Сделали два масштабных исследования опенсорс-ландшафта;
- Реализовали несколько успешных коллабов;
- Улучшили свои существующие научные опенсорс-проекты и выкатили пару новых;
- Стартовали разработку инструмента для поддержки опенсорс-разработки на основе LLM-агентов.

В следующем году обязательно будем продолжать наши активности, в том числе митапные. Так что если есть про что рассказать - можете уже оставлять заявки)

Всех с наступающим 2к25!
Добавили в наш репозиторий open-source-ops две новых туториала от Юрия Каминского:

- Про настройку авто-форматирования кода с помощью Black через Github Actions - ссылка;
- Про создания документации с помощью MkDocs, с примером из нашего проекта applyBN - ссылка;

Всё основано на нашем опыте, т.к. сами активно используем эти инструменты. Надеемся, будем полезно.

Ну и если с самим репозиторием ещё не знакомы - загляните, там много руководств, шаблонов и подборок. Issue и PR-ы с улучшениями - как всегда, приветствуются.
Перекину анонс интересной конференции про математику в ИИ, в которой решили поучаствовать. Можно подаваться как в non-archival формате (только выступление), так и c публикацией Journal of Mathematical Sciences. В любом случае с отбором по итогам ревью.
Forwarded from NSS Lab News (Sasha Hvatov)
Всем привет.

В рамках взращивания своего, отечественного, решили поучаствовать в конференции MathAI 2025. Она пройдёт в конце марта (24.03-28.03) в Сириусе.

Конференция проводится первый раз, обещают проводить строгий отбор. Есть и минусы: пока что для большинства статей планируется non-archival формат, то есть, без публикаций.

Зачем тогда это нужно?

- Аспирантам - выступление на конференции всё ещё засчитывается в показатели.
- Всем, кто подаёт на А* - подача через openreview.net (к слову, говорят, что сейчас валидация профиля проходит около двух недель).
- Вообще всем - посмотреть, что делается в России по ИИ. Нетворкинг, получается.

Что нужно делать (всё как всегда):

- До 1 февраля подать абстракт сюда
- До 20 февраля статью
- Дальше ребуталы, метаревью

В любом случае, регайтесь на openreview.net, не помешает. =)
Коллеги из СберТеха сегодня опубликовали своё opensource-исследование. Тоже таким занимаемся, так что почитать было весьма интересно.

Исследование основано на анализе большого числа открытых профилей и репозиториев на github-е. Интересного много, от оценок активности в репозиториях до популярных инструментов СI/CD.

Про наш недавний материал тоже упоминают, с выводами - соглашаются)

Полная версия - тут, данные - в репо на gitverse.
В рамках рекомендаций "что почитать", которые мы периодически публикуем в канале:

Наши коллеги Олег Сиротюк @olegsir78 и Кирилл Колпаков @kirillkolpakov, которые уже несколько лет занимаются исследованием китайской open-source экосистемы, запустили tg-канал Китай.AI.
В нем они планируют публиковать и разбирать статьи из первоисточников про достижения Китая в ИИ, в том числе и связанными с опенсорсом.

Начинание полезное - так что приглашаем подписаться всех, кому интересна тематика.
Интересное мероприятие от коллег из AI Talent Hub ИТМО:
Forwarded from Al Talent Hub
🔸 Open Talks Special: Лидеры русскоязычного open source LLM в одном эфире.

5 февраля в 19:00 собираем ключевых независимых разработчиков опенсорсных русскоязычных LLM и говорим о том, что волнует AI-сообщество прямо сейчас:

➡️ Как создаются русскоязычные LLM и с какими вызовами сталкиваются их разработчики?

➡️Что ждет опенсорсные AI-решения в будущем?

➡️ Как DeepSeek меняет правила игры?

Спикеры:

🎤 Михаил Тихомиров – научный сотрудник НИВЦ МГУ, занимается адаптацией мультиязычных LLM, создатель Ruadapt➡️Топовая модель показывает 92 балла на балла на Ru Arena General

🎤 Илья Гусев – автор Сайги ➡️одной из самых скачиваемых русскоязычных моделей на HF, а также role-play бенчмарка PingPong

🎤 Александр Николич – один из авторов Rudalle и Kandinsky, создатель Vikhr models ➡️ одни из лучших моделей на русском языке до 20B параметров, один из самых популярных бенчмарков

🔸 Проведет эфир Павел Подкорытов, сооснователь AI Talent Hub и CEO Napoleon IT.

🤔 Не увидел важного вопроса в анонсе?

➡️ Регистрируйся и задай свой вопрос экспертам!

Приходи! Без тебя – не то 💘

#OpenTalks
#AITalentHub #ITMO #NapoleonIT
Please open Telegram to view this post
VIEW IN TELEGRAM
Scientific Open Source Meetup - сезон 2025 открыт!

Дорогие друзья и единомышленники!

С радостью приглашаем вас на первый в этом году традиционный Scientific Open Source Meetup от нашего сообщества ITMO Opensource, который пройдет 26 февраля 2025 года с 19:00 до 22:00 в Санкт-Петербурге в уютном лофте на Газовой, 10ж. Это отличная возможность встретиться, обсудить актуальные темы и поделиться опытом в мире открытого программного обеспечения!

Что вас ждет на митапе?

• Доклады от экспертов по разработке open source, open hardware и другим насущным вопросам.

• Погружение в экосистему ИИ-опенсорса из Китая

• Представление новых open-source инструментов;
• Обмен опытом по использованию опенсорс-подходов в различных областях (например хакатонах)
• Живое общение с коллегами и единомышленниками;
• Возможность задать вопросы и обсудить последние тренды в Open Source
• Дискуссия о развитии научного опенсорса в России с участие экспертов из индустрии

Не упустите шанс стать частью этого увлекательного события! Присоединяйтесь к нам, чтобы обсудить интересные доклады в дружеской атмосфере.

Мероприятие проходит при поддержке:

- GitVerse
Среди разработок GitVerse — не только платформа с возможностью размещать, зеркалировать и импортировать репозитории, запускать CI/CD, но и инструмент для обучения ИТ-специалистов, SmartClass.
Разработчики могут использовать встроенную среду разработки GigaIDE, в том числе в облачном варианте, а также AI-ассистент GigaCode, чтобы избавиться от рутинных задач!

- OpenScaler
OpenScaler — сообщество разработчиков ОС с открытым исходным кодом. Они уже несколько лет исследуют китайскую open-source экосистему, а также недавно запустили канал Китай.AI, где публикуют и разбирают статьи из первоисточников про достижения Китая в ИИ. На этот раз коллеги расскажут о том, как в Китае развивается национальная экосистема ИИ и почему ОС — один из ключевых кейсов в этой сфере.

Дата: 26 февраля 2025 года
Время: 19:00 - 22:00
Место: Лофт на Газовой, 10ж

Участие бесплатное, но количество очных мест ограничено! Для тех кто не сможет очно - выложим ссылку на трансляцию.

Ссылка на регистрацию

Ждем вас на митапе!

#OpenSource #GitVerse #Митап #Наука #Технологии