Forwarded from Data Secrets
Qwen снова радуют релизом. Но на этот раз это не модель, а новый RL-алгоритм для обучения LLM
Метод называется Group Sequence Policy Optimization (GSPO), и именно он лег в основу последних громких моделей компании: Qwen3 Instruct, Coder и Thinking. Статья вышла пару дней назад, но о ней уже говорят все. Значит, пока разбираться и нам.
Сегодня один из самых популярных RL-алгоритмов для LLM – это GRPO (by DeepSeek). Если вам он не знаком – почитайте разбор вот тут или загляните в наш коспект в раздел "Обучение с подкреплением". GRPO работает здорово и довольно стабильно, но на уровне токенов.
То есть в GRPO мы считаем награду для всей последовательности -> считаем важность каждого токена и применяем клиппинг также для каждого токена отдельно -> обновляем политику "на уровне токенов".
А в GSPO все то же самое происходит сразу для всей последовательности: считаем награду -> рассчитываем единый importance weight для всей последовательности и применяем клиппинг для всего ответа целиком с нормализацией по длине -> обновляем политику.
В чем преимущество такого подхода?
1. Не нужно устраивать танцы с бубном, когда работаешь с MoE. У GRPO из-за архитектурных особенностей MoE идет со скрипом, а тут все заводится из коробки.
2. Градиенты получаются менее шумными, потому что снижается дисперсия. Следовательно – еще более стабильное обучение. Следовательно – лучшие метрики при тех же ресурсах.
3. Инженерно реализуется гораздо проще.
Короче, выглядит очень привлекательно и, вероятно, станет следующим словом в RL для LLM (особенно в опенсорсе). Статью полностью читаем тут
Метод называется Group Sequence Policy Optimization (GSPO), и именно он лег в основу последних громких моделей компании: Qwen3 Instruct, Coder и Thinking. Статья вышла пару дней назад, но о ней уже говорят все. Значит, пока разбираться и нам.
Сегодня один из самых популярных RL-алгоритмов для LLM – это GRPO (by DeepSeek). Если вам он не знаком – почитайте разбор вот тут или загляните в наш коспект в раздел "Обучение с подкреплением". GRPO работает здорово и довольно стабильно, но на уровне токенов.
То есть в GRPO мы считаем награду для всей последовательности -> считаем важность каждого токена и применяем клиппинг также для каждого токена отдельно -> обновляем политику "на уровне токенов".
А в GSPO все то же самое происходит сразу для всей последовательности: считаем награду -> рассчитываем единый importance weight для всей последовательности и применяем клиппинг для всего ответа целиком с нормализацией по длине -> обновляем политику.
В чем преимущество такого подхода?
1. Не нужно устраивать танцы с бубном, когда работаешь с MoE. У GRPO из-за архитектурных особенностей MoE идет со скрипом, а тут все заводится из коробки.
2. Градиенты получаются менее шумными, потому что снижается дисперсия. Следовательно – еще более стабильное обучение. Следовательно – лучшие метрики при тех же ресурсах.
3. Инженерно реализуется гораздо проще.
Короче, выглядит очень привлекательно и, вероятно, станет следующим словом в RL для LLM (особенно в опенсорсе). Статью полностью читаем тут
👍4🔥3⚡1
Forwarded from Просто о BIM
#ИИ Классификация BIM-модели с помощью ИИ
https://vkvideo.ru/video-230401166_456239021
на видео продемонстрировал пример, как можно классифицировать модели в Revit с помощью классификатора КЭЦИМ,
с помощью скрипта на Python/Dynamo, n8n развернутом на своих серверах
и LLM от OpenAI с supabase которые пока облачные, но тоже можно заменить на корпоративные.
Пока сделал по выделению каждого элемента отдельно, чтобы проверять работу нейронки, но понятно, что можно и в цикл запустить и одним запросом все типы отправить, поправив чуть промпт.
Не сказал в видео про деньги. Примерно по 5 центов (4 рубля) каждый запрос выходит. Тоже важно для отработки рабочего процесса.
Серьезный вопрос про чанки и размер контекста, но это отдельно потом расскажу.
все материалы здесь: https://docs.sgnl.pro/s/f/e1a99bef-3ed6-4b2d-b89c-a6a1ea871e37
https://vkvideo.ru/video-230401166_456239021
на видео продемонстрировал пример, как можно классифицировать модели в Revit с помощью классификатора КЭЦИМ,
с помощью скрипта на Python/Dynamo, n8n развернутом на своих серверах
и LLM от OpenAI с supabase которые пока облачные, но тоже можно заменить на корпоративные.
Пока сделал по выделению каждого элемента отдельно, чтобы проверять работу нейронки, но понятно, что можно и в цикл запустить и одним запросом все типы отправить, поправив чуть промпт.
Не сказал в видео про деньги. Примерно по 5 центов (4 рубля) каждый запрос выходит. Тоже важно для отработки рабочего процесса.
Серьезный вопрос про чанки и размер контекста, но это отдельно потом расскажу.
все материалы здесь: https://docs.sgnl.pro/s/f/e1a99bef-3ed6-4b2d-b89c-a6a1ea871e37
VK Видео
Классификация BIM-модели с помощью ИИ по классификатору КЭЦИМ
Ссылка на материалы: https://docs.sgnl.pro/s/f/e1a99bef-3ed6-4b2d-b89c-a6a1ea871e37
⚡2🔥2❤1
Завтра мы начнём публиковать записи выступлений, а пока, делимся фотографиями!
#BIMПросвет #BIMПросветAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥6⚡4👍1🤔1
#unrealneural
Diffusion Models are Evolutionary Algorithms
Диффузионные модели раскрывают свою природу как эволюционные алгоритмы, показывая, что эволюция подобна процессу диффузии. Авторы демонстрируют, как эти модели воспроизводят отбор, мутацию и репродуктивную изоляцию, объединяя машинное обучение и биологию. Метод диффузионной эволюции использует итеративное шумоподавление для поиска оптимальных решений в сложных пространствах параметров. В отличие от традиционных подходов, он эффективно находит множество оптимальных решений, превосходя классические эволюционные алгоритмы. Вводя эволюцию в латентном пространстве с ускоренной выборкой, авторы сокращают вычислительные затраты для многомерных задач. Эта связь между диффузией и эволюцией открывает новые перспективы для обеих дисциплин, поднимая вопросы об открытых эволюционных процессах и новых моделях диффузии.
https://arxiv.org/abs/2410.02543
Diffusion Models are Evolutionary Algorithms
Диффузионные модели раскрывают свою природу как эволюционные алгоритмы, показывая, что эволюция подобна процессу диффузии. Авторы демонстрируют, как эти модели воспроизводят отбор, мутацию и репродуктивную изоляцию, объединяя машинное обучение и биологию. Метод диффузионной эволюции использует итеративное шумоподавление для поиска оптимальных решений в сложных пространствах параметров. В отличие от традиционных подходов, он эффективно находит множество оптимальных решений, превосходя классические эволюционные алгоритмы. Вводя эволюцию в латентном пространстве с ускоренной выборкой, авторы сокращают вычислительные затраты для многомерных задач. Эта связь между диффузией и эволюцией открывает новые перспективы для обеих дисциплин, поднимая вопросы об открытых эволюционных процессах и новых моделях диффузии.
https://arxiv.org/abs/2410.02543
🔥5⚡1👍1
Forwarded from Альянс Цифровых Лидеров в стройке
This media is not supported in your browser
VIEW IN TELEGRAM
CAD-Atlas — сервис, который предоставляет высококачественные CAD-файлы крупных городов мира для градостроительства
Среди доступных ресурсов: графические контуры зданий и улиц, векторные тени, 2D- и 3D-модели, топография, символы деревьев и даже настройки направления падающих теней.
Есть интеграция с AutoCAD, Revit, SketchUp, Rhino, ArchiCAD, Vectorworks, 3ds Max и Blender в форматах DWG, SKP, SAT, 3DM, OBJ, 3DS, MTL.
Попробовать можно здесь.
Среди доступных ресурсов: графические контуры зданий и улиц, векторные тени, 2D- и 3D-модели, топография, символы деревьев и даже настройки направления падающих теней.
Есть интеграция с AutoCAD, Revit, SketchUp, Rhino, ArchiCAD, Vectorworks, 3ds Max и Blender в форматах DWG, SKP, SAT, 3DM, OBJ, 3DS, MTL.
Попробовать можно здесь.
⚡5❤2❤🔥2👍2🔥1
Как ПИК экспериментирует с ИИ в архитектуре — инсайты от первого лица
На BIM Просвете 22 июля Артур Ишмаев рассказал, как работает лаборатория искусственного интеллекта в ПИК — и почему им дали полную свободу, отделив от стандартной разработки.
Это не просто про «мы внедрили ИИ». Это — про поиск нового языка проектирования, в котором черновики, ошибки и даже недостроенные проекты становятся ценными данными.
— Зачем ПИК создали отдельную ИИ-лабораторию и как она работает;
— Как open-source модели применяются к генерации массинга, планировок и BIM;
— Почему логи действий проектировщиков — это золото для обучения ассистентов;
— Где LLM оказываются эффективнее специализированных моделей;
— Как можно создавать собственные датасеты и зачем это нужно всей индустрии.
🤌🏼 Три сильные мысли от Артура:
«Цель цифровизации не в том, чтобы внедрять технологии — а в том, чтобы они становились естественным продолжением архитектуры.»
«Каждый проект, даже нереализованный, — это источник данных. Мы должны уметь фиксировать процесс, а не только результат.»
«LLM, даже без обучения, уже понимают, где север, сколько этажей, и как выглядит двор. Это фундамент для ассистентов нового поколения.»
- Смотрите видео до конца
- Ставьте сердце
- Пишите вопросы в комментариях
#BIMПросвет #BIMSupport #AI #AIBIM #ИИ #ИИТИМ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10⚡3❤3👍1🏆1
Media is too big
VIEW IN TELEGRAM
#эксперименты #AILAB #ЛабораторияИИ
Продолжаем изучать взаимодействие Revit и модели ИИ.
Тестируем самописный MCP для Revit в связке с LLM через API.
Основная модель - gemini 2.5 flash.
Продолжаем изучать взаимодействие Revit и модели ИИ.
Тестируем самописный MCP для Revit в связке с LLM через API.
Основная модель - gemini 2.5 flash.
❤5🔥3⚡2
Forwarded from Нейросеть
В грядущей GPT-5 отдельный упор будет сделан на геймдев
На бенчмарк-платформе LMArena заметили некую модель Zenith. Разрабы и все, кто приближен к ИИ, открыто говорят, что это кодовое название для GPT-5. Первые тесты взрывают мозг:
Гейм-девелоперы, мышка и клавиатура вам теперь нужны только для промптов.
На бенчмарк-платформе LMArena заметили некую модель Zenith. Разрабы и все, кто приближен к ИИ, открыто говорят, что это кодовое название для GPT-5. Первые тесты взрывают мозг:
LLM по ОДНОМУ (!) запросу способна сгенерить рабочий клон Minecraft или Doom с физикой, текстурами и звуками.
Гейм-девелоперы, мышка и клавиатура вам теперь нужны только для промптов.
❤4🔥4⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
PDT: преобразование облака точек с помощью моделей диффузии
В то время как модели авторегрессии широко применяются для прогнозирования структур, модели диффузии также могут раскрывать структуры высокого уровня путем преобразования облака точек.
https://shanemankiw.github.io/PDT/
PDT: преобразование облака точек с помощью моделей диффузии
В то время как модели авторегрессии широко применяются для прогнозирования структур, модели диффузии также могут раскрывать структуры высокого уровня путем преобразования облака точек.
https://shanemankiw.github.io/PDT/
👍4🔥2⚡1
Forwarded from Институт AIRI
AIRI на WAIC 2025 в Шанхае ⤵️
Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.
На конференции исследователи AIRI показали разработки: от медицинских AI-помощников до модели Vintix и проекта CADrille для 3D-восстановления промышленных деталей.
На фотографиях — атмосфера мероприятия в Китае💡
Иван Оселедец, Андрей Кузнецов, Пэни Ли, Константин Яковлев, Евгений Бурнаев и Семен Буденный выступили на сессии международной конференции AI Journey и приняли участие в форсайт-сессии AI Horizons на крупнейшей AI-конференции Восточной Азии — WAIC 2025. На ней российские и китайские эксперты обсудили, куда движутся генеративные модели, как искусственный интеллект меняет бизнес и какие вызовы ждут индустрию.
На конференции исследователи AIRI показали разработки: от медицинских AI-помощников до модели Vintix и проекта CADrille для 3D-восстановления промышленных деталей.
На фотографиях — атмосфера мероприятия в Китае
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4⚡2👍2😐1