#unrealneural
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning
Проблема: Традиционные подходы глубокого обучения в САПР, использующие стандартные конвейеры 3D-реконструкции, часто приводят к неточным измерениям и ограниченной параметрической редактируемости, а методы тонкой настройки визуальных языковых моделей (VLM) склонны к запоминанию шаблонов, что снижает их производительность при решении сложных задач вне распределения данных. Предложенная парадигма CReFT-CAD, сочетающая обучение с подкреплением на основе учебной программы и контролируемую постнастройку, устраняет эти недостатки, повышая точность рассуждений, обобщаемость и семантическое извлечение, а новый бенчмарк TriView2CAD предоставляет масштабную платформу для тестирования и совершенствования ортогональных проекционных рассуждений в САПР.
https://arxiv.org/abs/2506.00568
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning
Проблема: Традиционные подходы глубокого обучения в САПР, использующие стандартные конвейеры 3D-реконструкции, часто приводят к неточным измерениям и ограниченной параметрической редактируемости, а методы тонкой настройки визуальных языковых моделей (VLM) склонны к запоминанию шаблонов, что снижает их производительность при решении сложных задач вне распределения данных. Предложенная парадигма CReFT-CAD, сочетающая обучение с подкреплением на основе учебной программы и контролируемую постнастройку, устраняет эти недостатки, повышая точность рассуждений, обобщаемость и семантическое извлечение, а новый бенчмарк TriView2CAD предоставляет масштабную платформу для тестирования и совершенствования ортогональных проекционных рассуждений в САПР.
https://arxiv.org/abs/2506.00568
👍5❤3⚡3
Forwarded from Complete AI
Вы когда-нибудь мечтали стать лучшей версией себя? А LoRA уже стала!
Рад представить вам нашу новую работу T-LoRA: Single Image Diffusion Model Customization Without Overfitting✔️
Представьте, что вы хотите дообучить модель генерировать новый объект, например, кошку или чайник. Но у вас ВСЕГО ОДНА КАРТИНКА этого объекта. Вы обучаете LoRA. И что выходит? Полный провал. Модель переобучается: объект генерируется только в той позе, в которой он был на тренировочной картинке, а фон выглядит скудно и плохо соответствует тексту.
В ходе нашей работы мы выяснили, что переобучение чаще всего происходит на самых шумных таймстепах. Именно они приводят к тому, что модель переобучается на фон и позу объекта. Мы предложили решение: ограничить ранг на шумных таймстепах, чтобы избежать переобучения, и дать больший ранг на средних и поздних таймстепах для точного запоминания объекта. На поздних таймстепах можно использовать высокие ранги без риска переобучения.
Эту идею мы реализовали с помощью маскирования столбцов LoRA, ограничивая тренировочный сигнал на шумных таймстепах. Более того, чтобы маскирование было эффективным, разработали ортогональную версию LoRA, которая сохраняет столбцы ортогональными на протяжении всего обучения.
Теперь ваша кошка может не только стоять, но и сидеть, и кататься на велосипеде, бегать, принимать любые позы, которые вы захотите. А фоны стали яркими, насыщенными и разнообразными.
Поддержите нашу работу работу Upvote на HuggingFace. Это поможет как можно большему числу людей узнать, что делать в подобных тяжелых жизненных ситуациях с котиками🙂
🔜 Arxiv
🔜 GitHub
🔜 HuggingFace
Рад представить вам нашу новую работу T-LoRA: Single Image Diffusion Model Customization Without Overfitting
Представьте, что вы хотите дообучить модель генерировать новый объект, например, кошку или чайник. Но у вас ВСЕГО ОДНА КАРТИНКА этого объекта. Вы обучаете LoRA. И что выходит? Полный провал. Модель переобучается: объект генерируется только в той позе, в которой он был на тренировочной картинке, а фон выглядит скудно и плохо соответствует тексту.
В ходе нашей работы мы выяснили, что переобучение чаще всего происходит на самых шумных таймстепах. Именно они приводят к тому, что модель переобучается на фон и позу объекта. Мы предложили решение: ограничить ранг на шумных таймстепах, чтобы избежать переобучения, и дать больший ранг на средних и поздних таймстепах для точного запоминания объекта. На поздних таймстепах можно использовать высокие ранги без риска переобучения.
Эту идею мы реализовали с помощью маскирования столбцов LoRA, ограничивая тренировочный сигнал на шумных таймстепах. Более того, чтобы маскирование было эффективным, разработали ортогональную версию LoRA, которая сохраняет столбцы ортогональными на протяжении всего обучения.
Теперь ваша кошка может не только стоять, но и сидеть, и кататься на велосипеде, бегать, принимать любые позы, которые вы захотите. А фоны стали яркими, насыщенными и разнообразными.
Поддержите нашу работу работу Upvote на HuggingFace. Это поможет как можно большему числу людей узнать, что делать в подобных тяжелых жизненных ситуациях с котиками
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7⚡3👍3
Тема: ИИ в девелопменте
Спикеры:
- ПИК - Артур Ишмаев
- Нанософт - Максим Журавлев
- Клуб BIM-лидеров - Мария Бедовая
- Signal - Александр Попов
- Свободное место #5
- Свободное место #6
Регистрация: количество мест ограничено, так что сейчас мы начинаем сбор заявок на участие
Идеи и предложения:
@purtovsy @Andrey_Ryb
#BIMПросвет #BIMПросветAI #BIMSupport #AI #AIBIM #ИИ #ИИТИМ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥5❤4⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #пытаюсьпонять #вкопилкуэрудита
Может ли модель ИИ делать идеальные прогнозы и при этом иметь неправильную модель мира?
Что бы это вообще значило?
Один из результатов говорит сам за себя: трансформер, обученный на 10 миллионах звездных систем, точно определяет планетарные орбиты. Но он нарушает законы гравитации😃😃🤷🏻♂️
Может ли модель ИИ делать идеальные прогнозы и при этом иметь неправильную модель мира?
Что бы это вообще значило?
Один из результатов говорит сам за себя: трансформер, обученный на 10 миллионах звездных систем, точно определяет планетарные орбиты. Но он нарушает законы гравитации😃😃🤷🏻♂️
😁7⚡3❤2
#unrealneural #пытаюсьпонять
Dynamic Chunking for End-to-End Hierarchical Sequence Modeling
Работа представляет H-Net — иерархическую нейронную сеть, которая устраняет необходимость в традиционной токенизации (например, BPE — Byte-Pair Encoding) за счёт динамического разделения входных данных на уровне байтов. H-Net обучается определять границы сегментов (chunks) в зависимости от содержания и контекста, что позволяет ей превосходить модели, основанные на фиксированной токенизации, в задачах обработки языков, кода и даже ДНК.
Однако для полного отказа от токенизации требуются дальнейшие исследования более глубоких иерархий и стабильности обучения.
https://www.alphaxiv.org/overview/2507.07955v1
Dynamic Chunking for End-to-End Hierarchical Sequence Modeling
Работа представляет H-Net — иерархическую нейронную сеть, которая устраняет необходимость в традиционной токенизации (например, BPE — Byte-Pair Encoding) за счёт динамического разделения входных данных на уровне байтов. H-Net обучается определять границы сегментов (chunks) в зависимости от содержания и контекста, что позволяет ей превосходить модели, основанные на фиксированной токенизации, в задачах обработки языков, кода и даже ДНК.
Однако для полного отказа от токенизации требуются дальнейшие исследования более глубоких иерархий и стабильности обучения.
https://www.alphaxiv.org/overview/2507.07955v1
👍6🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Diffusion Explorer позволяет изучать геометрические свойства генеративных моделей на основе диффузии и потока с помощью интерактивной анимации.
https://alechelbling.com/Diffusion-Explorer/
Diffusion Explorer позволяет изучать геометрические свойства генеративных моделей на основе диффузии и потока с помощью интерактивной анимации.
https://alechelbling.com/Diffusion-Explorer/
👍4🔥4⚡2
Forwarded from NN
Новый лидер среди опенсорс-моделей: вышла Kimi K2 с 1 трлн параметров. Она одинаково хорошо генерирует код, пишет текст и анализирует данные.
В коде и математике она показала себя даже лучше Claude 4 и GPT-4.1. Новая модель заняла первое место в бенчмарках AIME 2025, LiveCodeBench v6 и GPQA-Diamond.
Пробуем бесплатно по ссылке. Скоро обещают добавить функции ИИ-агента.
В коде и математике она показала себя даже лучше Claude 4 и GPT-4.1. Новая модель заняла первое место в бенчмарках AIME 2025, LiveCodeBench v6 и GPQA-Diamond.
Пробуем бесплатно по ссылке. Скоро обещают добавить функции ИИ-агента.
❤4👍3⚡2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
GenCAD - Превращение изображений в редактируемые 3D-модели
Команда MIT разработала GenCAD, новую систему на основе искусственного интеллекта, которая генерирует параметрические, редактируемые модели CAD непосредственно из изображений
https://github.com/ferdous-alam/GenCAD
GenCAD - Превращение изображений в редактируемые 3D-модели
Команда MIT разработала GenCAD, новую систему на основе искусственного интеллекта, которая генерирует параметрические, редактируемые модели CAD непосредственно из изображений
https://github.com/ferdous-alam/GenCAD
🔥7❤3⚡2
#unrealneural
Seek-CAD 🐳
Модель DeepSeek R1-32B для создания САПР _без_ тонкой настройки посредством контекстного обучения и самосовершенствования через VLM (Gemini 2. 0). Также набор данных с большим количеством операций, чем DeepCAD - фаска, вращение, скругления и т. д. (но, к сожалению, исходный код закрыт)
https://arxiv.org/abs/2505.17702
Seek-CAD 🐳
Модель DeepSeek R1-32B для создания САПР _без_ тонкой настройки посредством контекстного обучения и самосовершенствования через VLM (Gemini 2. 0). Также набор данных с большим количеством операций, чем DeepCAD - фаска, вращение, скругления и т. д. (но, к сожалению, исходный код закрыт)
https://arxiv.org/abs/2505.17702
👍4⚡3❤2
#unrealneural
Neural-Driven Image Editing - Редактирование изображений с помощью нейронных сетей
Эксперименты показывают, что LoongX достигает производительности, сравнимой с методами, основанными на тексте (CLIP-I: 0,6605 против 0,6558; DINO: 0,4812 против 0,4636), и превосходит их, когда нейронные сигналы сочетаются с речью (CLIP-T: 0,2588 против 0,2549)
https://huggingface.co/papers/2507.05397
Neural-Driven Image Editing - Редактирование изображений с помощью нейронных сетей
Эксперименты показывают, что LoongX достигает производительности, сравнимой с методами, основанными на тексте (CLIP-I: 0,6605 против 0,6558; DINO: 0,4812 против 0,4636), и превосходит их, когда нейронные сигналы сочетаются с речью (CLIP-T: 0,2588 против 0,2549)
https://huggingface.co/papers/2507.05397
👍5❤2⚡2
#unrealneural
В исследовании, опубликованном в журнале Nature Communications, исследователи из Университета Пенсильвании использовали систему искусственного интеллекта APEX для сканирования более 40 миллионов зашифрованных в ядах пептидов — белков, которые развивались в течение миллионов лет для нападения и защиты.
Всего за несколько часов APEX идентифицировал 386 пептидов с молекулярной сигнатурой антибиотиков следующего поколения.
Из них ученые синтезировали 58, и 53 из них уничтожили устойчивые к лекарствам бактерии, такие как кишечная палочка и золотистый стафилококк, не причиняя вреда клеткам человека.
«Платформа картировала более 2000 совершенно новых антибактериальных мотивов — коротких специфических последовательностей аминокислот в составе белка или пептида, отвечающих за их способность уничтожать или подавлять рост бактерий».
В исследовании, опубликованном в журнале Nature Communications, исследователи из Университета Пенсильвании использовали систему искусственного интеллекта APEX для сканирования более 40 миллионов зашифрованных в ядах пептидов — белков, которые развивались в течение миллионов лет для нападения и защиты.
Всего за несколько часов APEX идентифицировал 386 пептидов с молекулярной сигнатурой антибиотиков следующего поколения.
Из них ученые синтезировали 58, и 53 из них уничтожили устойчивые к лекарствам бактерии, такие как кишечная палочка и золотистый стафилококк, не причиняя вреда клеткам человека.
«Платформа картировала более 2000 совершенно новых антибактериальных мотивов — коротких специфических последовательностей аминокислот в составе белка или пептида, отвечающих за их способность уничтожать или подавлять рост бактерий».
🔥8❤3👏2🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Kimi K2 + Groq теперь доступен в anycoder для сверхбыстрого вайбкодинга
https://huggingface.co/spaces/akhaliq/anycoder
Kimi K2 + Groq теперь доступен в anycoder для сверхбыстрого вайбкодинга
https://huggingface.co/spaces/akhaliq/anycoder
👍4⚡2
Forwarded from ИИ и роботы в стройке
«Самая большая опасность заключается в том, что результаты работы ИИ ошибочно принимаются за истину или окончательное решение»
Тим Фу, основатель британского архитектурного бюро STF, активно применяющий ИИ в своих проектах и в курсах по параметрическому ИИ-проектированию, отвечает на вопрос о том, чем опасен ИИ в работе архитектора:
Критическое мышление, в принципе, и по жизни нужно сохранять.
Тим Фу, основатель британского архитектурного бюро STF, активно применяющий ИИ в своих проектах и в курсах по параметрическому ИИ-проектированию, отвечает на вопрос о том, чем опасен ИИ в работе архитектора:
«Это всего лишь предположение — подсказка, а не рецепт. Есть и этическая сторона вопроса: ИИ может воспроизводить предубеждения, непреднамеренно заниматься плагиатом или чрезмерно подчёркивать эстетику, которая популярна в интернете, но не имеет отношения к контексту. Нужно всегда сохранять критическое мышление».
Критическое мышление, в принципе, и по жизни нужно сохранять.
👍8❤3🔥3
Forwarded from МАТЕРИЯ
Сенсетивное исследование
Combined Multisensory Effects: A Systematic Review
#rest
#материя_знания
| | |
◻️ Materia.city
Больше деревьев — вывод, которым заканчивается большинство исследований стресса в городе. Природа восстанавливает — кто бы спорил. Но что делать в тех городах, где для деревьев просто нет места? Где зелёная инфраструктура — не база, а роскошь?
Группа из Шэньчжэня, авторы систематического обзора
How Public Urban Space Enhance Restoration Benefits Through Combined Multisensory Effects, проанализировала 30 исследований, чтобы понять, как разные типы восприятия — зрение, звук, запах, температура, тактильные ощущения — влияют на стресс, внимание и эмоции. Оказалось, что на снижение стресса могут работать и запахи, и тень, и звуки (вода, птицы, листва), и природные покрытия (земля, трава). Наблюдение интуитивно понятно, но ценно тем, что расширяет воображение о возможностях восстановления в мегаполисе.
🧑🏻🔬
How Public Urban Space Enhance Restoration Benefits ThroughCombined Multisensory Effects: A Systematic Review
;
→ Wen Dong, Donghui Dai, Pengyuan Shen, Rui Zhang, Mei Liu;
→ School of Architecture, Harbin Institute of Technology (Shenzhen) \ Shenzhen International Graduate School, Tsinghua University.
#rest
#материя_знания
| | |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥4⚡2😁1💩1