AI LAB | Лаборатория ИИ
1.23K subscribers
395 photos
317 videos
22 files
697 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

Interesting materials and experiments with use machine learning and not only.

На связи 24/7
@unrealartur
Download Telegram
#unrealneural

Anthropic выпустил бесплатные курсы по ИИ:

- Промпт инжиниринг
- Разработка агентов
- Лучшие практики агентного кодирования
- и другое

https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

https://www.anthropic.com/engineering/building-effective-agents
#unrealneural
ReSpace

Генеративная система, позволяющая создавать и редактировать 3D-интерьеры на основе текстовых описаний. В отличие от предыдущих подходов, ReSpace поддерживает как генерацию, так и редактирование сцен, включая добавление и удаление объектов, с учетом предпочтений пользователя и геометрии пространства.
https://arxiv.org/abs/2506.02459
#unrealneural

Выравнивание изображения и текста — сложная задача, особенно по мере того, как мультимодальные данные становятся более подробными. Большинство методов полагаются на человеческие метки или обратную связь.

CycleReward: новая метрика выравнивания, ориентированная на подробные подписи, обучаемая без человеческого контроля.
CyclePrefDB: 866 тыс. пар предпочтений из согласованности цикла.
https://arxiv.org/abs/2506.02095
#unrealneural
Метод RL постобучения для САПР, но специально для генерации ограничений эскиза (которая, предположительно, может использоваться вместе с генерацией). Основа Virtuvion (не LLM transformer), - вознаграждение через проверку ограничений.

https://arxiv.org/abs/2504.13178
#unrealneural
Cadrille

Модель комбинирует мультимодальную LLM (на вход может принимать картинки или облака точек или всё сразу) и несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволяет выбить SoTA на самых известных бенчмарках по синтезу CAD моделей.
https://paperswithcode.com/sota/cad-reconstruction-on-deepcad

https://arxiv.org/abs/2505.22914
#unrealneural
15 правил вайб-кодинга 🙃

1. Начни с шаблона: Начни свой проект, клонировав шаблон с GitHub или другого источника, чтобы получить надёжную основу. (В Cursor выбери "Start from Repo" и вставь эту ссылку для запуска nextjs-приложения с предустановленным ИИ, базой данных и авторизацией:
https://github.com/ansh/template-2)
2. Используй агент-режим: Работай в агент-режиме Cursor (не в обычном), чтобы создавать, редактировать и управлять файлами через команды на естественном языке.
3. Используй Perplexity: Ищи новые дизайны и API в интернете через Perplexity. Например: если ты создаёшь проект на nextjs и хочешь реализовать определённую фичу, попроси Perplexity дать инструкции и примеры кода.
4. Создавай новые чаты в Composer: Создавай отдельный чат в Composer для каждой задачи. Держи чаты короткими.
5. Запускай локально, тестируй часто: Используй встроенные серверы для локального запуска приложения и частого тестирования, чтобы сразу ловить ошибки.
6. Итерируй и дорабатывай: Прими быстрые итерации — не пытайся сразу сделать идеально, улучшай шаг за шагом.
7. Используй голосовой ввод: Применяй инструменты вроде Whispr Flow для быстрого ввода — и просто кайфуй.
8. Клонируй и используй разумно: Используй репозитории GitHub как шаблоны, чтобы ускорить разработку или вдохновиться, а потом адаптируй под свои нужды.
9. Копируй ошибки в агент Composer: Когда возникает ошибка — копируй сообщение из консоли в агент Composer. Иногда нужно вставить несколько раз. Лучше переобъясни, чем недообъясни.
10. Не забывай, что можно восстановить прошлые чаты в Composer: Сохраняй свою работу часто, чтобы в случае чего откатиться назад.
11. Храни секреты: Всегда сохраняй API-ключи и чувствительные данные в файлах окружения, а не жёстко в коде.
12. Коммить чаще: Загружай изменения в GitHub регулярно, чтобы не потерять прогресс. Cursor может сделать это за тебя — просто попроси агента.
13. Развёртывай пораньше: Используй платформы вроде Vercel для раннего деплоя — так ты узнаешь об ошибках заранее.
14. Веди записи удачных промптов; переиспользуй их: Документируй эффективные команды, чтобы в будущем легче было развивать проект и находить баги.
15. Наслаждайся процессом — просто вайб: Получай кайф от креативного пути вайб-кодинга, экспериментируй, учись и просто наслаждайся. Just vibe.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
LlamaBot: помощник по программированию

Агент ИИ на базе LangGraph, который создает веб-приложения через естественный чат. Включает генерацию кода в реальном времени с предварительным просмотром в реальном времени и специализированных агентов для различных задач разработки.
Opensource 🔥

https://github.com/KodyKendall/LlamaBot
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Не удержался и сделал нарезку работ студентов во время семинара студии STF.
Все они были смоделированы с использованием ИИ студентами с нулевыми знаниями в области программирования!

Все проекты:
-идея с помощью ИИ
-смоделировано с помощью ИИ
-спрограммировано с помощью ИИ
-анимировано с помощью ИИ

Будем учиться у коллег делать невероятные вещи👍👍👍
#unrealneural
Log-linear attention - новый тип внимания, предложенный
Massachusetts Institute of Technology (MIT)
Он использует небольшое, но растущее число слотов памяти, которое логарифмически увеличивается с длиной последовательности.

https://arxiv.org/abs/2506.04761
https://github.com/HanGuo97/log-linear-attention
#unrealneural
Сходил в гости к коллегам из института AIRI
Немного поучаствовал в их мозгоштурме 😃
С нетерпением жду совместных активностей наших команд 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Morphology-adaptive

Проект, в котором контроллеры движения адаптируются к разным формам. На видео один и тот же контроллер работает с разными телами с помощью механизма внимания.
https://github.com/juniorrojas/morphology-adaptive
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
PartCrafter
Еще один инструмент 3D-генерации.
Из одного изображения он генерирует несколько структурированных, семантически значимых 3D-деталей — все за один проход.

https://arxiv.org/abs/2506.05573
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Kyvo

В качестве запроса отправляем трехмерные фигуры в json формате и он выдает их изображение.
Учитывая 3D модели и их расположение, Kyvo прогнозирует изображение методом авторегрессии.

https://glab-caltech.github.io/kyvo/
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Text-to-LoRA

Гиперсеть, которая генерирует адаптеры LLM для конкретных задач (LoRA) на основе текстового описания задачи.

Биологические системы быстро адаптируются к сенсорным изменениям, например, зрение подстраивается под освещение. Современные LLM, несмотря на широкие возможности, плохо адаптируются к специфическим задачам без больших данных и дорогой тонкой настройки. Text-to-LoRA (T2L) решает это, обучая «гиперсеть», которая по текстовому описанию задачи генерирует LoRA-адаптер. T2L эффективно кодирует сотни адаптеров, сохраняя их производительность, и обобщает на новые задачи. Этот метод позволяет нетехническим пользователям адаптировать модели простым языком, снижая вычислительные и технические барьеры.

https://github.com/SakanaAI/Text-to-Lora
#unrealneural #ЛабораторияИИ
Наша лаборатория ИИ работает и в праздничные дни ⚡️⚡️⚡️

Поздравляем всех с праздником
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
V-JEPA 2

Новые модели для работы с изображениями и видео и их восприятия с открытым исходным кодом

- на основе ViT, разных размеров и разрешений
- поддержка в трансформаторах
- есть тест физического мышления

https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6
Media is too big
VIEW IN TELEGRAM
#unrealneural
Sparc3D — генерация 3D-фигур следующего поколения с ультра-разрешением

- Детализация сетки до разрешения 1536³
- Готовая к 3D-печати модель
https://lizhihao6.github.io/Sparc3D/
#unrealneural
GeoCAD: Local Geometry-Controllable CAD Generation

Модель для создания и изменения CAD-моделей. Она позволяет точно редактировать отдельные части 3D-моделей, следуя текстовым описаниям. Использует машинное обучение для генерации качественных моделей с акцентом на управление локальными деталями, что полезно для дизайна и проектирования.
https://arxiv.org/abs/2506.10337