AI LAB | Лаборатория ИИ

#unrealneural

Выравнивание изображения и текста — сложная задача, особенно по мере того, как мультимодальные данные становятся более подробными. Большинство методов полагаются на человеческие метки или обратную связь.

CycleReward: новая метрика выравнивания, ориентированная на подробные подписи, обучаемая без человеческого контроля.
CyclePrefDB: 866 тыс. пар предпочтений из согласованности цикла.
https://arxiv.org/abs/2506.02095

311 viewsАртур Ишмаев, edited 05:35

#unrealneural
Метод RL постобучения для САПР, но специально для генерации ограничений эскиза (которая, предположительно, может использоваться вместе с генерацией). Основа Virtuvion (не LLM transformer), - вознаграждение через проверку ограничений.

https://arxiv.org/abs/2504.13178

330 viewsArtur, 05:48

#unrealneural
Cadrille

Модель комбинирует мультимодальную LLM (на вход может принимать картинки или облака точек или всё сразу) и несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволяет выбить SoTA на самых известных бенчмарках по синтезу CAD моделей.
https://paperswithcode.com/sota/cad-reconstruction-on-deepcad

https://arxiv.org/abs/2505.22914

470 viewsАртур Ишмаев, 07:22

#unrealneural
15 правил вайб-кодинга 🙃

1. Начни с шаблона: Начни свой проект, клонировав шаблон с GitHub или другого источника, чтобы получить надёжную основу. (В Cursor выбери "Start from Repo" и вставь эту ссылку для запуска nextjs-приложения с предустановленным ИИ, базой данных и авторизацией:
https://github.com/ansh/template-2 )
2. Используй агент-режим: Работай в агент-режиме Cursor (не в обычном), чтобы создавать, редактировать и управлять файлами через команды на естественном языке.
3. Используй Perplexity: Ищи новые дизайны и API в интернете через Perplexity. Например: если ты создаёшь проект на nextjs и хочешь реализовать определённую фичу, попроси Perplexity дать инструкции и примеры кода.
4. Создавай новые чаты в Composer: Создавай отдельный чат в Composer для каждой задачи. Держи чаты короткими.
5. Запускай локально, тестируй часто: Используй встроенные серверы для локального запуска приложения и частого тестирования, чтобы сразу ловить ошибки.
6. Итерируй и дорабатывай: Прими быстрые итерации — не пытайся сразу сделать идеально, улучшай шаг за шагом.
7. Используй голосовой ввод: Применяй инструменты вроде Whispr Flow для быстрого ввода — и просто кайфуй.
8. Клонируй и используй разумно: Используй репозитории GitHub как шаблоны, чтобы ускорить разработку или вдохновиться, а потом адаптируй под свои нужды.
9. Копируй ошибки в агент Composer: Когда возникает ошибка — копируй сообщение из консоли в агент Composer. Иногда нужно вставить несколько раз. Лучше переобъясни, чем недообъясни.
10. Не забывай, что можно восстановить прошлые чаты в Composer: Сохраняй свою работу часто, чтобы в случае чего откатиться назад.
11. Храни секреты: Всегда сохраняй API-ключи и чувствительные данные в файлах окружения, а не жёстко в коде.
12. Коммить чаще: Загружай изменения в GitHub регулярно, чтобы не потерять прогресс. Cursor может сделать это за тебя — просто попроси агента.
13. Развёртывай пораньше: Используй платформы вроде Vercel для раннего деплоя — так ты узнаешь об ошибках заранее.
14. Веди записи удачных промптов; переиспользуй их: Документируй эффективные команды, чтобы в будущем легче было развивать проект и находить баги.
15. Наслаждайся процессом — просто вайб: Получай кайф от креативного пути вайб-кодинга, экспериментируй, учись и просто наслаждайся. Just vibe.

314 viewsАртур Ишмаев, edited 07:47

0:12

#unrealneural
LlamaBot: помощник по программированию

Агент ИИ на базе LangGraph, который создает веб-приложения через естественный чат. Включает генерацию кода в реальном времени с предварительным просмотром в реальном времени и специализированных агентов для различных задач разработки.
Opensource 🔥

https://github.com/KodyKendall/LlamaBot

305 viewsАртур Ишмаев, 07:59

2:40

#unrealneural
Не удержался и сделал нарезку работ студентов во время семинара студии STF.
Все они были смоделированы с использованием ИИ студентами с нулевыми знаниями в области программирования!

Все проекты:
-идея с помощью ИИ
-смоделировано с помощью ИИ
-спрограммировано с помощью ИИ
-анимировано с помощью ИИ

Будем учиться у коллег делать невероятные вещи👍👍👍

502 viewsАртур Ишмаев, edited 09:21

#unrealneural
Log-linear attention - новый тип внимания, предложенный
Massachusetts Institute of Technology (MIT)
Он использует небольшое, но растущее число слотов памяти, которое логарифмически увеличивается с длиной последовательности.

https://arxiv.org/abs/2506.04761
https://github.com/HanGuo97/log-linear-attention

319 viewsАртур Ишмаев, edited 06:08

#unrealneural
Сходил в гости к коллегам из института AIRI
Немного поучаствовал в их мозгоштурме 😃
С нетерпением жду совместных активностей наших команд 🔥

305 viewsАртур Ишмаев, 16:41

0:27

#unrealneural
Morphology-adaptive

Проект, в котором контроллеры движения адаптируются к разным формам. На видео один и тот же контроллер работает с разными телами с помощью механизма внимания.
https://github.com/juniorrojas/morphology-adaptive

287 viewsАртур Ишмаев, 06:01

0:29

#unrealneural
PartCrafter
Еще один инструмент 3D-генерации.
Из одного изображения он генерирует несколько структурированных, семантически значимых 3D-деталей — все за один проход.

https://arxiv.org/abs/2506.05573

261 viewsАртур Ишмаев, 19:56

0:27

#unrealneural
Kyvo

В качестве запроса отправляем трехмерные фигуры в json формате и он выдает их изображение.
Учитывая 3D модели и их расположение, Kyvo прогнозирует изображение методом авторегрессии.

https://glab-caltech.github.io/kyvo/

244 viewsАртур Ишмаев, edited 06:18

0:18

#unrealneural
Text-to-LoRA

Гиперсеть, которая генерирует адаптеры LLM для конкретных задач (LoRA) на основе текстового описания задачи.

Биологические системы быстро адаптируются к сенсорным изменениям, например, зрение подстраивается под освещение. Современные LLM, несмотря на широкие возможности, плохо адаптируются к специфическим задачам без больших данных и дорогой тонкой настройки. Text-to-LoRA (T2L) решает это, обучая «гиперсеть», которая по текстовому описанию задачи генерирует LoRA-адаптер. T2L эффективно кодирует сотни адаптеров, сохраняя их производительность, и обобщает на новые задачи. Этот метод позволяет нетехническим пользователям адаптировать модели простым языком, снижая вычислительные и технические барьеры.

https://github.com/SakanaAI/Text-to-Lora

227 viewsАртур Ишмаев, 04:47

#unrealneural #ЛабораторияИИ
Наша лаборатория ИИ работает и в праздничные дни ⚡️⚡️⚡️

Поздравляем всех с праздником

232 viewsАртур Ишмаев, 11:22

0:17

#unrealneural
V-JEPA 2

Новые модели для работы с изображениями и видео и их восприятия с открытым исходным кодом

- на основе ViT, разных размеров и разрешений
- поддержка в трансформаторах
- есть тест физического мышления

https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6

223 viewsАртур Ишмаев, edited 20:18

1:19

Media is too big

#unrealneural
Sparc3D — генерация 3D-фигур следующего поколения с ультра-разрешением

- Детализация сетки до разрешения 1536³
- Готовая к 3D-печати модель
https://lizhihao6.github.io/Sparc3D/

215 viewsАртур Ишмаев, 09:03