AI LAB | Лаборатория ИИ

Forwarded from Psy Eyes

This media is not supported in your browser

SkyWorks: выпустили Matrix-3D, генератор 3D миров, работающий на связке видеогенерации и 3D реконструкции. Это своеобразная ответочка Hunyuan World 1 от Tencent, проекту Odyssey, и анонсированному Genie 3 от гугла.

Пишешь промт или кидаешь картинку на вход, и получаешь на выбор видеопанораму или 3D сцену, по которой можно перемещаться. Вот только делать это похоже придётся через задание траектории. Тот же World 1 судя по демкам поддерживал геймпад.

Генерить можно в разрешениях 960 × 480 или 1440 × 720. На одной A800 с 40 ГБ VRAM рендер 720p замёт около часа... словно Far Cry телепортировался из прошлого, чтобы научить тебя китайскому.

Гитхаб
Хаггинг

⚡4❤3👍1

426 viewsАртур Ишмаев, 19:56

AI LAB | Лаборатория ИИ

#unrealneural
Bifrost-1

Объединение мультимодальных моделей LLM и моделей диффузии с латентными элементами CLIP на уровне патчей

https://huggingface.co/papers/2508.05954

❤2⚡1👍1

408 viewsАртур Ишмаев, 05:40

AI LAB | Лаборатория ИИ

#unrealneural
MolmoAct

Модели действий, которые могут рассуждать в пространстве.

Через восприятие, планирование и управление создаются точные действия, превосходя конкурентов в симуляциях и реальных задачах. Модель легко адаптируется к новым условиям и демонстрирует выдающиеся результаты в сложных операциях.

https://huggingface.co/papers/2508.07917

⚡2👍2🔥1

414 viewsАртур Ишмаев, 08:26

AI LAB | Лаборатория ИИ

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Метачка только что сделала ИИ, который знает, что будет делать ваш мозг еще до того, как вы нажмете кнопку воспроизведения видео, и для этого ему не нужно проводить ни одного сканирования мозга.

Они выпустили модель TRIBE, нейронную сеть с 1B параметров, которая предсказывает реакцию человеческого мозга на фильмы, анализируя видео, аудио и текст.

TRIBE анализирует видео, аудио и диалоги из фильмов, точно предсказывая, какие зоны мозга зрителя активизируются без какого-либо сканирования мозга.

После тренировки на испытуемых, просмотревших 80 часов телепередач и фильмов, искусственный интеллект правильно предсказал более половины моделей мозговой активности в 1000 областях мозга.

Лучше всего он работает в областях мозга, где сливаются зрение, звук и язык, превосходя на 30 % модели с одним чувством.

Система Meta также показала особую точность в лобных областях мозга, которые контролируют внимание, принятие решений и эмоциональную реакцию на контент.

В перспективе такая разработка предлагает новые формулы для максимизации внимания на нейронном уровне, что потенциально может сделать думскроллинг еще более аддиктивным.

Ещё раз, на входе видео. На выходе информация какие зоны мозга возбуждаются.
И да, мультимодальность воздействует сильнее.

https://github.com/facebookresearch/algonauts-2025

https://arxiv.org/abs/2507.22229

Контент, от которого нельзя оторваться. Писал об этом в фб лет 12 назад.

@cgevent

⚡2🤯2👍1

366 viewsАртур Ишмаев, 13:56

AI LAB | Лаборатория ИИ

#unrealneural #пытаюсьпонять
Registration beyond Points: General Affine Subspace Alignment via Geodesic Distance on Grassmann Manifold

Статья представляет новый метод для точного выравнивания объектов (прямых и плоскостей) в компьютерном зрении с использованием геодезического расстояния на многообразии Грассмана. Авторы разработали формулу, которая явно измеряет расстояние между подпространствами с учетом поворотов и смещений, используя базисы подпространств. Метод избегает неоднозначностей, находит глобально оптимальное решение и превосходит существующие подходы в задачах компьютерного зрения, улучшая сходимость и производительность.

Проще говоря, этот метод позволяет точно выравнивать объекты в компьютерном зрении, вычисляя оптимальное расстояние между подпространствами с учетом их поворотов и смещений, обеспечивая более эффективное решение по сравнению с предыдущими подходами.

* Многообразие Грассмана — это пространство всех ( k )-мерных линейных подпространств в ( n )-мерном векторном пространстве.

https://www.arxiv.org/abs/2507.17998

⚡2👍1😢1👌1

401 viewsАртур Ишмаев, 15:28

AI LAB | Лаборатория ИИ

Forwarded from Наука, Техника и нейровайб

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Photoshop получил апгрейд в виде встроенного ИИ-агента на базе Claude

Теперь нейросеть берет на себя всю рутинную работу: удаляет фон, двигает слои, корректирует цвета, добавляет объекты с учётом света и теней, переводит тексты и чинит верстку.

ИИ сам назовет и разложит слои, а ещё сможет с нуля сгенерировать картинку и довести ваш проект до идеала.

Все это можно установить бесплатно, репозиторий с установочными файлами здесь.

⚡4❤2👍1

431 viewsАртур Ишмаев, 21:29

AI LAB | Лаборатория ИИ

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
Matrix-Game 2.0

Интерактивная модель мира с открытым исходным кодом в реальном времени с большой продолжительностью действия.

На прошлой неделе Genie 3 от DeepMind выпустил интерактивные модели мира, работающие в режиме realtime.

Но они не были в открытом доступе.

25 кадров в секунду. Интерактивное взаимодействие длится несколько минут. Полностью открытый исходный код.

https://matrix-game-v2.github.io/
https://huggingface.co/Skywork/Matrix-Game-2.0

⚡2👍1

442 viewsАртур Ишмаев, edited 05:28

AI LAB | Лаборатория ИИ

Forwarded from Complete AI

21 августа пройдёт митап от MWS AI D >< Vision для CV-инженеров и исследователей, где AIRI выступает партнёром. Мероприятие в онлайн и оффлайн формате.

Вас ждут:
🔴Доклады о передовых и прикладных аспектах CV
🔴Живое общение и обмен опытом

На митапе будет выступать мой сотрудник Айбек Аланов, Руководитель команды Controllable Generative AI, FusionBrain Lab, с темой «Как эффективно контролировать генерацию диффузионных моделей?». Он рассмотрит ключевые подходы к повышению контролируемости, а также покажет результаты исследований AIRI в этом направлении.

Не забудьте пройти регистрацию!

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7⚡3

417 viewsАртур Ишмаев, 20:30

AI LAB | Лаборатория ИИ

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
VertexRegen
Вместо типичных неполных меш моделей, которые получаются при их генерации с помощью авторегрессии, VertexRegen генерирует всё более подробные сетки по мере увеличения длины генерируемой последовательности.

vertexregen.github.io

❤2⚡2👍2

433 viewsАртур Ишмаев, edited 04:58

AI LAB | Лаборатория ИИ

💡 Фотки с BIM Просвета!

Завтра мы начнём публиковать записи выступлений, а пока, делимся фотографиями!

✔️ Ставьте сердце
✔️ Отмечайте друзей
✔️ Комментируйте

Альбом:

https://vk.com/album-67403031_189904141

#BIMПросвет #BIMПросветAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7⚡5🔥4

436 viewsАртур Ишмаев, 10:36

AI LAB | Лаборатория ИИ

💻

#AIдайджест - Выпуск №1

- ChatGPT 5 - от восторга к разочарованию
- Локальные модели ChatGPT
- Генератор миров от Google
- Рынок ЦОДов на 4 трлн $
- AI от Яндекса
- Первый Offline BIM Просвет
- n8n - Dynamo в мире бизнес процессов
- Новая архитектура базы знаний для взаимодействия с ИИ по НДТ
- CAD-Atlas — дорогой аналог Cadmapper
- AI-агенты для Revit
- Новая OpenSource модель для генерации изображений от Krea
- Гайд “Какую работу BIM-менеджер может отдать ИИ”

https://bim-support.ru/ai-digest/no1

Please open Telegram to view this post

VIEW IN TELEGRAM

bim-support.ru

AI-дайджест. Выпуск №1

Ваш еженедельный обзор технологий будущего

🔥10👍3👏3🎉1🏆1

346 viewsАртур Ишмаев, 12:42

AI LAB | Лаборатория ИИ

#unrealneural
GLEAM: развитие 3D-картографирования

На ICCV 2025 представлена GLEAM — универсальная модель исследования для автономного картографирования сложных помещений.

GLEAM-Bench - Датасет из 1152 сцен для обучения и тестирования

https://github.com/zjwzcx/GLEAM

👍5⚡2🔥2

435 viewsАртур Ишмаев, edited 17:21

AI LAB | Лаборатория ИИ

#unrealneural #назадвбудущее
1910: Год, когда современный мир сошёл с ума

На рубеже XIX–XX веков Европа жила в состоянии «головокружения».
Технологии меняли мир быстрее, чем люди успевали к этому адаптироваться: электричество, автомобили, радио, кино, новые научные открытия.
Филипп Блом в книге «Годы головокружения: Европа 1900–1914» пишет, что именно эта эпоха впервые породила массовую тревожность:
1. страх, что технологии лишают нас человечности,
2. ощущение, что скорость перемен разрушает привычный мир,
3. поиск новых смыслов в искусстве и культуре.

Звучит знакомо? Сегодня мы живём в очень похожем моменте: ИИ, биотех, климатические вызовы, ускорение темпов жизни. И снова — тревога, растерянность, но одновременно — рождение нового искусства и новых форм мышления.

История показывает: периоды «нервного срыва» часто становятся источником величайших культурных прорывов.
https://www.derekthompson.org/p/1910-the-year-the-modern-world-lost

👍5⚡1🔥1

452 viewsАртур Ишмаев, 06:07

AI LAB | Лаборатория ИИ