#unrealneural
MolmoAct
Модели действий, которые могут рассуждать в пространстве.
Через восприятие, планирование и управление создаются точные действия, превосходя конкурентов в симуляциях и реальных задачах. Модель легко адаптируется к новым условиям и демонстрирует выдающиеся результаты в сложных операциях.
https://huggingface.co/papers/2508.07917
MolmoAct
Модели действий, которые могут рассуждать в пространстве.
Через восприятие, планирование и управление создаются точные действия, превосходя конкурентов в симуляциях и реальных задачах. Модель легко адаптируется к новым условиям и демонстрирует выдающиеся результаты в сложных операциях.
https://huggingface.co/papers/2508.07917
⚡2👍2🔥1
#unrealneural #пытаюсьпонять
Registration beyond Points: General Affine Subspace Alignment via Geodesic Distance on Grassmann Manifold
Статья представляет новый метод для точного выравнивания объектов (прямых и плоскостей) в компьютерном зрении с использованием геодезического расстояния на многообразии Грассмана. Авторы разработали формулу, которая явно измеряет расстояние между подпространствами с учетом поворотов и смещений, используя базисы подпространств. Метод избегает неоднозначностей, находит глобально оптимальное решение и превосходит существующие подходы в задачах компьютерного зрения, улучшая сходимость и производительность.
Проще говоря, этот метод позволяет точно выравнивать объекты в компьютерном зрении, вычисляя оптимальное расстояние между подпространствами с учетом их поворотов и смещений, обеспечивая более эффективное решение по сравнению с предыдущими подходами.
* Многообразие Грассмана — это пространство всех ( k )-мерных линейных подпространств в ( n )-мерном векторном пространстве.
https://www.arxiv.org/abs/2507.17998
Registration beyond Points: General Affine Subspace Alignment via Geodesic Distance on Grassmann Manifold
Статья представляет новый метод для точного выравнивания объектов (прямых и плоскостей) в компьютерном зрении с использованием геодезического расстояния на многообразии Грассмана. Авторы разработали формулу, которая явно измеряет расстояние между подпространствами с учетом поворотов и смещений, используя базисы подпространств. Метод избегает неоднозначностей, находит глобально оптимальное решение и превосходит существующие подходы в задачах компьютерного зрения, улучшая сходимость и производительность.
Проще говоря, этот метод позволяет точно выравнивать объекты в компьютерном зрении, вычисляя оптимальное расстояние между подпространствами с учетом их поворотов и смещений, обеспечивая более эффективное решение по сравнению с предыдущими подходами.
* Многообразие Грассмана — это пространство всех ( k )-мерных линейных подпространств в ( n )-мерном векторном пространстве.
https://www.arxiv.org/abs/2507.17998
⚡2👍1😢1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Matrix-Game 2.0
Интерактивная модель мира с открытым исходным кодом в реальном времени с большой продолжительностью действия.
На прошлой неделе Genie 3 от DeepMind выпустил интерактивные модели мира, работающие в режиме realtime.
Но они не были в открытом доступе.
25 кадров в секунду. Интерактивное взаимодействие длится несколько минут. Полностью открытый исходный код.
https://matrix-game-v2.github.io/
https://huggingface.co/Skywork/Matrix-Game-2.0
Matrix-Game 2.0
Интерактивная модель мира с открытым исходным кодом в реальном времени с большой продолжительностью действия.
На прошлой неделе Genie 3 от DeepMind выпустил интерактивные модели мира, работающие в режиме realtime.
Но они не были в открытом доступе.
25 кадров в секунду. Интерактивное взаимодействие длится несколько минут. Полностью открытый исходный код.
https://matrix-game-v2.github.io/
https://huggingface.co/Skywork/Matrix-Game-2.0
⚡2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
VertexRegen
Вместо типичных неполных меш моделей, которые получаются при их генерации с помощью авторегрессии, VertexRegen генерирует всё более подробные сетки по мере увеличения длины генерируемой последовательности.
vertexregen.github.io
VertexRegen
Вместо типичных неполных меш моделей, которые получаются при их генерации с помощью авторегрессии, VertexRegen генерирует всё более подробные сетки по мере увеличения длины генерируемой последовательности.
vertexregen.github.io
❤2⚡2👍2
#unrealneural
GLEAM: развитие 3D-картографирования
На ICCV 2025 представлена GLEAM — универсальная модель исследования для автономного картографирования сложных помещений.
GLEAM-Bench - Датасет из 1152 сцен для обучения и тестирования
https://github.com/zjwzcx/GLEAM
GLEAM: развитие 3D-картографирования
На ICCV 2025 представлена GLEAM — универсальная модель исследования для автономного картографирования сложных помещений.
GLEAM-Bench - Датасет из 1152 сцен для обучения и тестирования
https://github.com/zjwzcx/GLEAM
👍5⚡2🔥2
#unrealneural #назадвбудущее
1910: Год, когда современный мир сошёл с ума
На рубеже XIX–XX веков Европа жила в состоянии «головокружения».
Технологии меняли мир быстрее, чем люди успевали к этому адаптироваться: электричество, автомобили, радио, кино, новые научные открытия.
Филипп Блом в книге «Годы головокружения: Европа 1900–1914» пишет, что именно эта эпоха впервые породила массовую тревожность:
1. страх, что технологии лишают нас человечности,
2. ощущение, что скорость перемен разрушает привычный мир,
3. поиск новых смыслов в искусстве и культуре.
Звучит знакомо? Сегодня мы живём в очень похожем моменте: ИИ, биотех, климатические вызовы, ускорение темпов жизни. И снова — тревога, растерянность, но одновременно — рождение нового искусства и новых форм мышления.
История показывает: периоды «нервного срыва» часто становятся источником величайших культурных прорывов.
https://www.derekthompson.org/p/1910-the-year-the-modern-world-lost
1910: Год, когда современный мир сошёл с ума
На рубеже XIX–XX веков Европа жила в состоянии «головокружения».
Технологии меняли мир быстрее, чем люди успевали к этому адаптироваться: электричество, автомобили, радио, кино, новые научные открытия.
Филипп Блом в книге «Годы головокружения: Европа 1900–1914» пишет, что именно эта эпоха впервые породила массовую тревожность:
1. страх, что технологии лишают нас человечности,
2. ощущение, что скорость перемен разрушает привычный мир,
3. поиск новых смыслов в искусстве и культуре.
Звучит знакомо? Сегодня мы живём в очень похожем моменте: ИИ, биотех, климатические вызовы, ускорение темпов жизни. И снова — тревога, растерянность, но одновременно — рождение нового искусства и новых форм мышления.
История показывает: периоды «нервного срыва» часто становятся источником величайших культурных прорывов.
https://www.derekthompson.org/p/1910-the-year-the-modern-world-lost
👍5⚡1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Кровеносный сосуд, пронизывающий сому нейрона 😱😱😱
Кровеносный сосуд, пронизывающий сому нейрона 😱😱😱
🤔6⚡1❤🔥1🔥1
10🔥10👍3⚡2
#unrealneural
ArtiScene: Language-Driven Artistic 3D Scene Generation Through Image Intermediary
Генерация Художественных 3D-сцен с помощью LLM
https://github.com/NVlabs/ArtiScene
ArtiScene: Language-Driven Artistic 3D Scene Generation Through Image Intermediary
Генерация Художественных 3D-сцен с помощью LLM
https://github.com/NVlabs/ArtiScene
⚡3❤🔥2❤1
#unrealneural
Диффузионные языковые модели (DLMs)
Диффузионные языковые модели (DLMs) быстро набирают популярность как мощная альтернатива доминирующей авторегрессионной парадигме. Благодаря параллельной генерации токенов через итеративный процесс удаления шума, DLMs обеспечивают снижение задержки при выводе, захват двунаправленного контекста и точное управление процессом генерации. Современные достижения позволили DLMs достичь производительности, сравнимой с авторегрессионными моделями, что делает их привлекательным выбором для задач обработки естественного языка.
https://github.com/VILA-Lab/Awesome-DLMs
Диффузионные языковые модели (DLMs)
Диффузионные языковые модели (DLMs) быстро набирают популярность как мощная альтернатива доминирующей авторегрессионной парадигме. Благодаря параллельной генерации токенов через итеративный процесс удаления шума, DLMs обеспечивают снижение задержки при выводе, захват двунаправленного контекста и точное управление процессом генерации. Современные достижения позволили DLMs достичь производительности, сравнимой с авторегрессионными моделями, что делает их привлекательным выбором для задач обработки естественного языка.
https://github.com/VILA-Lab/Awesome-DLMs
🔥5❤1👍1
#unrealneural
Диффузионные модели для генерации изображений и видео: от основ до новых направлений
Диффузионные модели стали наиболее популярным выбором для генеративного моделирования изображений и видео, обеспечивая передовые результаты в синтезе, манипуляции и редактировании контента. Эти модели стали фундаментальной технологией для создания визуального контента как в академических исследованиях, так и в промышленных творческих процессах.
Статья-курс охватывает основы и последние достижения в области диффузионных моделей, которые стали ключевой технологией для создания визуального контента в академических и промышленных приложениях.
https://geometry.cs.ucl.ac.uk/courses/diffusion_ImageVideo_sigg25/
Диффузионные модели для генерации изображений и видео: от основ до новых направлений
Диффузионные модели стали наиболее популярным выбором для генеративного моделирования изображений и видео, обеспечивая передовые результаты в синтезе, манипуляции и редактировании контента. Эти модели стали фундаментальной технологией для создания визуального контента как в академических исследованиях, так и в промышленных творческих процессах.
Статья-курс охватывает основы и последние достижения в области диффузионных моделей, которые стали ключевой технологией для создания визуального контента в академических и промышленных приложениях.
https://geometry.cs.ucl.ac.uk/courses/diffusion_ImageVideo_sigg25/
⚡2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
STream3R
Масштабируемая последовательная 3D-реконструкция с помощью Causal Transformer
https://huggingface.co/papers/2508.10893
STream3R
Масштабируемая последовательная 3D-реконструкция с помощью Causal Transformer
https://huggingface.co/papers/2508.10893
👍2⚡1❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
LongSplat от NVIDIA
Неструктурированный 3D-гауссовский сплэттинг для простых длинных видео
https://huggingface.co/papers/2508.14041
LongSplat от NVIDIA
Неструктурированный 3D-гауссовский сплэттинг для простых длинных видео
https://huggingface.co/papers/2508.14041
👍4⚡2
Media is too big
VIEW IN TELEGRAM
#unrealneural #туториалы #AILAB
Туториал 1. Редактирование изображения в Krea.ai и создание анимации в Midjourney
Тестирую новый формат. Новая модель редактирования изображений Qwen Image Edit вполне хорошо добавляет локальные точечные изменения и не так сильно меняет форму архитектуры. Вот какой результат получился.
В видео использовались сервисы
Krea.ai
midjourney.com
Youtube
https://youtu.be/L-QcsTgq6XQ
Туториал 1. Редактирование изображения в Krea.ai и создание анимации в Midjourney
Тестирую новый формат. Новая модель редактирования изображений Qwen Image Edit вполне хорошо добавляет локальные точечные изменения и не так сильно меняет форму архитектуры. Вот какой результат получился.
В видео использовались сервисы
Krea.ai
midjourney.com
Youtube
https://youtu.be/L-QcsTgq6XQ
🔥13👍1👏1
#unrealneural
VGGT — это новый подход к 3D, и он получил премию CVPR 2025 за лучшую работу.
Но из-за глобального внимания (global attention) его сложность растет квадратично с количеством изображений, поэтому вы не сможете скормить ему много изображений.
https://vgg-t.github.io/
VGGT — это новый подход к 3D, и он получил премию CVPR 2025 за лучшую работу.
Но из-за глобального внимания (global attention) его сложность растет квадратично с количеством изображений, поэтому вы не сможете скормить ему много изображений.
https://vgg-t.github.io/
👍5🔥1
#unrealneural #вкопилкуэрудита
Одна из идей глубокого обучения заключается в том, что слои нейронной сети - это ряд геометрических преобразований ⚡️
https://phillipi.github.io/6.7960/materials/notes/02_neural_nets_as_distribution_transformers.pdf
Одна из идей глубокого обучения заключается в том, что слои нейронной сети - это ряд геометрических преобразований ⚡️
https://phillipi.github.io/6.7960/materials/notes/02_neural_nets_as_distribution_transformers.pdf
🔥4⚡1👍1
#unrealneural
От простых набросков до 3D-интерьеров с помощью Qwen-Image-Edit
Выглядит очень хорошо 👍
https://chat.qwen.ai/?inputFeature=image_edit
От простых набросков до 3D-интерьеров с помощью Qwen-Image-Edit
Выглядит очень хорошо 👍
https://chat.qwen.ai/?inputFeature=image_edit
🔥8👍3🤮1