Нейронавт | Нейросети в творчестве
9.44K subscribers
3.66K photos
3.16K videos
40 files
4.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Зананабанану

В отличие от Флюкса или Reve у нее внутри еще и мультимодальная LLM, которая знает про наш мир довольно много.

У нее в голове есть концепции и модели мира, которые и не снились диффузионным генераторам прошлых поколений (забавно писать это про реве, который вышел в этом году).

Поэтому Банана знает немного физики, хорошо знает географию, сечет за историю, она вообще понимает за мир.

Поэтому можно просить делать ее вот такие штуки.

Я люблю промпты, куда можно делать подстановки внутри [], это открывает путь к конкретным объектам (в чем Банана итак хороша).

Итак промпт:

"Make an isometric model of the [object] only."


На примерах object - это house или room

Прикол еще в том, что можно попросить ея сделать разные ракурсы этой изометрии, а потом присунуть это в Клинга (или еще кудато, кто умеет First Frame Last Frame) и полетать над вытащенным из картинки объектом.

А еще можно попробовать набросить на него wireframe сетку, как будто он полигональный объект.

@cgevent
👍11🔥51
Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation

Генератор 3D по тексту и изображению.
Фишка в том что обучен на видеоданных, что дало ему понимание пространственной связности


Авторы использовали наработки CogVideoX, FLUX.1-Kontext-dev и своей же DropletVideo

Гитхаб

#textto3d #IMAGETO3D
👍7👎1
This media is not supported in your browser
VIEW IN TELEGRAM
PHD: Personalized 3D Human Body Fitting with Point Diffusion

Реконструкция позы и телесной формы человека по видео от запрещенной Meta

Код ждем наверно

#video2pose #humanreconstruction #video2mesh #HMR #poseestimation
👍5
ChatGPT 5 — страшное оружие в умелых руках

Российский разработчик Олег Миллер, занимающий обучением и тренировкой новой модели Open AI в Сан-Франциско, рассказывает в своём блоге:

Как отключить цензуру у ChatGPT (инструкция)
Малоизвестные ИИ, с которыми вы станете богатым
Почему человечество обречено на катастрофу из-за развития ИИ

За такие инсайды он может быть уволен. Поэтому блог закрытый, а ссылка на него постоянно меняется. Успей вступить: https://t.me/+pPkYFmUfLfg1OTBi

#промо
👎40🥴19😁8😐5🍌2
Media is too big
VIEW IN TELEGRAM
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation

Сегментатор 3D моделей от VAST

Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)

Код ждем

#segmentation #3d
👍3🔥2
Media is too big
VIEW IN TELEGRAM
HunyuanWorld-Voyager

Генерация видео, совмещенная с 3D реконструкцией.
Контроль камеры при генерации
Экспорт 3D моделей
Контроль стиля-освещения-погоды

Со всеми вытекающими - умеет создавать 3D модели по картинке, делать карту глубины и т п.

Опенсорс
При создании видео в 540p расходует 60Гб VRAM

Mirage, есть чем ответить?

Гитхаб
Попробовать - не совсем понятно новая тут демка или старая

#world #text2world #imageto3d #text2video #text2scene
1👍61😱1
FastVLM: Efficient Vision Encoding for Vision Language Models

Семейство быстрых и легких #VLM от Apple
0.5B, 1.5B и 7B параметров
Способна работать на смартфоне

Гитхаб
HF

#assistant #realtime #mobile
6👍1