Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Зананабанану
В отличие от Флюкса или Reve у нее внутри еще и мультимодальная LLM, которая знает про наш мир довольно много.
У нее в голове есть концепции и модели мира, которые и не снились диффузионным генераторам прошлых поколений (забавно писать это про реве, который вышел в этом году).
Поэтому Банана знает немного физики, хорошо знает географию, сечет за историю, она вообще понимает за мир.
Поэтому можно просить делать ее вот такие штуки.
Я люблю промпты, куда можно делать подстановки внутри [], это открывает путь к конкретным объектам (в чем Банана итак хороша).
Итак промпт:
На примерах object - это house или room
Прикол еще в том, что можно попросить ея сделать разные ракурсы этой изометрии, а потом присунуть это в Клинга (или еще кудато, кто умеет First Frame Last Frame) и полетать над вытащенным из картинки объектом.
А еще можно попробовать набросить на него wireframe сетку, как будто он полигональный объект.
@cgevent
В отличие от Флюкса или Reve у нее внутри еще и мультимодальная LLM, которая знает про наш мир довольно много.
У нее в голове есть концепции и модели мира, которые и не снились диффузионным генераторам прошлых поколений (забавно писать это про реве, который вышел в этом году).
Поэтому Банана знает немного физики, хорошо знает географию, сечет за историю, она вообще понимает за мир.
Поэтому можно просить делать ее вот такие штуки.
Я люблю промпты, куда можно делать подстановки внутри [], это открывает путь к конкретным объектам (в чем Банана итак хороша).
Итак промпт:
"Make an isometric model of the [object] only."
На примерах object - это house или room
Прикол еще в том, что можно попросить ея сделать разные ракурсы этой изометрии, а потом присунуть это в Клинга (или еще кудато, кто умеет First Frame Last Frame) и полетать над вытащенным из картинки объектом.
А еще можно попробовать набросить на него wireframe сетку, как будто он полигональный объект.
@cgevent
👍11🔥5❤1
Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation
Генератор 3D по тексту и изображению.
Фишка в том что обучен на видеоданных, что дало ему понимание пространственной связности
Авторы использовали наработки CogVideoX, FLUX.1-Kontext-dev и своей же DropletVideo
Гитхаб
#textto3d #IMAGETO3D
Генератор 3D по тексту и изображению.
Фишка в том что обучен на видеоданных, что дало ему понимание пространственной связности
Авторы использовали наработки CogVideoX, FLUX.1-Kontext-dev и своей же DropletVideo
Гитхаб
#textto3d #IMAGETO3D
👍7👎1
This media is not supported in your browser
VIEW IN TELEGRAM
PHD: Personalized 3D Human Body Fitting with Point Diffusion
Реконструкция позы и телесной формы человека по видео от запрещенной Meta
Код ждем наверно
#video2pose #humanreconstruction #video2mesh #HMR #poseestimation
Реконструкция позы и телесной формы человека по видео от запрещенной Meta
Код ждем наверно
#video2pose #humanreconstruction #video2mesh #HMR #poseestimation
👍5
Stand-In IP2V
Демоспейс видеоперсонализатора на Wan 2.1
Можно попробовать онлайн бесплатно. Чуть-чуть
#workflow #comfyUI #personalization #referencing #faceswap #stylize
Демоспейс видеоперсонализатора на Wan 2.1
Можно попробовать онлайн бесплатно. Чуть-чуть
#workflow #comfyUI #personalization #referencing #faceswap #stylize
👍2
ChatGPT 5 — страшное оружие в умелых руках
Российский разработчик Олег Миллер, занимающий обучением и тренировкой новой модели Open AI в Сан-Франциско, рассказывает в своём блоге:
• Как отключить цензуру у ChatGPT (инструкция)
• Малоизвестные ИИ, с которыми вы станете богатым
• Почему человечество обречено на катастрофу из-за развития ИИ
За такие инсайды он может быть уволен. Поэтому блог закрытый, а ссылка на него постоянно меняется. Успей вступить: https://t.me/+pPkYFmUfLfg1OTBi
#промо
Российский разработчик Олег Миллер, занимающий обучением и тренировкой новой модели Open AI в Сан-Франциско, рассказывает в своём блоге:
• Как отключить цензуру у ChatGPT (инструкция)
• Малоизвестные ИИ, с которыми вы станете богатым
• Почему человечество обречено на катастрофу из-за развития ИИ
За такие инсайды он может быть уволен. Поэтому блог закрытый, а ссылка на него постоянно меняется. Успей вступить: https://t.me/+pPkYFmUfLfg1OTBi
#промо
👎40🥴19😁8😐5🍌2
Media is too big
VIEW IN TELEGRAM
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation
Сегментатор 3D моделей от VAST
Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)
Код ждем
#segmentation #3d
Сегментатор 3D моделей от VAST
Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)
Код ждем
#segmentation #3d
👍3🔥2
Media is too big
VIEW IN TELEGRAM
HunyuanWorld-Voyager
Генерация видео, совмещенная с 3D реконструкцией.
Контроль камеры при генерации
Экспорт 3D моделей
Контроль стиля-освещения-погоды
Со всеми вытекающими - умеет создавать 3D модели по картинке, делать карту глубины и т п.
Опенсорс
При создании видео в 540p расходует 60Гб VRAM
Mirage, есть чем ответить?
Гитхаб
Попробовать - не совсем понятно новая тут демка или старая
#world #text2world #imageto3d #text2video #text2scene
Генерация видео, совмещенная с 3D реконструкцией.
Контроль камеры при генерации
Экспорт 3D моделей
Контроль стиля-освещения-погоды
Со всеми вытекающими - умеет создавать 3D модели по картинке, делать карту глубины и т п.
Опенсорс
При создании видео в 540p расходует 60Гб VRAM
Mirage, есть чем ответить?
Гитхаб
Попробовать - не совсем понятно новая тут демка или старая
#world #text2world #imageto3d #text2video #text2scene
1👍6❤1😱1
❤6👍1