Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

Зананабанану

В отличие от Флюкса или Reve у нее внутри еще и мультимодальная LLM, которая знает про наш мир довольно много.

У нее в голове есть концепции и модели мира, которые и не снились диффузионным генераторам прошлых поколений (забавно писать это про реве, который вышел в этом году).

Поэтому Банана знает немного физики, хорошо знает географию, сечет за историю, она вообще понимает за мир.

Поэтому можно просить делать ее вот такие штуки.

Я люблю промпты, куда можно делать подстановки внутри [], это открывает путь к конкретным объектам (в чем Банана итак хороша).

Итак промпт:

"Make an isometric model of the [object] only."

На примерах object - это house или room

Прикол еще в том, что можно попросить ея сделать разные ракурсы этой изометрии, а потом присунуть это в Клинга (или еще кудато, кто умеет First Frame Last Frame) и полетать над вытащенным из картинки объектом.

А еще можно попробовать набросить на него wireframe сетку, как будто он полигональный объект.

@cgevent

👍11🔥5❤1

654 views05:08

Нейронавт | Нейросети в творчестве

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation

Генератор 3D по тексту и изображению.
Фишка в том что обучен на видеоданных, что дало ему понимание пространственной связности

Авторы использовали наработки CogVideoX, FLUX.1-Kontext-dev и своей же DropletVideo

Гитхаб

#textto3d #IMAGETO3D

👍7👎1

1.25K views06:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

PHD: Personalized 3D Human Body Fitting with Point Diffusion

Реконструкция позы и телесной формы человека по видео от запрещенной Meta

Код ждем наверно

#video2pose #humanreconstruction #video2mesh #HMR #poseestimation

👍5

1.09K views07:11

Нейронавт | Нейросети в творчестве

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

Stand-In IP2V

Демоспейс видеоперсонализатора на Wan 2.1
Можно попробовать онлайн бесплатно. Чуть-чуть

#workflow #comfyUI #personalization #referencing #faceswap #stylize

👍2

1.08K views08:14

Нейронавт | Нейросети в творчестве

ChatGPT 5 — страшное оружие в умелых руках

Российский разработчик Олег Миллер, занимающий обучением и тренировкой новой модели Open AI в Сан-Франциско, рассказывает в своём блоге:

• Как отключить цензуру у ChatGPT (инструкция)
• Малоизвестные ИИ, с которыми вы станете богатым
• Почему человечество обречено на катастрофу из-за развития ИИ

За такие инсайды он может быть уволен. Поэтому блог закрытый, а ссылка на него постоянно меняется. Успей вступить: https://t.me/+pPkYFmUfLfg1OTBi

#промо

👎40🥴19😁8😐5🍌2

1.09K views09:03

Нейронавт | Нейросети в творчестве

2:16

Media is too big

VIEW IN TELEGRAM

GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation

Сегментатор 3D моделей от VAST

Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)

Код ждем

#segmentation #3d

👍3🔥2

936 views11:06

Нейронавт | Нейросети в творчестве

0:37

Media is too big

VIEW IN TELEGRAM

HunyuanWorld-Voyager

Генерация видео, совмещенная с 3D реконструкцией.
Контроль камеры при генерации
Экспорт 3D моделей
Контроль стиля-освещения-погоды

Со всеми вытекающими - умеет создавать 3D модели по картинке, делать карту глубины и т п.

Опенсорс
При создании видео в 540p расходует 60Гб VRAM

Mirage, есть чем ответить?

Гитхаб
Попробовать - не совсем понятно новая тут демка или старая

#world #text2world #imageto3d #text2video #text2scene

1👍6❤1😱1

913 views12:14

Нейронавт | Нейросети в творчестве

1:54

This media is not supported in your browser

VIEW IN TELEGRAM

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

FastVLM: Efficient Vision Encoding for Vision Language Models

Семейство быстрых и легких #VLM от Apple
0.5B, 1.5B и 7B параметров
Способна работать на смартфоне

Гитхаб
HF

#assistant #realtime #mobile

❤6👍1

854 views13:16

About

Blog

Apps

Platform