Метаверсище и ИИще
46.7K subscribers
5.93K photos
4.34K videos
45 files
6.81K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Главный разработчик Зимажа сделал свою Лору на основе Concept Sliders (там есть поддержка z-image).

Лора добавляет деталей и освещения в исходную картинку.

Он, кстати, пишет, что можно тренировать и не де-дистилированную модель.

Но мы все равно ждем базовый Зимаж.

https://huggingface.co/bdsqlsz/qinglong_DetailedEyes_Z-Image/tree/main

@cgevent
👍4
Seedream 4.1

Уже раскатывают на Dreamina Cupcut сайте:
https://dreamina.capcut.com/ai-tool/generate?type=image

У меня появилась модель 4.1, разрешение 4K на месте.

Посмотрел и пошерстил интернет:

До Нанабананыпро не дотягивает, особенно по части рендеринга текста и работы со сложными промптами.
В остальном как бы обычный Сидрим, у меня нет большого опыта работы с ним, чтобы заметить разницу.

Тестируем у них на сайте, на Фал пока не раскатали.

@cgevent
🔥9👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Обычно не пощщу такое, но уж больно мило.
Просто хочу обратить внимание, что до выхода первой Соры мы и понятия не имели про физику в видеогенерациях. Был просто шевеляж в невесомости, а откусить кусочек бургера на нейровидео было просто невозможно.

Прошло полтора года.

Посмотрите со звуком плиз.

И да, ошибки физики есть, блохоловы. Поговорим через полтора года.

https://www.instagram.com/p/DRfjhvWEYyl/

@cgevent
😁6543🔥36👎4
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная динамика по месяцам с 2023 до 2025.

Как китайские модели захватывают мир.

Из европейских я знаю Мистраль и теперь Flux. Есть еще LTX из Израиля. И Хиггс из Казахстана, но у них офис в Сан-Франциско.

@cgevent
👍39😱13🔥103
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

LIFT. 18+

Автор: Олег, @OlegRed_STAV

Центральная сцена в лифте — была сделана из ОДНОЙ фотография сгенерированной в Midjourney.
Далее по этой фотографии анимация в Grok Imagine. Менялись ракурсы, движение камеры, освещение и действие внутри сцены через промпты.
В Midjourney догенерил еще 2 кадра, это коридор с лифтом и серверная.
Остальные сцены были сделаны с помощью — (Nano Banana) на основе 3 фотографий.
Анимация в Grok Imagine – коло 500 + генераций , 36 пошли в ролик.
Трек сгенерирован в SUNO в стиле (Sigilkore/Crash Funk)
Монтаж видео в DaVinci,

По деньгам:
Годовая Студенческая подписка Gemini Pro – 1000 руб.
Grok – 30$
Midjourney -30$
Suno 10$
Topaz SLm –локально.
Вся работа заняла около 50 часов , в течении 3х недель.


@cgevent
1🔥73👎26👍206😁1
Media is too big
VIEW IN TELEGRAM
Kling O1

All-in-One Creative Studio
Streamlined workflow for storytelling from start to finish


В общем Клинг бахнул этакую Нанобанану для видео.

Лучше всего наверное описать O1 как edit-video модель.

Посмотрите видео пару раз на медленной скорости - из него становится понятно, что новый Клинг - это редактирующая видео-модель. Аналог Нанобананы.

А то на сайте и в твитторе полно маркетинговой истерики и мало информации.

Но я нашел юзер-гайд:

https://app.klingai.com/global/quickstart/klingai-video-o1-user-guide

1. Input Anything: Все что угодно на входе.
Reference-based Generation, Text-to-Video, Keyframe Interpolation (Start/End Frame), Video Inpainting, Transformation, Stylization, and Video Extension.

2. Understand Everything: LLM под капотом?
Благодаря глубокому семантическому пониманию модели, все — включая изображения, видео, элементы, тексты и т. д. — может быть включено в ваш input для Kling O1. Модель выходит за пределы ограничений модальности, интегрируя и понимая различные перспективы изображения, видео или символы, которые вы загружаете, чтобы вернуть точные результаты.

3. All-in-One Reference: Video Consistency Now Resolved
Даже в сложных ансамблевых сценах или взаимодействиях модель независимо фиксирует и сохраняет уникальные черты каждого персонажа и реквизита. Независимо от того, насколько резко меняется окружающая среда, Video O1 обеспечивает промышленный уровень согласованности для каждого вашего актера в каждом кадре.

4. Модель Kling O1 не ограничивается выполнением отдельных задач; она поддерживает комбинацию различных задач в одном запросе, например «добавление объекта при изменении фона в видео» или «изменение стиля при использовании элементов».

5. Каждый кадр требует своей собственной продолжительности для лучшего ритма повествования. Kling O1 поддерживает продолжительность от 3 до 10 секунд, что дает вам больше контроля над тем, как вы хотите развернуть свою историю. Будь то динамичная, впечатляющая сцена или история с повествовательной дугой, вы сами решаете, каким будет ритм кадров.

Пробуем тут:
https://app.klingai.com/global/omni/new

@cgevent
🔥5410😱5
Media is too big
VIEW IN TELEGRAM
Тот самый Whisper Thunder (aka) David оказался новым Runway 4.5.

Судя по тому, что он побивал всех на LM Arena - основной прирост - качество генераций.

Также разрабы пишут, что нехило прокачали физику и понимание отношений между объектами. И что понимание промпта стало лучше.

Все это повод для неистовых тестов.

Но Клинг задал новую планку - редактирование видео. И теперь всем видеогенераторам придется что-то отвечать на это.

А теперь задумайтесь в какое время мы живем! В один день выходят по ДВА анонса новых версий видеогенераторов!

И мы такие водим жалом: а где-тут лучше физика, а где освещение, а вот тут 15 секунд дают, а тут интеграция с бананой..

Фаза "ой смарите чо!" очень быстро перешла в фазу "ну и чо выбрать?!"

На дворе декабрь 2025. И он только начался. И судя по всему в декабре будет еще анонсов примерно как за последние 11 месяцев.

What a time to be alive!

https://runwayml.com/research/introducing-runway-gen-4.5

@cgevent
👍44🔥2910
Большинство окончательно зациклилось на промтах

В то же время сильные личности совершают эволюционный скачок в жизни и бизнесе, используя более системный подход

Подробно об этом сквозь призму реальной практики и личных инсайтов:

🧬🔑 Тревога как Трамплин в ИИ

P.S. Доступ к статье бесплатный, но открыт до 10 декабря - успейте зафиксировать ключевые тезисы ✍️

#промо
👎63😁144👍2😱2🔥1
Фофр, один из лучших, скажем так, графических промпт-инженеров, завел свой блог, посвященный Нанабанане.

В отличие от расплодившихся сборников типа "лучшие промпты для Нанабанана", которые являются просто компиляциями работ из твиттора, в этом блоге есть немного теории и замысла.
Про негативные проммпты, про джейсоны и про разное.

Кстати, Фофр недавно ушел из Репликейта в Гугл, поэтому материал у него всегда инсайдерский.

https://www.fofr.ai/nano-banana-pro-guide

@cgevent
36👍11🔥10😁1
Ого, Алибабищенский выкатил настоящий контролНет для Зимажа

Перечитал заголовок, теперь для тех, кто недавно тут:
Алибаба выпустил ControlNet для генератора картинок Z-Image Turbo

Canny, HED, Depth, Pose and MLSD.

Воистину Stable Diffusion Moment!

https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union

@cgevent
🔥5518👍5😱5