Главный разработчик Зимажа сделал свою Лору на основе Concept Sliders (там есть поддержка z-image).
Лора добавляет деталей и освещения в исходную картинку.
Он, кстати, пишет, что можно тренировать и не де-дистилированную модель.
Но мы все равно ждем базовый Зимаж.
https://huggingface.co/bdsqlsz/qinglong_DetailedEyes_Z-Image/tree/main
@cgevent
Лора добавляет деталей и освещения в исходную картинку.
Он, кстати, пишет, что можно тренировать и не де-дистилированную модель.
Но мы все равно ждем базовый Зимаж.
https://huggingface.co/bdsqlsz/qinglong_DetailedEyes_Z-Image/tree/main
@cgevent
👍4
Seedream 4.1
Уже раскатывают на Dreamina Cupcut сайте:
https://dreamina.capcut.com/ai-tool/generate?type=image
У меня появилась модель 4.1, разрешение 4K на месте.
Посмотрел и пошерстил интернет:
До Нанабананыпро не дотягивает, особенно по части рендеринга текста и работы со сложными промптами.
В остальном как бы обычный Сидрим, у меня нет большого опыта работы с ним, чтобы заметить разницу.
Тестируем у них на сайте, на Фал пока не раскатали.
@cgevent
Уже раскатывают на Dreamina Cupcut сайте:
https://dreamina.capcut.com/ai-tool/generate?type=image
У меня появилась модель 4.1, разрешение 4K на месте.
Посмотрел и пошерстил интернет:
До Нанабананыпро не дотягивает, особенно по части рендеринга текста и работы со сложными промптами.
В остальном как бы обычный Сидрим, у меня нет большого опыта работы с ним, чтобы заметить разницу.
Тестируем у них на сайте, на Фал пока не раскатали.
@cgevent
🔥9👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Обычно не пощщу такое, но уж больно мило.
Просто хочу обратить внимание, что до выхода первой Соры мы и понятия не имели про физику в видеогенерациях. Был просто шевеляж в невесомости, а откусить кусочек бургера на нейровидео было просто невозможно.
Прошло полтора года.
Посмотрите со звуком плиз.
И да, ошибки физики есть, блохоловы. Поговорим через полтора года.
https://www.instagram.com/p/DRfjhvWEYyl/
@cgevent
Просто хочу обратить внимание, что до выхода первой Соры мы и понятия не имели про физику в видеогенерациях. Был просто шевеляж в невесомости, а откусить кусочек бургера на нейровидео было просто невозможно.
Прошло полтора года.
Посмотрите со звуком плиз.
И да, ошибки физики есть, блохоловы. Поговорим через полтора года.
https://www.instagram.com/p/DRfjhvWEYyl/
@cgevent
😁65❤43🔥36👎4
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная динамика по месяцам с 2023 до 2025.
Как китайские модели захватывают мир.
Из европейских я знаю Мистраль и теперь Flux. Есть еще LTX из Израиля. И Хиггс из Казахстана, но у них офис в Сан-Франциско.
@cgevent
Как китайские модели захватывают мир.
Из европейских я знаю Мистраль и теперь Flux. Есть еще LTX из Израиля. И Хиггс из Казахстана, но у них офис в Сан-Франциско.
@cgevent
👍39😱13🔥10❤3
Media is too big
VIEW IN TELEGRAM
Нейропрожарка
LIFT. 18+
Автор: Олег, @OlegRed_STAV
Центральная сцена в лифте — была сделана из ОДНОЙ фотография сгенерированной в Midjourney.
Далее по этой фотографии анимация в Grok Imagine. Менялись ракурсы, движение камеры, освещение и действие внутри сцены через промпты.
В Midjourney догенерил еще 2 кадра, это коридор с лифтом и серверная.
Остальные сцены были сделаны с помощью — (Nano Banana) на основе 3 фотографий.
Анимация в Grok Imagine – коло 500 + генераций , 36 пошли в ролик.
Трек сгенерирован в SUNO в стиле (Sigilkore/Crash Funk)
Монтаж видео в DaVinci,
По деньгам:
Годовая Студенческая подписка Gemini Pro – 1000 руб.
Grok – 30$
Midjourney -30$
Suno 10$
Topaz SLm –локально.
Вся работа заняла около 50 часов , в течении 3х недель.
@cgevent
LIFT. 18+
Автор: Олег, @OlegRed_STAV
Центральная сцена в лифте — была сделана из ОДНОЙ фотография сгенерированной в Midjourney.
Далее по этой фотографии анимация в Grok Imagine. Менялись ракурсы, движение камеры, освещение и действие внутри сцены через промпты.
В Midjourney догенерил еще 2 кадра, это коридор с лифтом и серверная.
Остальные сцены были сделаны с помощью — (Nano Banana) на основе 3 фотографий.
Анимация в Grok Imagine – коло 500 + генераций , 36 пошли в ролик.
Трек сгенерирован в SUNO в стиле (Sigilkore/Crash Funk)
Монтаж видео в DaVinci,
По деньгам:
Годовая Студенческая подписка Gemini Pro – 1000 руб.
Grok – 30$
Midjourney -30$
Suno 10$
Topaz SLm –локально.
Вся работа заняла около 50 часов , в течении 3х недель.
@cgevent
1🔥73👎26👍20❤6😁1
Media is too big
VIEW IN TELEGRAM
Kling O1
All-in-One Creative Studio
Streamlined workflow for storytelling from start to finish
В общем Клинг бахнул этакую Нанобанану для видео.
Лучше всего наверное описать O1 как edit-video модель.
Посмотрите видео пару раз на медленной скорости - из него становится понятно, что новый Клинг - это редактирующая видео-модель. Аналог Нанобананы.
А то на сайте и в твитторе полно маркетинговой истерики и мало информации.
Но я нашел юзер-гайд:
https://app.klingai.com/global/quickstart/klingai-video-o1-user-guide
1. Input Anything: Все что угодно на входе.
Reference-based Generation, Text-to-Video, Keyframe Interpolation (Start/End Frame), Video Inpainting, Transformation, Stylization, and Video Extension.
2. Understand Everything: LLM под капотом?
Благодаря глубокому семантическому пониманию модели, все — включая изображения, видео, элементы, тексты и т. д. — может быть включено в ваш input для Kling O1. Модель выходит за пределы ограничений модальности, интегрируя и понимая различные перспективы изображения, видео или символы, которые вы загружаете, чтобы вернуть точные результаты.
3. All-in-One Reference: Video Consistency Now Resolved
Даже в сложных ансамблевых сценах или взаимодействиях модель независимо фиксирует и сохраняет уникальные черты каждого персонажа и реквизита. Независимо от того, насколько резко меняется окружающая среда, Video O1 обеспечивает промышленный уровень согласованности для каждого вашего актера в каждом кадре.
4. Модель Kling O1 не ограничивается выполнением отдельных задач; она поддерживает комбинацию различных задач в одном запросе, например «добавление объекта при изменении фона в видео» или «изменение стиля при использовании элементов».
5. Каждый кадр требует своей собственной продолжительности для лучшего ритма повествования. Kling O1 поддерживает продолжительность от 3 до 10 секунд, что дает вам больше контроля над тем, как вы хотите развернуть свою историю. Будь то динамичная, впечатляющая сцена или история с повествовательной дугой, вы сами решаете, каким будет ритм кадров.
Пробуем тут:
https://app.klingai.com/global/omni/new
@cgevent
All-in-One Creative Studio
Streamlined workflow for storytelling from start to finish
В общем Клинг бахнул этакую Нанобанану для видео.
Лучше всего наверное описать O1 как edit-video модель.
Посмотрите видео пару раз на медленной скорости - из него становится понятно, что новый Клинг - это редактирующая видео-модель. Аналог Нанобананы.
А то на сайте и в твитторе полно маркетинговой истерики и мало информации.
Но я нашел юзер-гайд:
https://app.klingai.com/global/quickstart/klingai-video-o1-user-guide
1. Input Anything: Все что угодно на входе.
Reference-based Generation, Text-to-Video, Keyframe Interpolation (Start/End Frame), Video Inpainting, Transformation, Stylization, and Video Extension.
2. Understand Everything: LLM под капотом?
Благодаря глубокому семантическому пониманию модели, все — включая изображения, видео, элементы, тексты и т. д. — может быть включено в ваш input для Kling O1. Модель выходит за пределы ограничений модальности, интегрируя и понимая различные перспективы изображения, видео или символы, которые вы загружаете, чтобы вернуть точные результаты.
3. All-in-One Reference: Video Consistency Now Resolved
Даже в сложных ансамблевых сценах или взаимодействиях модель независимо фиксирует и сохраняет уникальные черты каждого персонажа и реквизита. Независимо от того, насколько резко меняется окружающая среда, Video O1 обеспечивает промышленный уровень согласованности для каждого вашего актера в каждом кадре.
4. Модель Kling O1 не ограничивается выполнением отдельных задач; она поддерживает комбинацию различных задач в одном запросе, например «добавление объекта при изменении фона в видео» или «изменение стиля при использовании элементов».
5. Каждый кадр требует своей собственной продолжительности для лучшего ритма повествования. Kling O1 поддерживает продолжительность от 3 до 10 секунд, что дает вам больше контроля над тем, как вы хотите развернуть свою историю. Будь то динамичная, впечатляющая сцена или история с повествовательной дугой, вы сами решаете, каким будет ритм кадров.
Пробуем тут:
https://app.klingai.com/global/omni/new
@cgevent
🔥54❤10😱5
Media is too big
VIEW IN TELEGRAM
Тот самый Whisper Thunder (aka) David оказался новым Runway 4.5.
Судя по тому, что он побивал всех на LM Arena - основной прирост - качество генераций.
Также разрабы пишут, что нехило прокачали физику и понимание отношений между объектами. И что понимание промпта стало лучше.
Все это повод для неистовых тестов.
Но Клинг задал новую планку - редактирование видео. И теперь всем видеогенераторам придется что-то отвечать на это.
А теперь задумайтесь в какое время мы живем! В один день выходят по ДВА анонса новых версий видеогенераторов!
И мы такие водим жалом: а где-тут лучше физика, а где освещение, а вот тут 15 секунд дают, а тут интеграция с бананой..
Фаза "ой смарите чо!" очень быстро перешла в фазу "ну и чо выбрать?!"
На дворе декабрь 2025. И он только начался. И судя по всему в декабре будет еще анонсов примерно как за последние 11 месяцев.
What a time to be alive!
https://runwayml.com/research/introducing-runway-gen-4.5
@cgevent
Судя по тому, что он побивал всех на LM Arena - основной прирост - качество генераций.
Также разрабы пишут, что нехило прокачали физику и понимание отношений между объектами. И что понимание промпта стало лучше.
Все это повод для неистовых тестов.
Но Клинг задал новую планку - редактирование видео. И теперь всем видеогенераторам придется что-то отвечать на это.
А теперь задумайтесь в какое время мы живем! В один день выходят по ДВА анонса новых версий видеогенераторов!
И мы такие водим жалом: а где-тут лучше физика, а где освещение, а вот тут 15 секунд дают, а тут интеграция с бананой..
Фаза "ой смарите чо!" очень быстро перешла в фазу "ну и чо выбрать?!"
На дворе декабрь 2025. И он только начался. И судя по всему в декабре будет еще анонсов примерно как за последние 11 месяцев.
What a time to be alive!
https://runwayml.com/research/introducing-runway-gen-4.5
@cgevent
👍44🔥29❤10
Большинство окончательно зациклилось на промтах
В то же время сильные личности совершают эволюционный скачок в жизни и бизнесе, используя более системный подход
Подробно об этом сквозь призму реальной практики и личных инсайтов:
🧬🔑 Тревога как Трамплин в ИИ
P.S.Доступ к статье бесплатный, но открыт до 10 декабря - успейте зафиксировать ключевые тезисы ✍️
#промо
В то же время сильные личности совершают эволюционный скачок в жизни и бизнесе, используя более системный подход
Подробно об этом сквозь призму реальной практики и личных инсайтов:
🧬🔑 Тревога как Трамплин в ИИ
P.S.
#промо
👎63😁14❤4👍2😱2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Kling O1 появился уже везде, включая Fal.ai
Черрипики выглядят как тост за композеров, не чокаясь.
https://fal.ai/models/fal-ai/kling-video/o1/reference-to-video/
https://fal.ai/models/fal-ai/kling-video/o1/image-to-video/
https://fal.ai/models/fal-ai/kling-video/o1/video-to-video/reference/
https://fal.ai/models/fal-ai/kling-video/o1/video-to-video/edit/
@cgevent
Черрипики выглядят как тост за композеров, не чокаясь.
https://fal.ai/models/fal-ai/kling-video/o1/reference-to-video/
https://fal.ai/models/fal-ai/kling-video/o1/image-to-video/
https://fal.ai/models/fal-ai/kling-video/o1/video-to-video/reference/
https://fal.ai/models/fal-ai/kling-video/o1/video-to-video/edit/
@cgevent
😁38🔥25❤6👍5😱1
Фофр, один из лучших, скажем так, графических промпт-инженеров, завел свой блог, посвященный Нанабанане.
В отличие от расплодившихся сборников типа "лучшие промпты для Нанабанана", которые являются просто компиляциями работ из твиттора, в этом блоге есть немного теории и замысла.
Про негативные проммпты, про джейсоны и про разное.
Кстати, Фофр недавно ушел из Репликейта в Гугл, поэтому материал у него всегда инсайдерский.
https://www.fofr.ai/nano-banana-pro-guide
@cgevent
В отличие от расплодившихся сборников типа "лучшие промпты для Нанабанана", которые являются просто компиляциями работ из твиттора, в этом блоге есть немного теории и замысла.
Про негативные проммпты, про джейсоны и про разное.
Кстати, Фофр недавно ушел из Репликейта в Гугл, поэтому материал у него всегда инсайдерский.
https://www.fofr.ai/nano-banana-pro-guide
@cgevent
www.fofr.ai
How to prompt Nano Banana Pro
Nano Banana Pro is the most flexible and capable image model available. But when it can do so much, where do you start?
❤36👍11🔥10😁1
Ого, Алибабищенский выкатил настоящий контролНет для Зимажа
Перечитал заголовок, теперь для тех, кто недавно тут:
Алибаба выпустил ControlNet для генератора картинок Z-Image Turbo
Canny, HED, Depth, Pose and MLSD.
Воистину Stable Diffusion Moment!
https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union
@cgevent
Перечитал заголовок, теперь для тех, кто недавно тут:
Алибаба выпустил ControlNet для генератора картинок Z-Image Turbo
Canny, HED, Depth, Pose and MLSD.
Воистину Stable Diffusion Moment!
https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union
@cgevent
🔥55❤18👍5😱5