Нейросети от Хомяка
792 subscribers
6.46K photos
806 videos
20 files
657 links
Учимся творчеству в эпоху AI: пошаговые гайды, видео и анализ новых технологий.


Сотрудничество @Serg_1978_14

Портфолио https://t.me/Artzona_case
Download Telegram
Ну и как же без промтиков сегодня - Шикарный промпт от Design touch

Переделал под референсы:

НаноБанан2/Про, Seedream 4.5, Grok Image
Под горячую руку попался герой моего видео😁


High quality photography, a futuristic aesthetic for a fashion technology advertising campaign inspired by the design language of Nothing, a full-length photograph of a reference man captured in dance motion, the man is captured in mid-air in a powerful, rotating dance jump with one knee raised high and the opposite leg extended to the side, while the torso rotates diagonally in space and the arms swing in opposite directions holding a tape recorder, creating a strong dynamic arc of the body, elongated, dance-like proportions of the body, captured using a long exposure fashion photography technique creating twelve to sixteen translucent phases of movement trailing behind the dancer, showing the full sequence of the jump in space, glowing translucent yellow energy ribbons emanating directly from the headphones as visualized sound waves, while additional ribbons follow the trajectory of the head, arms and torso and a tape recorder, the trails originate from the earcups and extend into space along the arcs of movement, wrapping around the dancer's path in multi-layered, smooth curves rather than crossing the body. Volumetric, fluid, and voluminous, like musical energy visualized in motion; a seamless studio backdrop with a gradient from deep blue to pale blue with no visible floor line or horizon; a minimalist, futuristic composition; dramatic high-fashion lighting with crisp highlights on the earcups and subtle shadows highlighting the sculpted folds of the garment; ultra-detailed, contemporary editorial photography capturing the explosive musical movement
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31
в продолжение - Промпт от Design touch
НаноБанан Про по рефу

Промпт📎

High quality photography, a futuristic aesthetic for a fashion technology advertising campaign inspired by the design language of Nothing, a full-length photograph of a reference girl captured in dance motion, the girl is captured in mid-air in a powerful, rotating dance jump with one knee raised high and the opposite leg extended to the side, while the torso rotates diagonally in space and the arms swing in opposite directions, creating a strong dynamic arc of the body, elongated, dance-like proportions of the body, captured using a long exposure fashion photography technique creating twelve to sixteen translucent phases of movement trailing behind the dancer, showing the full sequence of the jump in space, glowing translucent yellow energy ribbons emanating directly from the headphones as visualized sound waves, while additional ribbons follow the trajectory of the head, arms and torso and Tape recorder, trails originate from the earcups and extend into space along the arcs of movement, wrapping around the dancer's path in multi-layered, smooth curves rather than crossing the body. Volumetric, fluid, and voluminous, like musical energy visualized in motion; a seamless studio backdrop with a gradient from deep blue to pale blue with no visible floor line or horizon; a minimalist, futuristic composition; dramatic high-fashion lighting with crisp highlights on the earcups and subtle shadows highlighting the sculpted folds of the garments; ultra-detailed, contemporary editorial photography capturing the explosive musical movement.
🔥2👌1
Что нужно знать о ВК..... Видео в 2К не загрузилось....Видео в FHD не загрузилось за ТРИ часа.....
Грузить в 720р даже не буду....Что происходит?🤷‍♂️


ПЫСЫ: квн выключен,
Из поста убрал ссылку на ВК
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
Хороший, без воды, наглядный и практичный разбор от Андрея
Такого не встретишь в свободном доступе. Все доступно и подробно.

Смотрим и читаем в следующих постах.
Forwarded from NeuroMan
Media is too big
VIEW IN TELEGRAM
NEURO RESHOOTING | KENZO WORLD

Долго думал как это назвать. Стресс-тест, видео Motion Control, замена персонажа в видео или дипфейк во весь рост .

В общем попытался сделать решутинг (пересъемка) и за основу взял культовый ролик Kenzo World со сложными танцевальными движениями, зеркальными отражениями и попытался полностью повторить с заменой всего персонажа. Задача — повторить все маневры и движения с минимальным отклонением от оригинала. Для ключевых кадров подключал Grok, Kling и Veo3.

Перепробовал всё с данной технологий на сегодняшний момент: Kling3, Kling Motion Control, Seedance V2V, Domo AI, Wan Animate, Live Portrait, Face Fusion и т.д.

Времени ушло прилично — пока разобрался в логике каждого сервиса, пока опробовал технологию на разных моделях. Результат: ~75% задуманного удалось. Остальное не вытянул ни один сервис.
И узнаваемость персонажа колеблется от 50 до 90% (в разных местах и в разных сервисах). про детали платья и аксессуаров пока вообще молчу. нейронка пририсует в любой момент, даже когда неожидаешь.

Что работает, что нет, сравнительный тест, стресс-тесты и неудачные дубли — всё разложил в комментариях.
Ставьте реакции, делитесь своими мнениями и вашей болью в комментах.

А я пошел доделывать сценарии к будущим фильмам.

#reshoot #test
🔥5👍1🤣1
Forwarded from NeuroMan (чат)
Media is too big
VIEW IN TELEGRAM
В общем все основные сервисы, которые работают с мимикой и движением.
Seedance 2.0 (V2V) — мой фаворит. Реально удивил. Умеет встаривать персонажа практически безболезненно (учитывает прозрачность платья и соблюдая исходный фон. Узнаваемость персонажа почти 90%). Общие планы в отличие от Клинга не плывут — чёткие, ровные. Но есть боль: из 50 запросов проходит 3–5. Блокировки жёсткие, и срабатывает рандомно — в разное время, в разные дни. Приходится ловить моменты, срыв сроков.

Kling Motion Control — с фокусировкой и мимикой работает неплохо (только на крупных планах!), местами даже лучше Live Portrait. Но с танцами дальними планами и динамикой — просто беда. Боковые объекты разваливаются, быстрые движения не тянет. Совсем статичные - патается устроить "шевеляж". То есть даже здесь провал. Только медленные плавные сцены. Проблема с руками сохранятеся на общих планах. Узнаваемость персонажа 50-70%.

Runway Act-2 — понимает только статичных персонажей. Для нашей задачи мимо. с мимикой лучше Kling Motion.

Wan Animate / Wan Swap — артефакты, искажения, сильно меняет персонажа до неузнаваемостьи. Пока сыро.

Domo AI, Live Portrait, Face Fusion и прочие() — каждый неплох в своей нише, но для полной замены персонажа не подойдут. Если только частично использовать.
🔥2🤝1
Forwarded from NeuroMan (чат)
Стресс тест клинга
Гонял на самых тяжёлых сценах из KENZO — динамичный танец, боковые ракурсы, быстрая смена крупностей. Seedance блокирует, Kling делает кашу.
Итог: Клинг не вывозит движущиеся объекты. Боковые элементы сыпятся, дальние планы уплывают. Какая бы красивая реклама у них ни была — пока на деле это работает только на медленных не динамичных сценах.

Пробовал змедлить fps , поднимал до 60-120 fps, резал на куски и сшивал. Этот способ тоже мимо. Клингу без разницы. Не умеет в дальние и боковые планы — и всё тут.
Стресс-тесты к вашему вниманию.
🔥6
НаноБанан Про & Seedream 4.5

Промпты📎
Мужской реф
Выразительный и красочный портрет мужчины (загруженное фото), который смотрит вверх с чувством восхищения и любопытства, как ребенок. На нем большие очки ярко-оранжевого цвета с мягкими цветными линзами, рассеивающими свет. Его лицо выполнено с помощью толстых и динамичных черных штрихов эскиза - свободных, но наполненных интенсивностью - передающих сырые эмоции и сильный характер. Фон состоит из слоев текстурированных газетных страниц, четко видимых, но органично сливающихся. Энергичные брызги краски ярко-синего и теплого оранжевого цвета взрываются по всей композиции, добавляя ощущение движения и контраста. Эта работа плавно сочетает реализм с абстрактным экспрессионизмом, вызывая темы невинности, надежды, воображения и творческой свободы. Живописная текстура, высокий контраст и эстетика изобразительного искусства в редакционном стиле. Высокое разрешение, четкий фокус, богатые детали, без текста, без водяных знаков."
Негативный промпт: "мультфильм, аниме, пластиковый CGI, размытие, низкая детализация, искаженное лицо, дисторсия, текст, водяной знак, логотип"


Женский реф
Выразительный и красочный портрет женщины (загруженное фото), которая смотрит в бок с чувством восхищения и любопытства, как ребенок. На ней большие очки ярко-оранжевого цвета с мягкими цветными линзами, рассеивающими свет. Ее лицо выполнено с помощью толстых и динамичных черных штрихов эскиза - свободных, но наполненных интенсивностью - передающих сырые эмоции и сильный характер. Фон состоит из слоев текстурированных газетных страниц, четко видимых, но органично сливающихся. Энергичные брызги краски ярко-синего и теплого оранжевого цвета взрываются по всей композиции, добавляя ощущение движения и контраста. Эта работа плавно сочетает реализм с абстрактным экспрессионизмом, вызывая темы невинности, надежды, воображения и творческой свободы. Живописная текстура, высокий контраст и эстетика изобразительного искусства в редакционном стиле. Высокое разрешение, четкий фокус, богатые детали, без текста, без водяных знаков."
Негативный промпт: "мультфильм, аниме, пластиковый CGI, размытие, низкая детализация, искаженное лицо, дисторсия, текст, водяной знак, логотип"
5👍5
Шрифт в различных моделях.

НаноБанана2, Рекрафт4, GPT 1.5 Image


Промпты слева направо:
Dynamic graffiti typography “gptunnel”, torn ripped letters stretched by motion, neon glow trails, deep shadows with motion blur, cracked paint texture, spray noise, dark urban background, energetic street art poster


Raw underground graffiti typography “gptunnel”, chaotic torn shapes, uneven letterforms, distressed spray paint texture, dirt, dust, scratches, minimal neon accents, heavy shadows, dark urban background, brutal street art poster, high contrast, analog grain


Grunge graffiti lettering “gptunnel”, torn paper-like edges, distressed paint texture, subtle neon glow, deep shadows, dirty grain, dark textured background, raw street art poster design


Acid neon graffiti typography “gptunnel”, melting torn letterforms, glowing toxic green and pink neon, deep layered shadows, paint cracks, heavy grain and spray texture, black background, expressive street art poster


the text "gptunnel", neon green graffiti tag lettering, glowing slime paint strokes, fluid spray paint calligraphy, bright toxic green glow, airbrush spray texture, dripping gel strokes, street graffiti marker style, soft particle spray around letters, dark black background, luminous neon effect, smooth flowing tag composition, ultra detailed, 4k


the text "gptunnel", bold slime graffiti typography, gooey organic letters, bright green glitter texture, thick purple outline, hot pink oval badge behind the text, cartoon sticker style logo, playful 90s street graphic aesthetic, soft embossed plastic texture, vibrant colors, clean light background, centered composition, high contrast, ultra detailed, 4k


The word "gptunnel" in aggressive gothic chrome typography, sharp medieval metal letters, reflective polished chrome metal, spiked edges, fantasy metal band logo style, high detail chrome reflections, blue electric highlights and glow, dark black background, dramatic lighting, ultra detailed metallic texture, symmetrical lettering, heavy metal logo style, 3D chrome typography, high contrast, studio lighting, ultra sharp, 4k


the text "/gptunnel", bold rounded futuristic typography, matte black letters, soft chromatic aberration glow around edges (red yellow blue fringe), subtle blur halo effect, retro digital aesthetic, minimal design, light grain texture, light background, centered composition, clean modern logo style, high contrast, ultra sharp typography, 4k


the text "gptunnel", neon green graffiti tag lettering, glowing slime paint strokes, fluid spray paint calligraphy, bright toxic green glow, airbrush spray texture, dripping gel strokes, street graffiti marker style, soft particle spray around letters, dark black background, luminous neon effect, smooth flowing tag composition, ultra detailed, 4k
🔥3