Botlicker
277 subscribers
260 photos
180 videos
3 files
182 links
Тут любят иишки
Download Telegram
Итак, сейчас будет САМЫЙ полезный банана-промпт для дизайнеров. Для остальных тоже.

Он позволяет генерировать разные ракурсы для мастер-картинки в одном изображении. Ракурсы сильно разные, лично для меня часто было болью заполучить кардинально другой ракурс, чем на референсе. Генерится сетка, а далее выбираете нужный фрейм и апскейлете его в той же Банане. Очевидно, ракурсов можно нагенерить хоть миллион.

Промпт будет в нижнем посте, потому, что он довольно большой.

Ботликер
🤗3🎄1
Промпт для генерациий ракурсов 👆

<instruction>
Analyze the entire composition of the input image. Identify ALL key subjects present (whether it's a single person, a group/couple, a vehicle, or a specific object) and their spatial relationship/interaction.
Generate a cohesive 3x3 grid "Cinematic Contact Sheet" featuring 9 distinct camera shots of exactly these subjects in the same environment.
You must adapt the standard cinematic shot types to fit the content (e.g., if a group, keep the group together; if an object, frame the whole object):

Row 1 (Establishing Context):
1. Extreme Long Shot (ELS): The subject(s) are seen small within the vast environment.
2. Long Shot (LS): The complete subject(s) or group is visible from top to bottom (head to toe / wheels to roof).
3. Medium Long Shot (American/3-4): Framed from knees up (for people) or a 3/4 view (for objects).

Row 2 (The Core Coverage):
4. Medium Shot (MS): Framed from the waist up (or the central core of the object). Focus on interaction/action.
5. Medium Close-Up (MCU): Framed from chest up. Intimate framing of the main subject(s).
6. Close-Up (CU): Tight framing on the face(s) or the "front" of the object.

Row 3 (Details & Angles):
7. Extreme Close-Up (ECU): Macro detail focusing intensely on a key feature (eyes, hands, logo, texture).
8. Low Angle Shot (Worm's Eye): Looking up at the subject(s) from the ground (imposing/heroic).
9. High Angle Shot (Bird's Eye): Looking down on the subject(s) from above.

Ensure strict consistency: The same people/objects, same clothes, and same lighting across all 9 panels. The depth of field should shift realistically (bokeh in close-ups).
</instruction>

A professional 3x3 cinematic storyboard grid containing 9 panels.
The grid showcases the specific subjects/scene from the input image in a comprehensive range of focal lengths.
Top Row: Wide environmental shot, Full view, 3/4 cut.
Middle Row: Waist-up view, Chest-up view, Face/Front close-up.
Bottom Row: Macro detail, Low Angle, High Angle.
All frames feature photorealistic textures, consistent cinematic color grading, and correct framing for the specific number of subjects or objects analyzed


Ботликер
🔥4
Банана это конечно хорошо, но я знаю, как проведу эту субботу. Z-Image... Будет некоторое количество постов. Модель КРАЙНЕ хороша.
👍3
Какое же дикое УДОВОЛЬСТВИЕ общаться с Gemini 3. Мы удивлялись ЧатГПТ в 2023, но сейчас это буквально пропасть. Настолько адекватная, нативная, оригинальная, богатая и уникальная речь вышла. А ведь я её даже не настраивал под себя.

А ещё очень мило и убедительно перечет. И надежды разрушает. Оно и хорошо.

Ботликер
4🙈1
Маск, если ты это читаешь, то пожалуйста увеличь межстрочное расстояние в Гроке.
​Z-Image: новый стандарт скорости в генерации изображений

​Команда Tongyi-MAI (подразделение Alibaba) представила новую модель Z-Image. Это интересный релиз, который смещает фокус с бесконечного увеличения размеров моделей на оптимизацию архитектуры. Модель имеет 6 миллиардов параметров, что делает ее относительно легкой по сравнению с современными гигантами, но при этом она демонстрирует высокую производительность.

​Главная техническая особенность Z-Image — архитектура Single-Stream DiT (Diffusion Transformer). В отличие от классических подходов, где текстовые и визуальные данные обрабатываются раздельно, здесь все токены проходят через единый поток трансформера. Это решение, в связке с технологией дистилляции, позволяет модели генерировать качественные изображения всего за 8 шагов сэмплинга.

​С практической точки зрения это дает огромный прирост скорости. На топовых видеокартах уровня RTX 4090 генерация занимает доли секунды, но даже на картах среднего сегмента (с 12–16 ГБ VRAM) модель работает очень быстро. Это позволяет генерировать десятки вариантов за то время, которое обычно уходит на один рендер в более тяжелых нейросетях.

​По качеству Z-Image показывает отличные результаты в фотореализме и работе с текстом. Модель хорошо понимает сложные промпты и корректно отображает надписи на английском и китайском языках. Также существует версия Z-Image-Edit, специально обученная для задач инпейнтинга и редактирования изображений.

​Для дизайнера Z-Image становится идеальным инструментом для этапа идеции и драфтов. Она позволяет мгновенно визуализировать концепции, проверять композицию и создавать мокапы, не перегружая рабочую станцию. Это не замена тяжелым художественным моделям, а скорее их быстрое и эффективное дополнение.

Ботликер
👍1
Сравнение Z-Image и Flux 2

​Помимо гугловского прорыва и обновлений ЧатГПТ с Гроком, ноябрь принес нам ещё два значимых релиза: Z-Image от Tongyi и вторую версию Flux от Black Forest Labs. Несмотря на то, что обе модели вышли практически одновременно, они нацелены на совершенно разные задачи и сценарии использования. Попробуем разобраться, в чем их ключевые различия.

​Flux 2 позиционируется как инструмент для финального продакшена. Его главные преимущества — это поддержка нативного разрешения до 4 мегапикселей и невероятная детализация текстур и кожи. Также модель получила функцию Multi-Reference, позволяющую использовать до 10 референсов для сохранения идентичности персонажа или стиля, и поддержку точных HEX-кодов цветов. Однако за это приходится платить высокими требованиями к железу: для комфортной работы рекомендуется 24 ГБ видеопамяти.

​Z-Image, напротив, делает ставку на скорость и доступность. Модель требует значительно меньше ресурсов (комфортно работает на 12–16 ГБ VRAM) и генерирует изображения за считанные секунды благодаря архитектуре Turbo (всего 8 шагов). Она уступает Flux 2 в художественной гибкости и макро-детализации, но выигрывает в скорости итераций.

​Если говорить о применении в работе, то Z-Image идеально подходит для "черновой" работы: брейншторминга, быстрой генерации логотипов, поиска композиции и создания большого количества вариаций за короткое время. Это инструмент для тех случаев, когда скорость важнее пиксельной точности. ​Flux 2 остается выбором для финальных рендеров, где требуется максимальное качество, сложное освещение и работа с высоким разрешением.

Оптимальный рабочий процесс сегодня, если юзать обе нейронки, это использование Z-Image для поиска идеи и Flux 2 для ее чистовой реализации. Но лично я с удовольствием перешел на стек Z-Image + Nano Banana Pro. Как будто при такой комбинации Флюкс не нужен вообще, и не дает такого прироста качества за свои 20% скидки в сравнении с бананой.

Ботликер
2👌1
Как начать пользоваться Z-Image

​На данный момент самым стабильным способом протестировать Z-Image локально является среда ComfyUI. Поддержка в других интерфейсах (например, A1111) пока ограничена, поэтому рекомендую использовать именно нодовую систему. Перед установкой обязательно обновите ComfyUI до последней версии.

​Для работы вам понадобятся три файла, которые можно найти на Hugging Face в репозитории Comfy-Org/z_image_turbo.

Во-первых, это сама модель (файл z_image_turbo_bf16.safetensors), которую нужно поместить в папку checkpoints.

Во-вторых, текстовый энкодер qwen_3_4b.safetensors — его кладем в папку text_encoders или clip.

И в-третьих, VAE-декодер ae.safetensors, который отправляется в папку vae.

​Важный нюанс: модель не запустится со стандартным графом. Вам потребуется специальный workflow.json (или изображение с метаданными), который также доступен в официальном репозитории или на GitHub разработчиков. Просто перетащите этот файл в окно ComfyUI, и все необходимые ноды выстроятся автоматически.

​Убедитесь, что в нодах загрузки выбраны скачанные вами файлы. Для корректной работы Turbo-версии выставляйте 8 шагов сэмплинга (Steps) и низкое значение CFG (около 1.0–2.0). В качестве семплера лучше всего подходят euler или dpmpp_2m.

​Если у вас нет возможности установить модель локально, ее можно протестировать через облачные сервисы вроде Fal.ai или Hugging Face Spaces, но локальная установка даст максимальную скорость и контроль над процессом (если вы понимаете, о чём я).

Ботликер
В общем, сразу после огненного релиза Нано Бананы Про, которая перенесла качество жизни и работы дизайнеров выше на порядок, мы также имеем ни чуть не менее огненный релиз п р и м е р н о такого же по качеству Z-Image, который БЕСПЛАТНЫЙ, ЛОКАЛЬНЫЙ, БЫСТРЫЙ И НЕЗАЦЕНЗУРЕННЫЙ (уже есть много порнолор).
👨‍💻1