Банана это конечно хорошо, но я знаю, как проведу эту субботу. Z-Image... Будет некоторое количество постов. Модель КРАЙНЕ хороша.
👍3
Какое же дикое УДОВОЛЬСТВИЕ общаться с Gemini 3. Мы удивлялись ЧатГПТ в 2023, но сейчас это буквально пропасть. Настолько адекватная, нативная, оригинальная, богатая и уникальная речь вышла. А ведь я её даже не настраивал под себя.
А ещё очень мило и убедительно перечет. И надежды разрушает. Оно и хорошо.
Ботликер
А ещё очень мило и убедительно перечет. И надежды разрушает. Оно и хорошо.
Ботликер
❤4🙈1
Маск, если ты это читаешь, то пожалуйста увеличь межстрочное расстояние в Гроке.
Z-Image: новый стандарт скорости в генерации изображений
Команда Tongyi-MAI (подразделение Alibaba) представила новую модель Z-Image. Это интересный релиз, который смещает фокус с бесконечного увеличения размеров моделей на оптимизацию архитектуры. Модель имеет 6 миллиардов параметров, что делает ее относительно легкой по сравнению с современными гигантами, но при этом она демонстрирует высокую производительность.
Главная техническая особенность Z-Image — архитектура Single-Stream DiT (Diffusion Transformer). В отличие от классических подходов, где текстовые и визуальные данные обрабатываются раздельно, здесь все токены проходят через единый поток трансформера. Это решение, в связке с технологией дистилляции, позволяет модели генерировать качественные изображения всего за 8 шагов сэмплинга.
С практической точки зрения это дает огромный прирост скорости. На топовых видеокартах уровня RTX 4090 генерация занимает доли секунды, но даже на картах среднего сегмента (с 12–16 ГБ VRAM) модель работает очень быстро. Это позволяет генерировать десятки вариантов за то время, которое обычно уходит на один рендер в более тяжелых нейросетях.
По качеству Z-Image показывает отличные результаты в фотореализме и работе с текстом. Модель хорошо понимает сложные промпты и корректно отображает надписи на английском и китайском языках. Также существует версия Z-Image-Edit, специально обученная для задач инпейнтинга и редактирования изображений.
Для дизайнера Z-Image становится идеальным инструментом для этапа идеции и драфтов. Она позволяет мгновенно визуализировать концепции, проверять композицию и создавать мокапы, не перегружая рабочую станцию. Это не замена тяжелым художественным моделям, а скорее их быстрое и эффективное дополнение.
Ботликер
Команда Tongyi-MAI (подразделение Alibaba) представила новую модель Z-Image. Это интересный релиз, который смещает фокус с бесконечного увеличения размеров моделей на оптимизацию архитектуры. Модель имеет 6 миллиардов параметров, что делает ее относительно легкой по сравнению с современными гигантами, но при этом она демонстрирует высокую производительность.
Главная техническая особенность Z-Image — архитектура Single-Stream DiT (Diffusion Transformer). В отличие от классических подходов, где текстовые и визуальные данные обрабатываются раздельно, здесь все токены проходят через единый поток трансформера. Это решение, в связке с технологией дистилляции, позволяет модели генерировать качественные изображения всего за 8 шагов сэмплинга.
С практической точки зрения это дает огромный прирост скорости. На топовых видеокартах уровня RTX 4090 генерация занимает доли секунды, но даже на картах среднего сегмента (с 12–16 ГБ VRAM) модель работает очень быстро. Это позволяет генерировать десятки вариантов за то время, которое обычно уходит на один рендер в более тяжелых нейросетях.
По качеству Z-Image показывает отличные результаты в фотореализме и работе с текстом. Модель хорошо понимает сложные промпты и корректно отображает надписи на английском и китайском языках. Также существует версия Z-Image-Edit, специально обученная для задач инпейнтинга и редактирования изображений.
Для дизайнера Z-Image становится идеальным инструментом для этапа идеции и драфтов. Она позволяет мгновенно визуализировать концепции, проверять композицию и создавать мокапы, не перегружая рабочую станцию. Это не замена тяжелым художественным моделям, а скорее их быстрое и эффективное дополнение.
Ботликер
👍1
Сравнение Z-Image и Flux 2
Помимо гугловского прорыва и обновлений ЧатГПТ с Гроком, ноябрь принес нам ещё два значимых релиза: Z-Image от Tongyi и вторую версию Flux от Black Forest Labs. Несмотря на то, что обе модели вышли практически одновременно, они нацелены на совершенно разные задачи и сценарии использования. Попробуем разобраться, в чем их ключевые различия.
Flux 2 позиционируется как инструмент для финального продакшена. Его главные преимущества — это поддержка нативного разрешения до 4 мегапикселей и невероятная детализация текстур и кожи. Также модель получила функцию Multi-Reference, позволяющую использовать до 10 референсов для сохранения идентичности персонажа или стиля, и поддержку точных HEX-кодов цветов. Однако за это приходится платить высокими требованиями к железу: для комфортной работы рекомендуется 24 ГБ видеопамяти.
Z-Image, напротив, делает ставку на скорость и доступность. Модель требует значительно меньше ресурсов (комфортно работает на 12–16 ГБ VRAM) и генерирует изображения за считанные секунды благодаря архитектуре Turbo (всего 8 шагов). Она уступает Flux 2 в художественной гибкости и макро-детализации, но выигрывает в скорости итераций.
Если говорить о применении в работе, то Z-Image идеально подходит для "черновой" работы: брейншторминга, быстрой генерации логотипов, поиска композиции и создания большого количества вариаций за короткое время. Это инструмент для тех случаев, когда скорость важнее пиксельной точности. Flux 2 остается выбором для финальных рендеров, где требуется максимальное качество, сложное освещение и работа с высоким разрешением.
Оптимальный рабочий процесс сегодня, если юзать обе нейронки, это использование Z-Image для поиска идеи и Flux 2 для ее чистовой реализации. Но лично я с удовольствием перешел на стек Z-Image + Nano Banana Pro. Как будто при такой комбинации Флюкс не нужен вообще, и не дает такого прироста качества за свои 20% скидки в сравнении с бананой.
Ботликер
Помимо гугловского прорыва и обновлений ЧатГПТ с Гроком, ноябрь принес нам ещё два значимых релиза: Z-Image от Tongyi и вторую версию Flux от Black Forest Labs. Несмотря на то, что обе модели вышли практически одновременно, они нацелены на совершенно разные задачи и сценарии использования. Попробуем разобраться, в чем их ключевые различия.
Flux 2 позиционируется как инструмент для финального продакшена. Его главные преимущества — это поддержка нативного разрешения до 4 мегапикселей и невероятная детализация текстур и кожи. Также модель получила функцию Multi-Reference, позволяющую использовать до 10 референсов для сохранения идентичности персонажа или стиля, и поддержку точных HEX-кодов цветов. Однако за это приходится платить высокими требованиями к железу: для комфортной работы рекомендуется 24 ГБ видеопамяти.
Z-Image, напротив, делает ставку на скорость и доступность. Модель требует значительно меньше ресурсов (комфортно работает на 12–16 ГБ VRAM) и генерирует изображения за считанные секунды благодаря архитектуре Turbo (всего 8 шагов). Она уступает Flux 2 в художественной гибкости и макро-детализации, но выигрывает в скорости итераций.
Если говорить о применении в работе, то Z-Image идеально подходит для "черновой" работы: брейншторминга, быстрой генерации логотипов, поиска композиции и создания большого количества вариаций за короткое время. Это инструмент для тех случаев, когда скорость важнее пиксельной точности. Flux 2 остается выбором для финальных рендеров, где требуется максимальное качество, сложное освещение и работа с высоким разрешением.
Оптимальный рабочий процесс сегодня, если юзать обе нейронки, это использование Z-Image для поиска идеи и Flux 2 для ее чистовой реализации. Но лично я с удовольствием перешел на стек Z-Image + Nano Banana Pro. Как будто при такой комбинации Флюкс не нужен вообще, и не дает такого прироста качества за свои 20% скидки в сравнении с бананой.
Ботликер
❤2👌1
Как начать пользоваться Z-Image
На данный момент самым стабильным способом протестировать Z-Image локально является среда ComfyUI. Поддержка в других интерфейсах (например, A1111) пока ограничена, поэтому рекомендую использовать именно нодовую систему. Перед установкой обязательно обновите ComfyUI до последней версии.
Для работы вам понадобятся три файла, которые можно найти на Hugging Face в репозитории Comfy-Org/z_image_turbo.
Во-первых, это сама модель (файл z_image_turbo_bf16.safetensors), которую нужно поместить в папку checkpoints.
Во-вторых, текстовый энкодер qwen_3_4b.safetensors — его кладем в папку text_encoders или clip.
И в-третьих, VAE-декодер ae.safetensors, который отправляется в папку vae.
Важный нюанс: модель не запустится со стандартным графом. Вам потребуется специальный workflow.json (или изображение с метаданными), который также доступен в официальном репозитории или на GitHub разработчиков. Просто перетащите этот файл в окно ComfyUI, и все необходимые ноды выстроятся автоматически.
Убедитесь, что в нодах загрузки выбраны скачанные вами файлы. Для корректной работы Turbo-версии выставляйте 8 шагов сэмплинга (Steps) и низкое значение CFG (около 1.0–2.0). В качестве семплера лучше всего подходят euler или dpmpp_2m.
Если у вас нет возможности установить модель локально, ее можно протестировать через облачные сервисы вроде Fal.ai или Hugging Face Spaces, но локальная установка даст максимальную скорость и контроль над процессом (если вы понимаете, о чём я).
Ботликер
На данный момент самым стабильным способом протестировать Z-Image локально является среда ComfyUI. Поддержка в других интерфейсах (например, A1111) пока ограничена, поэтому рекомендую использовать именно нодовую систему. Перед установкой обязательно обновите ComfyUI до последней версии.
Для работы вам понадобятся три файла, которые можно найти на Hugging Face в репозитории Comfy-Org/z_image_turbo.
Во-первых, это сама модель (файл z_image_turbo_bf16.safetensors), которую нужно поместить в папку checkpoints.
Во-вторых, текстовый энкодер qwen_3_4b.safetensors — его кладем в папку text_encoders или clip.
И в-третьих, VAE-декодер ae.safetensors, который отправляется в папку vae.
Важный нюанс: модель не запустится со стандартным графом. Вам потребуется специальный workflow.json (или изображение с метаданными), который также доступен в официальном репозитории или на GitHub разработчиков. Просто перетащите этот файл в окно ComfyUI, и все необходимые ноды выстроятся автоматически.
Убедитесь, что в нодах загрузки выбраны скачанные вами файлы. Для корректной работы Turbo-версии выставляйте 8 шагов сэмплинга (Steps) и низкое значение CFG (около 1.0–2.0). В качестве семплера лучше всего подходят euler или dpmpp_2m.
Если у вас нет возможности установить модель локально, ее можно протестировать через облачные сервисы вроде Fal.ai или Hugging Face Spaces, но локальная установка даст максимальную скорость и контроль над процессом (если вы понимаете, о чём я).
Ботликер
В общем, сразу после огненного релиза Нано Бананы Про, которая перенесла качество жизни и работы дизайнеров выше на порядок, мы также имеем ни чуть не менее огненный релиз п р и м е р н о такого же по качеству Z-Image, который БЕСПЛАТНЫЙ, ЛОКАЛЬНЫЙ, БЫСТРЫЙ И НЕЗАЦЕНЗУРЕННЫЙ (уже есть много порнолор).
👨💻1
Если кому надо совершенно бесплатно и очень быстро генерить картинки на конкретную тематику (известные спортсмены, марки автомобилей, определенная айдентика), то идите сюда — вам расскажут как тренировать свои лоры для Z-Image.
Ботликер
Ботликер
YouTube
How to Train a Z-Image-Turbo LoRA with AI Toolkit
How to Train a Z-Image-Turbo LoRA with AI Toolkit using a de-distill training adapter. In this tutorial we train a style LoRA in the style of children's artwork.
Support me - https://ostris.com/support
Children's Drawings LoRA - https://huggingface.co/…
Support me - https://ostris.com/support
Children's Drawings LoRA - https://huggingface.co/…
Но, конечно, опенсорс как обычно немного опаздывает. Если ещё месяц назад даже в Банане были проблемы с генерацией известных личностей или марок автомобилей, то теперь Банан Про справляется с этим прекрасно. Даже референсы кидать зачастую не надо, он в лицо знает третьесортных селебрити.
Хотя, вот с генерацией аутентичной Алматы Банан не сильно справляется, как и с картинками 18+.
Ботликер
Хотя, вот с генерацией аутентичной Алматы Банан не сильно справляется, как и с картинками 18+.
Ботликер
❤1