#токен
371 стиль художников и режиссёров. Протестировано на Midjourney, но должно работать и в Stable Diffusion.
https://docs.google.com/spreadsheets/d/16KKh1FQmd-r98K9aWPBux5m9lc9PCV_T1AWgU54qXm8/edit#gid=0
Зачем я снова и снова публикую подборки токенов стилей? Причин две:
1. Не у всех есть терпение и желание рисовать гриды на тысячи рисунков. А пополнять ассортимент стилей надо. Подборки — самый простой способ получить желаемое.
2. Результаты каждого теста уникальны. В одном тесте токен не проявил себя, в другом выдал лучший результат и обратил на себя внимание.
Все посты с подборками стилей.
_____
Stable Diffusion: инструменты, расширения, модели, токены
371 стиль художников и режиссёров. Протестировано на Midjourney, но должно работать и в Stable Diffusion.
https://docs.google.com/spreadsheets/d/16KKh1FQmd-r98K9aWPBux5m9lc9PCV_T1AWgU54qXm8/edit#gid=0
Зачем я снова и снова публикую подборки токенов стилей? Причин две:
1. Не у всех есть терпение и желание рисовать гриды на тысячи рисунков. А пополнять ассортимент стилей надо. Подборки — самый простой способ получить желаемое.
2. Результаты каждого теста уникальны. В одном тесте токен не проявил себя, в другом выдал лучший результат и обратил на себя внимание.
Все посты с подборками стилей.
_____
Stable Diffusion: инструменты, расширения, модели, токены
#дайджест #токен
Все подборки токенов стилей художников, фотографов или инструментов рисования в одном посте (будет постоянно обновляться).
• Подборка из 1572 художников
• 2384 стиля Midjourney, которые поймёт Stable Diffusion
• 706 художников, 33 стиля, 19 направлений
• 364 плёнки для имитации стиля аналоговой фотографии
• 371 стиль фотографов и режиссёров
• 264 техники рисования, 1800 имён художников, 400 фотографов, 100 промптов с фильтрами для фото
Зачем я снова и снова публикую подборки токенов стилей? Причин две:
1. Не у всех есть терпение и желание рисовать гриды на тысячи рисунков. А пополнять ассортимент стилей надо. Подборки — самый простой способ получить желаемое.
2. Результаты каждого теста уникальны. В одном тесте токен не проявил себя, в другом выдал лучший результат и обратил на себя внимание.
____
У капибары лапки • подписаться
Все подборки токенов стилей художников, фотографов или инструментов рисования в одном посте (будет постоянно обновляться).
• Подборка из 1572 художников
• 2384 стиля Midjourney, которые поймёт Stable Diffusion
• 706 художников, 33 стиля, 19 направлений
• 364 плёнки для имитации стиля аналоговой фотографии
• 371 стиль фотографов и режиссёров
• 264 техники рисования, 1800 имён художников, 400 фотографов, 100 промптов с фильтрами для фото
Зачем я снова и снова публикую подборки токенов стилей? Причин две:
1. Не у всех есть терпение и желание рисовать гриды на тысячи рисунков. А пополнять ассортимент стилей надо. Подборки — самый простой способ получить желаемое.
2. Результаты каждого теста уникальны. В одном тесте токен не проявил себя, в другом выдал лучший результат и обратил на себя внимание.
____
У капибары лапки • подписаться
#заметки #рабочийпроцесс
Последние пару дней тестирую различные промпты и негативы для улучшения результатов на разных аниме моделях.
Самый интересный вывод: общепринятые и очень популярные
При этом негатив
magic
╮( ˘_˘ )╭
____
У капибары лапки • подписаться
Последние пару дней тестирую различные промпты и негативы для улучшения результатов на разных аниме моделях.
Самый интересный вывод: общепринятые и очень популярные
(masterpiece, best quality)
, даже с повышением веса до 1.3, не улучшают картинку. С тем же успехом можно добавить в промпт пару запятых, это тоже как-то поменяет детали или композицию.При этом негатив
(worst quality, low quality)
результаты улучшает. Можно даже повышать вес до 1.3-1.4.╮( ˘_˘ )╭
У капибары лапки • подписаться
capybara_and_witches.zip
31.3 MB
Таблица, созданная в расширении Infinity Grid Generator (обзор)
#расширение
Infinity Grid Generator
https://github.com/mcmonkeyprojects/sd-infinity-grid-generator-script
Улучшенная версия матрицы XYZ, с возможностью задать более трёх осей (максимум 16!) для тестирования промптов и настроек генерации.
Позволяет создавать и использовать шаблон таблицы, чтобы не вводить вручную параметры при проведении однотипных тестов. При добавлении новых полей может дописывать данные в существующую таблицу вместо повторной генерации новой таблицы.
Скриншот таблицы не покажет глубины удобства (или безумия?) расширения. Чтобы понять как это работает лучше посмотреть готовую таблицу. Для просмотра откройте файл index.html в браузере.
Настройки расширения
• Select grid definition file
Выбор файла конфигурации, на основе которого создаётся таблица.
Create in UI — настройка всех параметров вручную в интерфейсе, по аналогии с XYZ-plot
• Output folder name
Имя папки с файлами и таблицей.
• Overwrite existing images (for updating grids)
Позволяет перезаписать данные в уже существующей таблице.
• Do a dry run to validate your grid file
Запуск без генерации изображений, по умолчанию выключен. Необходим для тестирования корректности конфигурационного файла или введённых в интерфейс данных.
• Use more-performant skipping
Не совсем понял что делает эта настройка, поэтому по умолчанию не включаю.
• Generate infinite-grid webviewer page
Создаёт веб-страницу для работы со сгенерированной таблицей. По умолчанию включено.
• Validate PromptReplace input
Проверяет данные если вы выбрали PromptReplace (замена части промпта).
• Publish full generation metadata for viewing on-page
Добавление всех мета-данных в таблицу
Шаблоны таблиц
Шаблоны хранятся в папке
Расширение хорошо документировано, больше информации можно получить в гитхабе проекта. Я пока не пробовал создавать сложные структуры, но в комментариях смогу ответить на ваши вопросы.
Недостатки расширения
• В отличии от стандартной XYZ не поддерживает более одного изображения на ячейку. Ограничение можно обойти добавлением оси Seed со значениями -1, -1, -1, etc, но это менее удобно.
• Нет селектора для моделей, стилей и VAE. Можно лишь добавить весь список в матрицу и вручную удалить лишнее.
• В интерфейсе отстутствует возможность задать подпись оси. Это может доставить неудобство если у вас более двух осей Prompt Replace.
• Вам надоест искать нужные картинки по папкам, созданным расширением.
___
У капибары лапки • подписаться
Infinity Grid Generator
https://github.com/mcmonkeyprojects/sd-infinity-grid-generator-script
Улучшенная версия матрицы XYZ, с возможностью задать более трёх осей (максимум 16!) для тестирования промптов и настроек генерации.
Позволяет создавать и использовать шаблон таблицы, чтобы не вводить вручную параметры при проведении однотипных тестов. При добавлении новых полей может дописывать данные в существующую таблицу вместо повторной генерации новой таблицы.
Скриншот таблицы не покажет глубины удобства (или безумия?) расширения. Чтобы понять как это работает лучше посмотреть готовую таблицу. Для просмотра откройте файл index.html в браузере.
Настройки расширения
• Select grid definition file
Выбор файла конфигурации, на основе которого создаётся таблица.
Create in UI — настройка всех параметров вручную в интерфейсе, по аналогии с XYZ-plot
• Output folder name
Имя папки с файлами и таблицей.
• Overwrite existing images (for updating grids)
Позволяет перезаписать данные в уже существующей таблице.
• Do a dry run to validate your grid file
Запуск без генерации изображений, по умолчанию выключен. Необходим для тестирования корректности конфигурационного файла или введённых в интерфейс данных.
• Use more-performant skipping
Не совсем понял что делает эта настройка, поэтому по умолчанию не включаю.
• Generate infinite-grid webviewer page
Создаёт веб-страницу для работы со сгенерированной таблицей. По умолчанию включено.
• Validate PromptReplace input
Проверяет данные если вы выбрали PromptReplace (замена части промпта).
• Publish full generation metadata for viewing on-page
Добавление всех мета-данных в таблицу
Шаблоны таблиц
Шаблоны хранятся в папке
\extensions\sd-infinity-grid-generator-script\assets
Структура таблицы описывается в формате yaml
, в файлах short_example.yml
и megagrid.yml
лежат примеры сложного оформления. Простой шаблон можно получить при генерации пустой таблицы (файл config.yml
в корне папки с таблицей).Расширение хорошо документировано, больше информации можно получить в гитхабе проекта. Я пока не пробовал создавать сложные структуры, но в комментариях смогу ответить на ваши вопросы.
Недостатки расширения
• В отличии от стандартной XYZ не поддерживает более одного изображения на ячейку. Ограничение можно обойти добавлением оси Seed со значениями -1, -1, -1, etc, но это менее удобно.
• Нет селектора для моделей, стилей и VAE. Можно лишь добавить весь список в матрицу и вручную удалить лишнее.
• В интерфейсе отстутствует возможность задать подпись оси. Это может доставить неудобство если у вас более двух осей Prompt Replace.
• Вам надоест искать нужные картинки по папкам, созданным расширением.
___
У капибары лапки • подписаться
#Automatic1111
Вышло обновление Automatic1111 Web UI, версия 1.5.0
Я рискнул сразу обновить основную версию WebUI и (вроде) пока ничего не отвалилось. ControlNet, ADetailer, Canvas Zoom, Negative Prompt Weight и стандартные скрипты работают.
Дополнено: перестал работать DAAM.
Дополнено 2: обновление может выпасть в ошибку если у вас есть установленные нестандартным способом расширения.
Но правильнее выждать перед обновлением день-два, чтобы быть уверенным что ничего не поломалось.
Важные и заметные на глаз изменения
— Поддержка SDXL.
— Редактор мета-данных скачанных LoRA: возможность сохранить в виде пресета стандартные настройки (токен активации, веса, тэги) и получить информацию о настройках тренировки в человеко-читаемом формате.
— Горячие клавиши для перемещения токена внутри промпта (alt + стрелки влево/вправо).
— Поддержка LyCORIS встроена в стандартное расширение LoRA
— img2img при пакетной обработке получил возможность читать метаданные из изображений и работать с подкаталогами.
— Настройка для изменения цветов фона гридов (xyz-plot).
— Автоматическое переключение на 32-х битное пространство если VAE выдаёт ошибку и просит прописать ключ --no-half-vae.
Всякие мелочи
— В каталоге расширений отображается количество звёзд репозитория на гитхабе. Показатель совершенно бесполезный, но он есть.
— Улучшено отображение информации о затраченном на рисование времени и использовании VRAM.
— Информация о хэше использованных текстовых инверсий добавлена в метаданные.
— Возможность добавить пользователя gradio (?) в название файла и метаданные.
— Запуск ускорен на пару секунд, т.к. отключена попытка установить уже установленные пакеты.
— Чекбокс выбора всех установленных расширений на вкладке расширений.
— 9 пунктов, связанных с разработкой расширений и работой с API.
— 17 пунктов багфиксов, всякие минорные мелочи.
Полный список изменений можно посмотреть в репозитории проекта.
___
У капибары лапки • подписаться
Вышло обновление Automatic1111 Web UI, версия 1.5.0
Я рискнул сразу обновить основную версию WebUI и (вроде) пока ничего не отвалилось. ControlNet, ADetailer, Canvas Zoom, Negative Prompt Weight и стандартные скрипты работают.
Дополнено: перестал работать DAAM.
Дополнено 2: обновление может выпасть в ошибку если у вас есть установленные нестандартным способом расширения.
Но правильнее выждать перед обновлением день-два, чтобы быть уверенным что ничего не поломалось.
Важные и заметные на глаз изменения
— Поддержка SDXL.
— Редактор мета-данных скачанных LoRA: возможность сохранить в виде пресета стандартные настройки (токен активации, веса, тэги) и получить информацию о настройках тренировки в человеко-читаемом формате.
— Горячие клавиши для перемещения токена внутри промпта (alt + стрелки влево/вправо).
— Поддержка LyCORIS встроена в стандартное расширение LoRA
— img2img при пакетной обработке получил возможность читать метаданные из изображений и работать с подкаталогами.
— Настройка для изменения цветов фона гридов (xyz-plot).
— Автоматическое переключение на 32-х битное пространство если VAE выдаёт ошибку и просит прописать ключ --no-half-vae.
Всякие мелочи
— В каталоге расширений отображается количество звёзд репозитория на гитхабе. Показатель совершенно бесполезный, но он есть.
— Улучшено отображение информации о затраченном на рисование времени и использовании VRAM.
— Информация о хэше использованных текстовых инверсий добавлена в метаданные.
— Возможность добавить пользователя gradio (?) в название файла и метаданные.
— Запуск ускорен на пару секунд, т.к. отключена попытка установить уже установленные пакеты.
— Чекбокс выбора всех установленных расширений на вкладке расширений.
— 9 пунктов, связанных с разработкой расширений и работой с API.
— 17 пунктов багфиксов, всякие минорные мелочи.
Полный список изменений можно посмотреть в репозитории проекта.
___
У капибары лапки • подписаться
This media is not supported in your browser
VIEW IN TELEGRAM
#заметки #Automatic1111
Последние несколько дней по работе пишу и редактирую огромное количество самых разных промптов.
Возможность передвигать токены комбинацией клавиш Alt + стрелки (влево/вправо), добавленная в версии 1.5.0 WebUI, оказалась лучшей новинкой из всего списка улучшений.
На втором месте пресеты для лоры.
У капибары лапки • подписаться
Последние несколько дней по работе пишу и редактирую огромное количество самых разных промптов.
Возможность передвигать токены комбинацией клавиш Alt + стрелки (влево/вправо), добавленная в версии 1.5.0 WebUI, оказалась лучшей новинкой из всего списка улучшений.
На втором месте пресеты для лоры.
У капибары лапки • подписаться
#SDXL #мысливслух
В новостях пишут, что вышла долгожданная SDXL 1.0.
Поддержка (вернее "поддержка") SDXL в Automatic1111 WebUI реализована каким-то особым человеконенавистническим способом. Не рекомендую тратить на это время и нервы.
Хотите опробовать горячую новинку (модель, рефайнер, вае) — воспользуйтесь отдельно установленным ComfyUI (инструкция по установке, воркфлоу). Результаты вас приятно удивят.
Основное, что стоит знать про SDXL сейчас:
— Базовая модель имеет фундаментальный дефект: из-за отсутствия в датасете обнажённых тел люди, даже одетые, не всегда получаются удачными. Прочих NSFW ограничений нет: зомби и кровища рисуются как и на 1.5.
— SDXL рисует в огромных, по меркам 1.5, размерах без проблем с построением композиции, без искажения тел и без дублирования объектов. Условные 1920х1080 можно рисовать сразу, без апскейла.
— Процесс написания промптов аналогичен принципам 1.5, но ваши промпты могут значительно отличаться от результатов файнтюнов 1.5.
— LoRA от 1.5 и 2.1 не совместимы с SDXL.
— SDXL уже поддерживается в kohya-ss, какие-то LoRA и тренированные модели уже есть на civitai. При желании вы можете дообучить лору или модель сами.
— Модели ControlNet 1.1 не совместимы с SDXL.
— Нет, пальцы оно всё ещё не умеет рисовать.
Надо ждать дообученных и перебалансированных моделей, как было с 1.5.
У капибары лапки • подписаться
В новостях пишут, что вышла долгожданная SDXL 1.0.
Поддержка (вернее "поддержка") SDXL в Automatic1111 WebUI реализована каким-то особым человеконенавистническим способом. Не рекомендую тратить на это время и нервы.
Хотите опробовать горячую новинку (модель, рефайнер, вае) — воспользуйтесь отдельно установленным ComfyUI (инструкция по установке, воркфлоу). Результаты вас приятно удивят.
Основное, что стоит знать про SDXL сейчас:
— Базовая модель имеет фундаментальный дефект: из-за отсутствия в датасете обнажённых тел люди, даже одетые, не всегда получаются удачными. Прочих NSFW ограничений нет: зомби и кровища рисуются как и на 1.5.
— SDXL рисует в огромных, по меркам 1.5, размерах без проблем с построением композиции, без искажения тел и без дублирования объектов. Условные 1920х1080 можно рисовать сразу, без апскейла.
— Процесс написания промптов аналогичен принципам 1.5, но ваши промпты могут значительно отличаться от результатов файнтюнов 1.5.
— LoRA от 1.5 и 2.1 не совместимы с SDXL.
— SDXL уже поддерживается в kohya-ss, какие-то LoRA и тренированные модели уже есть на civitai. При желании вы можете дообучить лору или модель сами.
— Модели ControlNet 1.1 не совместимы с SDXL.
— Нет, пальцы оно всё ещё не умеет рисовать.
Надо ждать дообученных и перебалансированных моделей, как было с 1.5.
У капибары лапки • подписаться
#заметки #SDXL #ComfyUI
Воркфлоу для рисования на SDXL от автора ComfyUI
1. Скачайте изображение.
2. Перетащите файл в окно ComfyUI.
3. Не забудьте поменять настройки KSampler Base и KSampler Refiner (sampler, cfg)
— dpmpp = dpm++
— задайте scheduler = karras, чтобы рисовать на семплерах karras или normal для прочих
Воркфлоу хорошо задокументирован и поможет лучше понять что происходит на каждом этапе.
Результат стоит того, чтобы не воевать с автоматиком (рисовать на модели, затем вручную через img2img улучшать результат на рефейнере) а сразу всё делать на ComfyUI.
• скачать SDXL (модель, рефайнер, вае)
• инструкция по установке ComfyUI
____
У капибары лапки • подписаться
Воркфлоу для рисования на SDXL от автора ComfyUI
1. Скачайте изображение.
2. Перетащите файл в окно ComfyUI.
3. Не забудьте поменять настройки KSampler Base и KSampler Refiner (sampler, cfg)
— dpmpp = dpm++
— задайте scheduler = karras, чтобы рисовать на семплерах karras или normal для прочих
Воркфлоу хорошо задокументирован и поможет лучше понять что происходит на каждом этапе.
Результат стоит того, чтобы не воевать с автоматиком (рисовать на модели, затем вручную через img2img улучшать результат на рефейнере) а сразу всё делать на ComfyUI.
• скачать SDXL (модель, рефайнер, вае)
• инструкция по установке ComfyUI
____
У капибары лапки • подписаться
#расширение
Config Presets
https://github.com/Zyin055/Config-Presets
Расширение для сохранения настроек параметров генерации и переключения между пресетами в один клик. Будет полезно для хранения настроек генерации разных моделей, пайплайнов апскейла и инпейнта или пайплайнов более сложных процессов.
Алгоритм настройки необычайно прост:
1.В интерфейсе WebUI задаёте нужные параметры.
2. В расширении отмечаете какие из параметров необходимо сохранить.
3. Вводите имя пресета и сохраняете.
Особенности расширения
• Работает с txt2img и img2img.
• Помимо настроек генерации может сохранять параметры расширений ControlNet, ADetailer, Latent Couple, Tiled Diffusion.
• Для подключения и сохранения дополнительных настроек необходимо нажать кнопку "Add Custom Fields" и при редактировании текстового файла удалить символ # в начале строк с нужными вами параметрами.
• В теории может хранить настройки любых расширений или скриптов, если они прописывают параметры в ui-config.json. Но здесь нужны эксперименты.
Расширение не запустится и в консоли будет написано какой именно параметр привёл к сбою, если вы напишите что-то не так.
• Сохраняет содержимое матрицы XYZ.
• Хранит файлы конфигурации в \stable-diffusion-webui\extensions\Config-Presets, при необходимости их можно править вручную.
Недостатки расширения
• Не умеет переключать модели и VAE.
• Не умеет изменять уровень Clip skip.
• Не запоминает содержимое матрицы XYZ если поле заполняется из выпадающего списка (модели, стили, etc).
• Не умеет настраивать семплер для хайреза (или я не разобрался где и как это сделать).
____
У капибары лапки • подписаться
Config Presets
https://github.com/Zyin055/Config-Presets
Расширение для сохранения настроек параметров генерации и переключения между пресетами в один клик. Будет полезно для хранения настроек генерации разных моделей, пайплайнов апскейла и инпейнта или пайплайнов более сложных процессов.
Алгоритм настройки необычайно прост:
1.В интерфейсе WebUI задаёте нужные параметры.
2. В расширении отмечаете какие из параметров необходимо сохранить.
3. Вводите имя пресета и сохраняете.
Особенности расширения
• Работает с txt2img и img2img.
• Помимо настроек генерации может сохранять параметры расширений ControlNet, ADetailer, Latent Couple, Tiled Diffusion.
• Для подключения и сохранения дополнительных настроек необходимо нажать кнопку "Add Custom Fields" и при редактировании текстового файла удалить символ # в начале строк с нужными вами параметрами.
• В теории может хранить настройки любых расширений или скриптов, если они прописывают параметры в ui-config.json. Но здесь нужны эксперименты.
Расширение не запустится и в консоли будет написано какой именно параметр привёл к сбою, если вы напишите что-то не так.
• Сохраняет содержимое матрицы XYZ.
• Хранит файлы конфигурации в \stable-diffusion-webui\extensions\Config-Presets, при необходимости их можно править вручную.
Недостатки расширения
• Не умеет переключать модели и VAE.
• Не умеет изменять уровень Clip skip.
• Не запоминает содержимое матрицы XYZ если поле заполняется из выпадающего списка (модели, стили, etc).
• Не умеет настраивать семплер для хайреза (или я не разобрался где и как это сделать).
____
У капибары лапки • подписаться
#обзор #SDXL
Сравнил как рисуют SDXL 0.9 и SDXL 1.0 на двух разных воркфлоу. (больше примеров в статье по ссылке).
Добавил инструкцию как скачать SDXL, установить ComfyUI и настроить пайплайны рисования.
Читать на DTF | Пикабу
____
У капибары лапки • подписаться
Сравнил как рисуют SDXL 0.9 и SDXL 1.0 на двух разных воркфлоу. (больше примеров в статье по ссылке).
Добавил инструкцию как скачать SDXL, установить ComfyUI и настроить пайплайны рисования.
Читать на DTF | Пикабу
____
У капибары лапки • подписаться
#арт #SDXL #мысливслух
На волне хайпа по SDXL 0.9 договорились с Юлией, автором канала "85GB нейронок", совместно написать 9 промптов для SDXL 0.9, нарисовать на привычных каждому инструментах (Юлия через бота в дискорде, я в локальной ComfyUI) и обменяться впечатлениями о процессе рисования и результатах. Из-за моей загруженности как раз успели к релизу 1.0. нот хехе
StabilityAI целились в создание универсальной модели, которая при некотором файн-тюне должна конкурировать с Midjourney, и у них почти получилось.
Даже на коротких промптах модель старается додумать что-то исходя из контекста и улучшить (или "улучшить") результат. Эффект сильнее всего виден на фотографии девушки с мороженым (кадр 4). При добавлении токенов фотографичности (кадры 1 и 7) модель иногда покладисто следовала промпту, иногда не слушалась. Но убедить рисовать что надо оказалось не сложно: дополнительные токены стиля многократно улучшают "фоточковый" стиль модели.
При рисовании иллюстраций модель полностью следовала промпту во всех случаях, кроме аниме (кадр 8). Почему-то имена известных художников аниме, режиссёров или простые токены анимешности не давали желаемого результата. Это похоже на особенность базовой модели: некоторых художников и фотографов оно понимает иначе, чем популярные файнтюны на базе 1.5. Подмечал этот неприятный факт и ранее, но не придавал ему значения.
SDXL унаследовала все родовые болезни от предыдущих SD: избыточное боке, которое затрагивает объект на переднем плане (кадр 1: шерсть котофея в нижней части кадра; кадр 4: левое плечо и левая рука девушки); беды с пальцами и глазами; испорченные мелкие детали.
Но если взять в скобки все недостатки — модель получилась отличная, на несколько голов выше 1.5.
С нетерпением жду дообученных моделей от сообщества.
И с ещё большим нетерпением жду SDXXL, которая может быть, догонит Midjourney образца 2022-го года.
Промпты ко всем изображениям будут в комментариях к этой записи.
____
У капибары лапки • подписаться
На волне хайпа по SDXL 0.9 договорились с Юлией, автором канала "85GB нейронок", совместно написать 9 промптов для SDXL 0.9, нарисовать на привычных каждому инструментах (Юлия через бота в дискорде, я в локальной ComfyUI) и обменяться впечатлениями о процессе рисования и результатах. Из-за моей загруженности как раз успели к релизу 1.0. нот хехе
StabilityAI целились в создание универсальной модели, которая при некотором файн-тюне должна конкурировать с Midjourney, и у них почти получилось.
Даже на коротких промптах модель старается додумать что-то исходя из контекста и улучшить (или "улучшить") результат. Эффект сильнее всего виден на фотографии девушки с мороженым (кадр 4). При добавлении токенов фотографичности (кадры 1 и 7) модель иногда покладисто следовала промпту, иногда не слушалась. Но убедить рисовать что надо оказалось не сложно: дополнительные токены стиля многократно улучшают "фоточковый" стиль модели.
При рисовании иллюстраций модель полностью следовала промпту во всех случаях, кроме аниме (кадр 8). Почему-то имена известных художников аниме, режиссёров или простые токены анимешности не давали желаемого результата. Это похоже на особенность базовой модели: некоторых художников и фотографов оно понимает иначе, чем популярные файнтюны на базе 1.5. Подмечал этот неприятный факт и ранее, но не придавал ему значения.
SDXL унаследовала все родовые болезни от предыдущих SD: избыточное боке, которое затрагивает объект на переднем плане (кадр 1: шерсть котофея в нижней части кадра; кадр 4: левое плечо и левая рука девушки); беды с пальцами и глазами; испорченные мелкие детали.
Но если взять в скобки все недостатки — модель получилась отличная, на несколько голов выше 1.5.
С нетерпением жду дообученных моделей от сообщества.
И с ещё большим нетерпением жду SDXXL, которая может быть, догонит Midjourney образца 2022-го года.
У капибары лапки • подписаться