У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens
2.35K subscribers
536 photos
5 videos
20 files
237 links
Оглавление и навигация: https://t.me/capybara_paws/32

Консультации и предложения:

Рисую: https://www.artstation.com/capybara_paws
О канале: https://t.me/capybara_paws/2
Download Telegram
#токен

371 стиль художников и режиссёров. Протестировано на Midjourney, но должно работать и в Stable Diffusion.
https://docs.google.com/spreadsheets/d/16KKh1FQmd-r98K9aWPBux5m9lc9PCV_T1AWgU54qXm8/edit#gid=0

Зачем я снова и снова публикую подборки токенов стилей? Причин две:
1. Не у всех есть терпение и желание рисовать гриды на тысячи рисунков. А пополнять ассортимент стилей надо. Подборки — самый простой способ получить желаемое.
2. Результаты каждого теста уникальны. В одном тесте токен не проявил себя, в другом выдал лучший результат и обратил на себя внимание.


Все посты с подборками стилей.

_____
Stable Diffusion: инструменты, расширения, модели, токены
#дайджест #токен

Все подборки токенов стилей художников, фотографов или инструментов рисования в одном посте (будет постоянно обновляться).

• Подборка из 1572 художников
2384 стиля Midjourney, которые поймёт Stable Diffusion
706 художников, 33 стиля, 19 направлений
364 плёнки для имитации стиля аналоговой фотографии
371 стиль фотографов и режиссёров
264 техники рисования, 1800 имён художников, 400 фотографов, 100 промптов с фильтрами для фото

Зачем я снова и снова публикую подборки токенов стилей? Причин две:
1. Не у всех есть терпение и желание рисовать гриды на тысячи рисунков. А пополнять ассортимент стилей надо. Подборки — самый простой способ получить желаемое.
2. Результаты каждого теста уникальны. В одном тесте токен не проявил себя, в другом выдал лучший результат и обратил на себя внимание.

____
У капибары лапкиподписаться
#заметки #рабочийпроцесс

Последние пару дней тестирую различные промпты и негативы для улучшения результатов на разных аниме моделях.

Самый интересный вывод: общепринятые и очень популярные (masterpiece, best quality), даже с повышением веса до 1.3, не улучшают картинку. С тем же успехом можно добавить в промпт пару запятых, это тоже как-то поменяет детали или композицию.

При этом негатив (worst quality, low quality) результаты улучшает. Можно даже повышать вес до 1.3-1.4.

magic
╮( ˘_˘ )╭

____
У капибары лапкиподписаться
capybara_and_witches.zip
31.3 MB
Таблица, созданная в расширении Infinity Grid Generator (обзор)
#расширение

Infinity Grid Generator
https://github.com/mcmonkeyprojects/sd-infinity-grid-generator-script

Улучшенная версия матрицы XYZ, с возможностью задать более трёх осей (максимум 16!) для тестирования промптов и настроек генерации.
Позволяет создавать и использовать шаблон таблицы, чтобы не вводить вручную параметры при проведении однотипных тестов. При добавлении новых полей может дописывать данные в существующую таблицу вместо повторной генерации новой таблицы.

Скриншот таблицы не покажет глубины удобства (или безумия?) расширения. Чтобы понять как это работает лучше посмотреть готовую таблицу. Для просмотра откройте файл index.html в браузере.

Настройки расширения
• Select grid definition file
Выбор файла конфигурации, на основе которого создаётся таблица.
Create in UI — настройка всех параметров вручную в интерфейсе, по аналогии с XYZ-plot
• Output folder name
Имя папки с файлами и таблицей.
• Overwrite existing images (for updating grids)
Позволяет перезаписать данные в уже существующей таблице.
• Do a dry run to validate your grid file
Запуск без генерации изображений, по умолчанию выключен. Необходим для тестирования корректности конфигурационного файла или введённых в интерфейс данных.
• Use more-performant skipping
Не совсем понял что делает эта настройка, поэтому по умолчанию не включаю.
• Generate infinite-grid webviewer page
Создаёт веб-страницу для работы со сгенерированной таблицей. По умолчанию включено.
• Validate PromptReplace input
Проверяет данные если вы выбрали PromptReplace (замена части промпта).
• Publish full generation metadata for viewing on-page
Добавление всех мета-данных в таблицу

Шаблоны таблиц
Шаблоны хранятся в папке \extensions\sd-infinity-grid-generator-script\assets
Структура таблицы описывается в формате yaml, в файлах short_example.yml и megagrid.yml лежат примеры сложного оформления. Простой шаблон можно получить при генерации пустой таблицы (файл config.yml в корне папки с таблицей).
Расширение хорошо документировано, больше информации можно получить в гитхабе проекта. Я пока не пробовал создавать сложные структуры, но в комментариях смогу ответить на ваши вопросы.

Недостатки расширения
• В отличии от стандартной XYZ не поддерживает более одного изображения на ячейку. Ограничение можно обойти добавлением оси Seed со значениями -1, -1, -1, etc, но это менее удобно.
• Нет селектора для моделей, стилей и VAE. Можно лишь добавить весь список в матрицу и вручную удалить лишнее.
• В интерфейсе отстутствует возможность задать подпись оси. Это может доставить неудобство если у вас более двух осей Prompt Replace.
• Вам надоест искать нужные картинки по папкам, созданным расширением.
___
У капибары лапкиподписаться
#Automatic1111

Вышло обновление Automatic1111 Web UI, версия 1.5.0

Я рискнул сразу обновить основную версию WebUI и (вроде) пока ничего не отвалилось. ControlNet, ADetailer, Canvas Zoom, Negative Prompt Weight и стандартные скрипты работают.

Дополнено: перестал работать DAAM.
Дополнено 2: обновление может выпасть в ошибку если у вас есть установленные нестандартным способом расширения.

Но правильнее выждать перед обновлением день-два, чтобы быть уверенным что ничего не поломалось.

Важные и заметные на глаз изменения
— Поддержка SDXL.
— Редактор мета-данных скачанных LoRA: возможность сохранить в виде пресета стандартные настройки (токен активации, веса, тэги) и получить информацию о настройках тренировки в человеко-читаемом формате.
— Горячие клавиши для перемещения токена внутри промпта (alt + стрелки влево/вправо).
— Поддержка LyCORIS встроена в стандартное расширение LoRA
— img2img при пакетной обработке получил возможность читать метаданные из изображений и работать с подкаталогами.
— Настройка для изменения цветов фона гридов (xyz-plot).
— Автоматическое переключение на 32-х битное пространство если VAE выдаёт ошибку и просит прописать ключ --no-half-vae.

Всякие мелочи
— В каталоге расширений отображается количество звёзд репозитория на гитхабе. Показатель совершенно бесполезный, но он есть.
— Улучшено отображение информации о затраченном на рисование времени и использовании VRAM.
— Информация о хэше использованных текстовых инверсий добавлена в метаданные.
— Возможность добавить пользователя gradio (?) в название файла и метаданные.
— Запуск ускорен на пару секунд, т.к. отключена попытка установить уже установленные пакеты.
— Чекбокс выбора всех установленных расширений на вкладке расширений.
— 9 пунктов, связанных с разработкой расширений и работой с API.
— 17 пунктов багфиксов, всякие минорные мелочи.

Полный список изменений можно посмотреть в репозитории проекта.

___
У капибары лапкиподписаться
This media is not supported in your browser
VIEW IN TELEGRAM
#заметки #Automatic1111

Последние несколько дней по работе пишу и редактирую огромное количество самых разных промптов.

Возможность передвигать токены комбинацией клавиш Alt + стрелки (влево/вправо), добавленная в версии 1.5.0 WebUI, оказалась лучшей новинкой из всего списка улучшений.
На втором месте пресеты для лоры.

У капибары лапкиподписаться
#SDXL #мысливслух

В новостях пишут, что вышла долгожданная SDXL 1.0.

Поддержка (вернее "поддержка") SDXL в Automatic1111 WebUI реализована каким-то особым человеконенавистническим способом. Не рекомендую тратить на это время и нервы.

Хотите опробовать горячую новинку (модель, рефайнер, вае) — воспользуйтесь отдельно установленным ComfyUI (инструкция по установке, воркфлоу). Результаты вас приятно удивят.

Основное, что стоит знать про SDXL сейчас:
— Базовая модель имеет фундаментальный дефект: из-за отсутствия в датасете обнажённых тел люди, даже одетые, не всегда получаются удачными. Прочих NSFW ограничений нет: зомби и кровища рисуются как и на 1.5.
— SDXL рисует в огромных, по меркам 1.5, размерах без проблем с построением композиции, без искажения тел и без дублирования объектов. Условные 1920х1080 можно рисовать сразу, без апскейла.
— Процесс написания промптов аналогичен принципам 1.5, но ваши промпты могут значительно отличаться от результатов файнтюнов 1.5.
— LoRA от 1.5 и 2.1 не совместимы с SDXL.
— SDXL уже поддерживается в kohya-ss, какие-то LoRA и тренированные модели уже есть на civitai. При желании вы можете дообучить лору или модель сами.
— Модели ControlNet 1.1 не совместимы с SDXL.
— Нет, пальцы оно всё ещё не умеет рисовать.

Надо ждать дообученных и перебалансированных моделей, как было с 1.5.

У капибары лапкиподписаться
#заметки #SDXL #ComfyUI

Воркфлоу для рисования на SDXL от автора ComfyUI

1. Скачайте изображение.
2. Перетащите файл в окно ComfyUI.
3. Не забудьте поменять настройки KSampler Base и KSampler Refiner (sampler, cfg)
— dpmpp = dpm++
— задайте scheduler = karras, чтобы рисовать на семплерах karras или normal для прочих

Воркфлоу хорошо задокументирован и поможет лучше понять что происходит на каждом этапе.
Результат стоит того, чтобы не воевать с автоматиком (рисовать на модели, затем вручную через img2img улучшать результат на рефейнере) а сразу всё делать на ComfyUI.

• скачать SDXL (модель, рефайнер, вае)
инструкция по установке ComfyUI
____
У капибары лапкиподписаться
#расширение

Config Presets
https://github.com/Zyin055/Config-Presets

Расширение для сохранения настроек параметров генерации и переключения между пресетами в один клик. Будет полезно для хранения настроек генерации разных моделей, пайплайнов апскейла и инпейнта или пайплайнов более сложных процессов.

Алгоритм настройки необычайно прост:
1.В интерфейсе WebUI задаёте нужные параметры.
2. В расширении отмечаете какие из параметров необходимо сохранить.
3. Вводите имя пресета и сохраняете.

Особенности расширения
• Работает с txt2img и img2img.
• Помимо настроек генерации может сохранять параметры расширений ControlNet, ADetailer, Latent Couple, Tiled Diffusion.
• Для подключения и сохранения дополнительных настроек необходимо нажать кнопку "Add Custom Fields" и при редактировании текстового файла удалить символ # в начале строк с нужными вами параметрами.
• В теории может хранить настройки любых расширений или скриптов, если они прописывают параметры в ui-config.json. Но здесь нужны эксперименты.
Расширение не запустится и в консоли будет написано какой именно параметр привёл к сбою, если вы напишите что-то не так.
• Сохраняет содержимое матрицы XYZ.
• Хранит файлы конфигурации в \stable-diffusion-webui\extensions\Config-Presets, при необходимости их можно править вручную.

Недостатки расширения
• Не умеет переключать модели и VAE.
• Не умеет изменять уровень Clip skip.
• Не запоминает содержимое матрицы XYZ если поле заполняется из выпадающего списка (модели, стили, etc).
• Не умеет настраивать семплер для хайреза (или я не разобрался где и как это сделать).
____
У капибары лапкиподписаться
#обзор #SDXL

Сравнил как рисуют SDXL 0.9 и SDXL 1.0 на двух разных воркфлоу. (больше примеров в статье по ссылке).

Добавил инструкцию как скачать SDXL, установить ComfyUI и настроить пайплайны рисования.

Читать на DTF | Пикабу
____
У капибары лапкиподписаться
#арт #SDXL #мысливслух

На волне хайпа по SDXL 0.9 договорились с Юлией, автором канала "85GB нейронок", совместно написать 9 промптов для SDXL 0.9, нарисовать на привычных каждому инструментах (Юлия через бота в дискорде, я в локальной ComfyUI) и обменяться впечатлениями о процессе рисования и результатах. Из-за моей загруженности как раз успели к релизу 1.0. нот хехе

StabilityAI целились в создание универсальной модели, которая при некотором файн-тюне должна конкурировать с Midjourney, и у них почти получилось.

Даже на коротких промптах модель старается додумать что-то исходя из контекста и улучшить (или "улучшить") результат. Эффект сильнее всего виден на фотографии девушки с мороженым (кадр 4). При добавлении токенов фотографичности (кадры 1 и 7) модель иногда покладисто следовала промпту, иногда не слушалась. Но убедить рисовать что надо оказалось не сложно: дополнительные токены стиля многократно улучшают "фоточковый" стиль модели.

При рисовании иллюстраций модель полностью следовала промпту во всех случаях, кроме аниме (кадр 8). Почему-то имена известных художников аниме, режиссёров или простые токены анимешности не давали желаемого результата. Это похоже на особенность базовой модели: некоторых художников и фотографов оно понимает иначе, чем популярные файнтюны на базе 1.5. Подмечал этот неприятный факт и ранее, но не придавал ему значения.

SDXL унаследовала все родовые болезни от предыдущих SD: избыточное боке, которое затрагивает объект на переднем плане (кадр 1: шерсть котофея в нижней части кадра; кадр 4: левое плечо и левая рука девушки); беды с пальцами и глазами; испорченные мелкие детали.

Но если взять в скобки все недостатки — модель получилась отличная, на несколько голов выше 1.5.
С нетерпением жду дообученных моделей от сообщества.

И с ещё большим нетерпением жду SDXXL, которая может быть, догонит Midjourney образца 2022-го года.

Промпты ко всем изображениям будут в комментариях к этой записи.
____
У капибары лапкиподписаться