У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens
2.36K subscribers
536 photos
5 videos
20 files
237 links
Оглавление и навигация: https://t.me/capybara_paws/32

Консультации и предложения:

Рисую: https://www.artstation.com/capybara_paws
О канале: https://t.me/capybara_paws/2
Download Telegram
#расширение

Vectorscope CC
https://github.com/Haoming02/sd-webui-vectorscope-cc

Расширение для цветокоррекции после завершения диффузии. Может заменить весь ассортимент токенов насыщенности (low saturation, oversaturated), контрастности (low contrast, high contrast). Расширение даст более гибкие настройки если вы задаёте гамму изображения токенами цветов.

Для меня это (пока) тёмный лес, но результаты уменьшения насыщенности от -2 до -1,5 на аниме моделях и повышения в диапазоне от 0,3 до 0,7 на фотографичных моделях очень даже понравились.

Параметры
• Advanced - Process Hires. fix: обязательная настройка если вы используете hires.fix
• Alt: модифицирует альтернативные тензоры, включение настройки усиливает эффект работы расширения.
• Brightness: настройка яркости (высокое значение вызывает избыточное размытие, низкое создаёт дополнительные шумы)
• Contrast: настройка контраста
• Saturation: насыщенность цветов
• R: Cyan <---> Red (переход от голубого к красному)
• G: Magenta <---> Green (переход от пурпурного к зелёному)
• B: Yellow <---> Blue (переход от жёлтого к синему)
• Skip: настройка для обработки первых Х шагов (в процентах) и пропуска остальных. Полезно, если нужно избежать проблем с избыточной коррекцией.

Прочие особенности
• Совместимо с матрицей XYZ для детального тестирования настроек
• Сохраняет только файл с цветокоррекцией
• Не хватает настроек изменения резкости и HDR
• Нет пресетов (на обложке собранный вручную коллаж)
__
Stable Diffusion: инструменты, расширения, модели, токены
#дайджест

Важные посты в блоге за июнь 2023-го
Отправьте пост друзьям, рисующим на Stable Diffusion. Они многое теряют, если ещё не подписались на этот канал.

Расширения и инструменты
• Большой обзор-сравнение 5 редакторов поз для ControlNet вместо неработающего posex
• !After Detailer — расширение улучшения лиц без необходимости залезать в inpaint (обзор и инструкция по настройке)
• Latent Couple — расширение для рисования двух разных персонажей в одном кадре без смешения деталей образов (обзор и настройка)
Canvas Zoom обязательное расширение для работы в режиме inpaint, удобнее встроенного в автоматик 1.4
• Используем Wildcards для хранения словарей токенов
Pixelization — расширение для пикселизации готовых рисунков.
Vectorscope CC — расширение для цветокоррекции в пару кликов

Руководства по инструментам
Улучшаем глаза в режиме inpaint
Дорабатываем изображение методом создания коллажа

Токены
• Делюсь собственным стилем (v0.1) для создания мрачноватой атмосферы на пейзажах и портретах (нарисовал арт по мотивам Frostpunk)
• Создаём эффект contre-jour
Улучшаем освещение с токеном backlight
Подборка: 2384 токенов стиля
Подборка: 706 художников, 33 стиля, 19 направлений живописи
Подборка: 364 токена для имитации плёночной фотографии

Модели
• Reliberate — лучшая модель для создания фотографий (обзор, примеры рисунков)
Flat-2D Animerge: сравниваем модели версий 1 и 2

Заметки
Инструкция: переносим тяжёлые модели Stable Diffusion на другой накопитель
Зачем нужна inpaint-модель и как её создать самостоятельно?
• Несколько советов по организации словарей в wildcards

Всякое
разное
Набор иконок для webui-user.bat
• Две темы интерфейса WebUI (Catppuccin и Kitchen Theme)
• Полезные функции из обновления автоматика 1.4.0
Настройка поведения автоматика при вставке промптов

___________


___________
Stable Diffusion: инструменты, расширения, модели, токены
#рабочийпроцесс

Неожиданно для себя занялся сравнением влияния токенов в негативном промпте на качество рисунков аниме моделей. А ведь я почти не рисую аниме, и лишь изредка использую эти модели для рисования пейзажей...

Часть выводов подкрепляю тестированием на фокус-группе. Например, уже подметили интересную закономерность: хорошо подобранные промпт и негатив оказывают большее влияния на качество рисунка, чем ворох популярных негативных эмбеддингов. Изинегатив, бэд промптс и прочие вроде как и не нужны.
В числе прочего проверяю популярные конструкции, вроде (masterpiece, best quality, perfect anime illustration:1.3). Нужны ли они — загадка, которую ещё предстоит разгадать.

На обложке — крошечный кусочек теста, тизер тизера. Настоящие тесты, само собой, состоят из сотен изображений. Токены для большей точности разделяются запятыми. Стилей негативов тестируется не 2, а минимум 5.

Дополнено: перерисовал и заменил обложку поста, убрал дублирующийся токен anime.

___
Stable Diffusion: инструменты, расширения, модели, токены
#токен #арт

В процессе поиска способа рисовать изображения с прозрачностью наткнулся на расширение Vector Studio (или скрипт text2vector). Заявлено, что оно умеет и векторизовать изображения, и рисовать без фона. Векторизация пока не актуальна, а с созданием прозрачных фонов не задалось — расширение работает хуже, чем любой из трёх способов рисовать без фона.
Расширение оказалось бы бесполезным, если бы не одно НО: туда зачем-то добавленs пресеты десятка стилей, восемь монохромных и два цветных. Отличное дополнение к моему способу рисовать монохромные изображения одним лишь промптом.

Искал медь, а нашёл золото!

Нарисовал на этих стилях тысячи три. Полноценным тестом это назвать сложно, но основные закономерности отмечены.
• Стили сочетаются со всеми типами моделей (фотографичными, фотореалистичными, артовыми, аниме).
• На фотореалистичных моделях иногда получается эффект чёрно-белого изображения с большим количеством оттенков.
• Добавление токена цвета вносит интригу: окрасится только объект, описанный в промпте, или изображение целиком?
• Некоторые аниме модели могут добавить оттенки синего.
• Токены ink и painting могут добавить на изображение кисти, карандаши или блонкот.
• Стиль стикеров нестабилен. Но с небольшим шансом получаются милые стикеры.
• Стиль "золото" превращает простые объекты в ювелирные украшение, на сложных композициях рисует как рисуется, но в золотой гамме.

скачать стили

Добавляем стили в коллекцию
1. Открываем файл styles.csv из корневой папки WebUI любым текстовым редактором (блокнот, notepad++, wordpad, etc)
2. Добавляем в новую строку содержимое файла text2vector_styles
3. Сохраняем файл, в интерфейсе WebUI рядом со списком стилей нажимаем кнопку "обновить"
4. Готово! Вы восхитительны!
___
Stable Diffusion: инструменты, расширения, модели, токены
#расширение

Aspect Ratio selector plus
https://github.com/LEv145/--sd-webui-ar-plus

Ранее писал об оригинальном расширении, сегодня опробуем чуть более удобный форк. На обложке сравнение внешнего вида обоих расширений.

Отличия, за счёт которых форк выглядит интереснее:
• Два режима изменения пропорций
— обычный: 1024x1024 и16:9 = 1820x1024
— реверсивный: 1024x1024 и16:9 = 1024x576
• Улучшена вёрстка, кнопки занимают всю ширину экрана
• Иконки на кнопках вместо текста

Есть надежда, что разработчик форка будет активно обновлять расширение и добавлять новые функции. Поэтому перехожу на новое расширение сам и рекомендую перейти вам.
В комментариях к посту можно задать вопрос или предложить улучшение напрямую автору форка.

СКАЧАТЬ НАСТРОЕННЫЕ КОНФИГИ ДЛЯ РАСШИРЕНИЯ

Алгоритм перехода на форк
1.Extensions - Installed - отключаем sd-webui-ar
2. Apply and restart UI
3. Устанавливаем Aspect Ratio selector plus по ссылке или из каталога
4. Переносим конфиги из папки  \extensions\sd-webui-ar в  \extensions\--sd-webui-ar
5. Apply and restart UI
6. Не обязательный пункт: удаляем папку  \extensions\sd-webui-ar

_______________________________

Обзор оригинального Aspect Ratio selector

Любимейшее расширение, которым пользуюсь много раз каждый день. Добавляет в интерфейсы txt2img и img2img инструмент для изменения соотношения сторон в заданной пропорции или задания точного размера рисунка или тайла в один клик.

Калькулятор пропорций будет полезен при пересчёте длин сторон исходя из возможностей диффузии и вашего железа. Рисовать в условных 1920х1080 бессмысленно, холст слишком большой и пойдут искажения. При задании большей стороны в 1024 калькулятор рассчитает меньшую. В 1024х576 уже можно рисовать, а затем апскейлить хоть до 1920х1080, хоть до 3840х2160.

У расширения превосходная документация, настройка по инструкции займёт буквально пару минут.
Или можно скачать мои конфиги и положить в папку \extensions\--sd-webui-ar
___
Stable Diffusion: инструменты, расширения, модели, токены
capybara's_configs_for--sd-webui-ar.zip
784 B
Для установки моих конфигов распакуйте архив в папку extensions вашего WebUI и перезапустите сервер.

Обзор расширения Aspect Ratio selector plus.
В расширении Canvas Zoom появился индикатор активной инпейнт модели.

Если вы невнимательный и забываете переключаться между моделями — скачивайте обновление, оно вам понравится.

Полный список изменений в последней версии:
1. Функция рисования прямыми линиями при зажатой клавише shift (включается в настройках)
2. Индикация и предупреждение при активной инпейнт модели
3. Отключены горячие клавиши при активном поле ввода промпта
4. Исправлен баг с неработающей вставкой изображения из буфера обмена

Для обновления всех расширений
• перейдите на страницу Extensions во вкладку Installed
• нажмите Check for updates и дождитесь завершения процесса
• нажмите Apply and restart UI для применения изменений (перезапуск сервера)

___
Stable Diffusion: инструменты, расширения, модели, токены
#расширение

sd-webui-better-styles
https://github.com/eideehi/sd-webui-better-styles

Расширение для сохранения стилей в виде пресетов (стиль + настройки рисования). Добавляет панель выбора стилей, похожую на панель выбора моделей/лор. Не влияет на сохранённые в styles.csv стили. Расширение сыроватое, недостатки описаны в конце обзора. Если это вас не смущает — расширение может быть удобнее стандартного механизма работы со стилями.

Особенности расширения
• Сохраняет стиль в виде пресета
— промпт и негатив
— настройки рисования (семплер, шаги, CFG, Clip Skip, Eta noise seed delta)
— дополнительные настройки (Highres.fix, Restore faces, тайлинг)
• Задаёт ассоциацию стиля и промпта
• Возможность сортировать стили по папкам
• Поиск по стилям
• Панель выбора стилей с вашими превью

Настройка стилей
{prompt}
Используйте эту конструкцию в том месте стиля, куда должен вставляться промпт. Полезно, если ваш стиль находится и перед промптом, и после.

Недостатки расширения
По каждому пункту создал issue в гитхабе проекта, ждём ответа от разработчика.
• Не взаимодействует со стилями из styles.csv. Для настройки расширения придётся перенести все стили вручную.
• Нет удобного редактирования стилей
• Не совместимо с матрицей XYZ и другими матрицами
____
Stable Diffusion: инструменты, расширения, модели, токены
#расширение

Agent Scheduler
https://github.com/ArtVentureX/sd-webui-agent-scheduler

Расширение создаёт очередь генерации из отличающихся промтов. Полезно при рисовании больших объёмов изображений когда вас нет за машиной. Например, вечером пишите десяток промтов и диффузия ночью всё это рисует. Но будет бесполезно, если вы используете дополнительные расширения для генерации.
Возможно, Agent Scheduler пригодится для сервиса генерации изображений или вашего личного бота в телеграме.

Настройки, с которыми работает расширение
• Промпт и негатив. Стили не поддерживаются, но их можно вручную добавить в промпт кнопкой "Apply selected styles to current prompt"
• Для каждой задачи задаётся выбранная в интерфейсе WebUI модель
• Семплер, шаги CFG, размер изображения
• Настройки Batch count и Batch size

Настройки, с которыми не работает расширение
• Выбор VAE
• Глубина Clip skip
• Highres.fix
• Дополнительные расширения, вроде !After Detailer или ControlNet

Прочие особенности
• Невозможно отредактировать уже созданную задачу, доступно только удаление или выполнение
• Поддерживает управление по API
• Очередь промтов не ограничена
• Срок хранения истории промптов задаётся в настройках
• Поддерживает горячие клавиши (зачем?)
__
Stable Diffusion: инструменты, расширения, модели, токены
This media is not supported in your browser
VIEW IN TELEGRAM
#видео

День ничегонеделанья и дуракаваляния получил логичное завершение: создал видео, хотя раньше вообще не планировал рисовать видео на диффузии.

__
Stable Diffusion: инструменты, расширения, модели, токены
This media is not supported in your browser
VIEW IN TELEGRAM
#заметки #видео

Чуть более серьёзное использование технологии записи генерации по кадрам: можно в деталях рассмотреть весь процесс морфинга на стандартном синтаксисе автоматика (справка).

fantasy landscape with a [mountain:lake:0.25] and [an oak:a christmas tree:0.75][ in foreground::0.6][ in background:0.25] [shoddy:masterful:0.5]

Sampling Steps = 100
• В начале рисуется fantasy landscape with a mountain and an oak in foreground shoddy
• После шага 25 fantasy landscape with a lake and an oak in foreground in background shoddy
• После шага 50 fantasy landscape with a lake and an oak in foreground in background masterful
• После шага 60 fantasy landscape with a lake and an oak in background masterful
• После шага 75 fantasy landscape with a lake and a christmas tree in background masterful

Значения 0.25, 0.5, 0.75 в промпте — значение в процентах от общего числа шагов.
Целы числа, например 28 или 44, задают шаг, после которого произойдёт смена промпта.

[token:0.5] — добавляет token к промпту после 50% шагов
[token::0.5] — удаляет token из промпта после 50% шагов
[token1 : token2 : 0.5] = [token1 :: 0.5] [token2 : 0.5]
____
Stable Diffusion: инструменты, расширения, модели, токены