Stable Image позволяет:
Этот сервис использует последние модели Stable Diffusion от Stability AI.
🔸Чтобы им воспользоваться, откройте этот колаб. Внутри необходимо просто запускать ячейки (в код можно не вникать).
🔸Прочесть документацию можно по этой ссылке.
Можно улучшить разрешение даже до 4K.
🔸Ссылка на колаб.
🔸Ссылка на документацию.
Можно удалять фон, добавлять на изображение слова и т.д.
🔸Ссылка на колаб.
🔸Ссылка на документацию.
▫️Заведите аккаунт на сайте https://platform.stability.ai/
▫️Затем зайдите на страницу https://platform.stability.ai/account/keys и сгенерируйте новый ключ. Скопируйте его.
▫️При запуске второй ячейки в колабе появится поле, в которое нужно вставить ключ.
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
У OpenAI есть веб-интерфейс для инструмента редактирования изображений. Вот как его использовать:
a cup of coffee on a white surface
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Midjourney V6 позволяет сгенерировать изображение с осмысленным текстом на нём, таким, какой вы пожелаете. Для этого нужно модифицировать промпт: просто добавьте в него желаемый текст, заключив его в кавычки.
Пример:
"The journey begins with a single step" against a backdrop of a winding mountain path leading into the sunrise, capturing a sense of adventure and new beginnings –ar 16:9 --v 6.0 --style raw
–ar 16:9
указывает на соотношение сторон изображения;--v 6.0
указывает на версию Midjourney;--style raw
поможет сделать текст более чётким и выделяющимся.#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Самая последняя версия DALL-E сейчас доступна через ChatGPT с платной подпиской. И если вы ещё ни разу ею не пользовались, то вот полезные советы и разъяснения:
Please generate two images of a dog sitting in grass. The first image should be a dalmatian, the second should be a bulldog
- Быть конкретным и указывать детали;
- Описывать желаемую атмосферу;
- Указывать освещение и время суток;
- Учитывать перспективу и композицию;
- Использовать сравнения;
- Указывать действия.
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Перевели для вас гайд The Guardian, а также добавили свои наблюдения.
У нейросетей до сих пор могут возникать проблемы с генерацией конечностей. Особенно часто лишние руки, ноги или пальцы появляются в сложных групповых сценах.
Нередко на сгенерированных картинках текст — это просто бессмыслица, визуально напоминающая настоящие слова. Впрочем, этот эффект уже можно частично обойти в Midjourney или DALL-E — есть специальные флаги для промптов, которые позволяют получить качественный текст на изображении.
Нейросети могут вытворять чудеса с генерацией человеческих волос, меняя направление их роста и укладывая их странным образом.
В реальном мире частичная симметрия — часто встречающееся явление. Обращайте внимание на парные предметы на изображении, которые должны быть одинаковыми.
Модели плохо справляются с генерацией повторяющихся и сложных узоров.
Нейросети могут генерировать предметы довольно странно: например, какие-то линии могут оказаться ломаными, а не прямыми.
Если у вас в распоряжении есть сразу несколько картинок, показывающих одну сцену, то обязательно сравните их между собой. Нейросети не утруждаются сохранением деталей.
Модели, как правило, фокусируются на центральных объектах изображения, на том, что было прописано в промпте. Из-за этого фоновые детали могут выглядеть нереалистично.
Выдать его может появление предметов не в том месте, не в том контексте и не в том положении.
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Midjourney есть слишком много флажков для промптов, которые содержат в себе слово
style
. Постараемся в них разобраться.--stylize
Этот параметр позволяет управлять степенью стилизации изображения. Вы можете задать численное значение от 0 до 1000, которое определит, насколько сильно Midjourney будет придерживаться вашего текстового запроса или отходить от него в сторону более творческого изображения.
--style raw
Использование этого флага заставляет Midjourney игнорировать свои встроенные предпочтения стиля и строго следовать промпту пользователя без добавления дополнительной стилизации.
--sw (style weight)
Этот параметр устанавливает «вес» стиля в вашем запросе. Чем выше значение, тем сильнее влияние стиля на конечное изображение.
--sv (style version)
Этот параметр позволяет выбрать версию алгоритма ссылок на референсы. Самая последняя на данный момент — четвёртая.
--sref (style reference)
С помощью этого параметра вы можете указать ссылку на изображение, которое будет использоваться для референса.
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Намеренное использование одного и того же слова много раз заставляет модель придать ему большее значение.
Вот пример:
1-я картинка:
A planet with aliens
2-я картинка:
A planet with aliens aliens aliens aliens aliens aliens aliens aliens aliens aliens aliens aliens
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Для этого нужно придерживаться трёх основных правил.
Основные цвета: Bold: Red, blue, yellow, green, purple
Пастельные цвета: Lilac, coral, cream, beige, sky blue
Вот промпты, с которым получились изображения, прикреплённые к посту:
girl doing yoga, minimalistic, green and white color palette
girl doing yoga, minimalistic, lilac and coral color palette
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Не нужно даже самостоятельно придумывать промпты. Достаточно отдать ChatGPT (или любой другой LLM) вот такой шаблон:
You are a world leading designer of abstract wallpaper designs. Please analyse and write a prompt for a text to image converter in 60 words describing the visual of a beautiful , stunning , elegant, minimalistic, wallpaper design with as much details as possible creatively. End each prompt with “hd, stunning –s 500 –ar 9:16"
Как только вы получите ответ, попросите модель сгенерировать ещё, например, 10 штук таких промптов. А затем идите с ними к генератору изображений.
“hd, aspect ratio 9:16"
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Вы можете определить стиль будущего изображения через ключевые слова в промпте. Для пиксельных артов есть несколько вариантов.
pixel art
. В этом случае результат может быть наименее предсказуемым.clouds and castle pixel art
8-bit, 16-bit
. От выбора будет зависеть цветовая палитра. clouds and castle 8-bit clean pixel art
Felix the Cat 1992 graphics, clouds and castle
sega genesis graphics, clouds and castle
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Можно начать с генерации одной буквы в желаемом стиле. Например:
Typography of the letter "S" outlined in bold black strokes, using a colorful floral and botanical theme.
Затем получившуюся картинку можно использовать в качестве примера, чтобы создать все остальные буквы. Для этого следует кликнуть правой кнопкой мыши по изображению и скопировать URL. Далее его нужно вставить в такой промпт:
URL Text "H" --sref URL
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Пользователи обнаружили, что если добавить в промпт для FLUX1.1 сочетания типа
IMG_1018.CR2
или IMG_4001.JPG
, то вы получите изображения, похожие на фото из вашей галереи на смартфоне.#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM