Ai molodca 🤖
23.5K subscribers
671 photos
102 videos
133 links
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub. Образование для команд и студия: http://aimolodca.tilda.ws

На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Download Telegram
#Dalle3 мнение и что будет дальше с визуальными моделями.

Давным давно (год назад, лол) Dalle-2 задавал планку качества в генерации картинок, но проиграл медийную гонку Midjourney (по качеству) и Stable Diffusion (по гибкости).

И вот, OpenAI с двух ног вернулась в игру визуальных моделей и снова задает уровень.

В первую очередь, уровень понимания запроса и то, что западные AI блогеры называют coherency (связность или согласованность), грубо говоря логическая и визуальная цельность.

Из полевых тестов — то, чего я добивался часами в MJ и Stable, в Dalle-3 получалось с одной попытки. Карлсон и Громозека — тоже (олды канала помнят)!

То, что вы пишите — то и получаете.

Что дальше?

Midjourney вот-вот выпустит шестую версию, в которой, судя по информации которую я слышал на office hours от CEO, будет гораздо большая стилевая гибкость (а не просто очень-очень красиво) и та самая conherncy. А также, некое подобие ControlNet. И на их месте я бы, конечно, шел именно в сторону большего контроля, потому что иначе они выпустят Dalle-3.

Stable Diffusion продолжает быть народным мультикомбаином, который расширяется до бесконечных возможностей за счет энтузиастов. Но уже с новым поколением — XL. Прошлогодная модель 1.5 плавно отдает бразды популярности.

Кандинский и Шедеврум догоняют, но надо (очень) ускоряться.

Dalle-3 скорей всего порежут, так сейчас можно легко создавать NSFW контент, что очень странно для OpenAI. Ну и вот-вот добавят в ChatGPT 4, что создаст множество сценариев использования.

Так что, если вы еще не попробовали, то советую (с VPN): https://www.bing.com/create. Ну и сделал в нашем хабе отдельный раздел для ваших генераций. Кстати, если у вас долго висит, то советую попробовать с браузера Bing, вроде постабильнее.
Судя по всему у многих (в том числе и у меня) #Dalle3 выкатился в GPT4.

Так что бежим тестировать (включать, как и все beta функции, в настройках).

Из первых наблюдений:

1. Встроена улучшайка запроса. Вы вводите запрос, ГПТ4 на его основе делает четыре, чуть прокаченные, версии.
2. В отличии от BING’а на выходе дается не квадратные, а широкие картинки.
3. Почему-то по запросу cyborg он мне дает Терминатора (???).

Продолжаем наблюдение и ждем мультимодальность с картинками еще и на вход. Ваше здоровье!
Забытые игры.

В удивительное время живем. Сегодня с нейросетями играемся, а еще, казалось, вчера палкой крапиву избивали и свинец из аккумов плавили.

Сделал полностью в #Dalle3 (через GPT4). Стилизацию, шрифты, консистетность тащит он, конечно, люто.
"Обучение" Dalle-3.

Для украшения презентации попробовал сделать мини-версий себя в Dalle-3 и это получилось ОЧЕНЬ ЛЕГКО. Понятное дело, что ни о каком настоящем обучении ala Dreambooth (кстати, референсное фото тоже генерация, но в Stable) речь не идет и работает это:

а) только в рамках сессии/чата
б) с высоким уровнем стилевой абстрации (фотореализма не получится, советую минималистичные стили)

Но все же!

Как это работает: ваше изображение декодируется в текстовое описание, а уже из него создается изображение. Все просто, но благодаря точности GPT4 и Dalle-3 эти два пункта получаются здорово. Процесс на картинках выше. Особенно здорово, что можно давать клиентские комментарии, хехе.

#Dalle3 #tips
Небольшая, но приятная новость. Внезапно в #Dalle3 (в подписке plus) выкатили inpainting. Теперь можно менять часть изображений.

Работает, как и везде. Кликаете на картинку, выделяете область, пишите промт. И теперь у вас вместо гопника гигантский антропорфный кот, который ест хлеб.

UPD: Свое редактировать нельзя (для этого есть нейрофотошоп и стейбл).
UPD 2: Выкатывают постепенно.
Нам далли секретное обновление ☀️

Работая с #Dalle3, заметил кое-что странное. Он стал генерировать гораздо больше текста на изображениях, иногда даже в генерациях проступают куски промта. Раньше можно было почти без ошибок создать небольшое словосочетание, а теперь - небольшой текст.

Получается, правда, мыльно (яркий пример - картинка с неоном), с косяками, но всё же. Теперь вы тоже знаете.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM