Ai molodca
31.2K subscribers
755 photos
159 videos
2 files
169 links
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub. Образование для команд и студия: http://aimolodca.tilda.ws

РКН: https://surl.li/dpoifm

На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Download Telegram
Forwarded from Афиша Daily
На Эмили Пеллегрини в запрещенном инстаграме за четыре месяца подписались 141 тыс. человек, а ее аккаунт на Fanvue (с откровенным контентом) принес 10 тыс. долларов за шесть недель. И хотя фото и видео Эмили выглядят реалистично, она полностью сгенерирована ИИ.

Создатель дипфейк-модели говорит, что ей в директ пишут футболисты, миллиардеры и бойцы ММА: «Они думают, что она реальна. Приглашают ее в Дубай, чтобы встретиться и поесть в отличных ресторанах».

По словам разработчика, он придумал внешность Эмили с помощью ChatGPT: «Я спросил ChatGPT, о чем мечтает среднестатистический мужчина, и он ответил: „каштановые длинные волосы и длинные ноги“, поэтому я сделал ее именно такой».

Подписывайтесь на Афишу Daily 🙃
Благодаря подписчкам —преступление раскрыто.

Предпримчивый товарищ берет в интернете тела моделей (гуглится реверсивным поиском по картинке) и добавляет лицо.

Начинаем 2024 с похищения тел! 🥂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
НЕЙРОТРЕНДРЕПОРТ 2024 😋

Этот пост был написан в начале января, но я был слишком погоревший, чтобы его выкладывать. Сейчас же, вышло пару новостей, которые подтвердили его тезисы, я отдохнул, поэтому с новыми силами, возвращаюсь к постингу!

В целом.

Магия уходит, технологии остаются.

Вспоминаю свою упавшую челюсть от первых генерации в Midjourney V3 и первого опыта общения с ChatGpt 3.5 в 2022 году. Сейчас же нейросети — как утренний кофе — норма. Шаманской техномагии для избранных больше нет. Есть полезные сервисы интегрированные в повседневную жизнь людей. Конечно, пока далеко не всех, но это вопрос плавно решает плотная интеграции ИИ в привычные массовые экосистемы (Google, Adobe, Microsoft, телефоны и т.д). Потому что: удобно, быстро и полезно. Конечно, будут еще яркие вспышки т.н хайпа, когда придется подбирать челюсть с пола, например SORA или возможность генерировать анимешных девочек и дипломы силой мысли через Нейролинк Маска. Но в целом, нейронные сети в этом году окончательно станут новой нормой.

Это будет год видео.

2023 был разминкой. Здесь можно было написать одно слово: SORA. Но ведь еще нас ждет гиперконтролируемая модель от ТикТока, новые версии Gen и Pika, Stable Diffusion Video обрастающий новым функционалом от энтузиастов и многое другое. Цунами генеративных клипов, рекламы, порно, фильмов, образовательных материалов — на подходе. А про страх перед этой волной хорошо написал мой товарищ Сережа Валяев.

Это будет год скандалов.

Обратная сторона возросшей доступности и качества нейросетей. Мы с вами молодцы — используем их возможности во благо. Но есть и киберпреступнки, пропагандисты, дезинформаторы и прочий скам, которые получили новые игрушки. Быстрые и простые дипфейки, клонирование голоса, фотореалистичные генерации - все это приводит к тому, что становятся возможным украсть 25 миллионов долларов у транснациональной корпорации с помощью дипфейка или собирать 28 миллионов просмотров за три дня на фэйковых фото и десятки других случаев. Лагающая регуляция на подходе. OpenAI вводит метаданные и вотермарки для маркировки изображений. Теперь каждая ИИ-картинка на поддерживающих ресурсах будет отмечена вотермаркой. А ЕС вводит уголовную ответственность за дипфейки и нейропорно. Но это все корпоративные игры — благодаря Open Source решениям никто не застрахован от сценария, когда вашей бабушке придет кружок с вашим дипфейком и вашим голосом попросит прислать все накопления.

Привыкайте дважды проверять всё, что видите и слышите в интернете. Также расскажите об этом близким, которые не знакомы с нейросетями.

Это будет год мобильности.

Станем еще ближе к Джарвис Тони Старка. Языковые модели одновременно растут и пухнут, например, новая Гуловская Gemini 1.5 сможет есть больше миллиона токенов на вход (это примерно 700 тысяч слов) и оперировать с ними с высочайшей точностью. И одновременно становятся компактней и локальней, позволяя запускаться на вашем калькуляторе телефоне. Поэтому мобильные пионеры встроенного LLM: Samsung и Google — это только начало. Совсем скоро можно будет запускать даже на часах. И это не говоря о том, что тренд на персонализацию и мультимодальность никуда не ушел.

Ну и конечно...

Нейроифлюенсеры, музыка, 3D, повышенный спрос на ML специалистов и нейродизайнеров, интеграция в бизнес, засилье нейроинфоцыган и другие интересные вещи. Здесь я уже подумал, что устанете читать.

В любом случае, будет весело. Так что пристегиваемся. 🦆
Please open Telegram to view this post
VIEW IN TELEGRAM
Киллер-фича #Midjourney V6 🤔

За всем потоком новостей я её пропустил, а вы не пропускайте. Style Transfer - возможность использовать любую картинку как стилевой референс. То есть, вы можете написать промпт, кинуть URL изображения, и на выходе получится генерация, учитывающая стилистику этого изображения.

Сделал несколько примеров с промптом: CAT WITH KNIFE + (стилевой референс).

Чем это отличается от обычного добавления картинок в промпт? 🤨

По классической схеме с картинки бралось и смешивалось всё. То есть, если бы я кинул Марго Робби как обычный референс, то на выходе получилась бы розовая женщина-кошка с ножом.

Стилевой референс - про стиль, эстетику, но не конкретный объект или сюжет.

Почему это круто? 😋

Больший контроль и возможность сохранения стилевой последовательности, чего сейчас приходится добиваться танцами с бубном. Midjourney плавно переходит от "сделать капец красиво" к "сделать капец красиво и как надо".

Как использовать стилевые референсы?

После вашего промпта введите --sref вместе с URL изображения

Что еще?

Можно использовать НЕСКОЛЬКО изображений, например --sref urlA urlB urlC
Можно установить ВЕС каждого стиля, например --sref urlA::2 urlB::3 urlC::5
Можно установить СИЛУ стиля через --sw 100 (100 - это по умолчанию, 0 - выключено, 1000 - максимум).

Я пойду дальше проводить эксперименты, а вы кидайте в комментарии свои. 🍴
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Предложили попробовать Фильтрумы у Шедеврума. Попробовал и рассказываю!

Сразу скажу, я не пользуюсь Шедеврумом в своих процессах. Но всегда советую его тем, кто вообще никогда не сталкивался с диффузионками, но хотел бы вкатиться в генерацию картинок. Потому что проще не бывает: UI, подсказки, промптинг на русском. Ну и лайки-подписки, которые позволяют не терять интерес к процессу. Это крутой продуктовый пример, когда сложная начинка завернута в очень простую и понятную обертку. Ну а потом сразу в Comfy, хехе (нет).

Так вот, так называемые Фильтрумы продолжают эту концепцию упрощения для массовой аудитории. Если коротко, то это img-to-img с опциональным controlnet (edge). Грузите картинку, пишите промпт, крутите ползунок местного denoise strength, получаете модифицированную картинку.

Классика, но есть продуктовый фишка. Вы можете сохранить свой удачный промпт, а другие им пользоваться. Это сущность и есть фильтрум.

Я сразу сделал идеальный — ВОЛЧАРЫ 🐺. Позволяет превращать себя в Стетхама в героя пацанских цитатников. Дополнительная область прикола — смотреть, как по-разному люди его используют. Посмотреть можно здесь. Ну и попробовать, конечно.

А я пойду делать шрекофикатор.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Я тут ушел с основной работы, чтобы играть в плойку, отдыхать и набираться сил для своих проектов. Поэтому появилось некоторое количество времени, чтобы возродить некоторые рубрики канала. Это дайджест новостей/какие-то штуки, которые мне показались интересными на этой неделе.

Назовем это #ЧтоТоИнтересное (4-10 марта 2024)

1. #Claude (главный конкурент ChatGPT) прокачался до третьей версии, поумнел, освоил мультимодальность и вообще держится молодцом. Главное преимущество на данный момент перед GPT4 — возможность подавать на вход большой объем данных (можно закинуть договора или небольшую книжку). Как это остроумно можно использовать в пайплайнах, можно посмотреть у Дениса.

2.Также клодовцы выпустили коллекцию промптов для разнообразных задач — от создания сайтов до генерации игр. Бывалых промтовиков не удивишь, но какие-то заходы можно подсмотреть.

3. #Midjourney круто обновили функцию /describe, которая позволяет превращать вашу картинку в промт и теперь, в комбинации с V6, работает отлично. Надеюсь на этой неделе выкатят обещанных последовательных персонажей.

4. Также Midjourney заблокировали доступ к сервису для сотрудников Stability AI после сбоя, связанного с интенсивным сбором данных. Эмад (глава Stability) пообещал разобраться в хулиганстве.

5. Ну и еще скандал. OpenAI публично пропесочила Илона Маска за лицемерие и судебные иски, указывая (с пруфами) на его прошлые попытки контролировать компанию.

6. Google обновили свой генератор музыки MusicFX — добавили режим DJ. Кидаете запросы, из них генерятся треки, а дальше регулируете их на ходу. Для серьезного продакшена не сгодится, но поиграться можно (только нужен хороший интернет, у меня работает через раз).

7. Ну и красивое. Кто-то смонтировал 75 видео из #SORA в одно большое, нарядное видео. Это мы смотрим и ждем.

Стэй тюнед 🍎
Please open Telegram to view this post
VIEW IN TELEGRAM
Под покровом ночи #Midjourney выкатили долгожданную функцию Character Reference, позволяющую создавать изображения последовательных персонажей на основе вашего референсного изображения. Вот основные моменты из анонса:

Используйте --cref URL после вашего запроса с URL-адресом изображения персонажа.

--cw изменяет "силу" совпадения от 0 до 100 (по умолчанию 100 - копирует лицо, волосы и одежду).

Функция лучше работает с персонажами, созданными Midjourney, а не с реальными фото.

Можно комбинировать несколько URL для смешивания персонажей.

Также можно комбинировать с --sref для ссылки на стиль.


Сделал пару тестов со своей фоткой и... Ну, дримбус может спокойно дрим дальше. Самый частый сценарий применения подобной функции — это использование реальных фото. И здесь как раз слабо. Хорошо забирает основные черты, но полное сходство получится примерно никогда. Но если отходить от фотореализма в стилистическую абстракцию, то вполне может быть полезным инструментом для сторителлинга.

В приложении один пример из тестов — character sheet — довольно показателен.
Емое, чуть не забыл рассказать: подготовил стероидную версию тренд-репорта на 2024 год и буду рассказывать о ней на онлайн-конференции по нейронным сетям «Навыки будущего» от Skillbox уже в этот понедельник в 18:00. Советую прийти тем, кто всё ещё слабо понимает, что вообще происходит и куда мы все так весело летим.

Ну и посмотрите программу, там довольно много интересных тем. Планирую как минимум посмотреть, как GPT помогает в запуске стартапов (делаю стартап), а также 3D + Stable. Все это бесплатно, но иногда красивый человек (не я) будет рассказывать вам про курс (хороший).

Так что записывайтесь или не записывайтесь, управляйте своей жизнью сами!
#ЧтоТоИнтересное (11-17 марта 2024)

1) Мощно зафорсился сервис Face-to-many, который с помощью контролнета аутентично превращает всех подряд в персонажей олдскульных видеоигр. Сегодня попробовал сделать — просит данные биллинга, видимо, из-за спроса. Если вы любите такую стилистику (я люблю), советую проверить лоры и модели вот этого господина, чтобы запускать всё это локально.

2) Самый известный генеративный апскейлер Magnific AI научился переносить стили (1 видео). Результат — отличный, сфер применений — масса.

Тем временем один товарищ в Твиттере деконструировал пайплайн их апскейлера и выложил всё у себя в треде. Если коротко: MultiDiffusion, ControlNet tiles и лоры на детали. Если вы хотите бесплатный Magnific у себя в автоматике — прошу в тред за мякоткой.

В комментарии пришёл основатель Magnific с большим постом о том, что Krea, Leonardo и т. д. нас копируют, но у нас круче. Но в целом, у каждого апскейлера должна быть своя фишка, не нужно пытаться копировать других.

3) Почему-то забытый сообществом Ideogram обновился (аж 28 февраля).

Кто пропустил, это txt-to-img модель от бывших сотрудников Google. Отличное качество, но самая главная фишка — с текстом на генерациях Ideogram справляется лучше (второе видео), чем предстоящий Stable Diffusion 3.

4) OpenAI и производитель терминаторов роботов Figure показали первое совместное демо (3 видео). GPT отвечает за восприятие и общение с человеком, а "спинной мозг" Т-800 робота превращает эту информацию в движения.

Стэй тюнд! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM