Forwarded from Афиша Daily
На Эмили Пеллегрини в запрещенном инстаграме за четыре месяца подписались 141 тыс. человек, а ее аккаунт на Fanvue (с откровенным контентом) принес 10 тыс. долларов за шесть недель. И хотя фото и видео Эмили выглядят реалистично, она полностью сгенерирована ИИ.
Создатель дипфейк-модели говорит, что ей в директ пишут футболисты, миллиардеры и бойцы ММА: «Они думают, что она реальна. Приглашают ее в Дубай, чтобы встретиться и поесть в отличных ресторанах».
По словам разработчика, он придумал внешность Эмили с помощью ChatGPT: «Я спросил ChatGPT, о чем мечтает среднестатистический мужчина, и он ответил: „каштановые длинные волосы и длинные ноги“, поэтому я сделал ее именно такой».
Подписывайтесь на Афишу Daily 🙃
Создатель дипфейк-модели говорит, что ей в директ пишут футболисты, миллиардеры и бойцы ММА: «Они думают, что она реальна. Приглашают ее в Дубай, чтобы встретиться и поесть в отличных ресторанах».
По словам разработчика, он придумал внешность Эмили с помощью ChatGPT: «Я спросил ChatGPT, о чем мечтает среднестатистический мужчина, и он ответил: „каштановые длинные волосы и длинные ноги“, поэтому я сделал ее именно такой».
Подписывайтесь на Афишу Daily 🙃
Благодаря подписчкам —преступление раскрыто.
Предпримчивый товарищ берет в интернете тела моделей (гуглится реверсивным поиском по картинке) и добавляет лицо.
Начинаем 2024 с похищения тел!🥂
Предпримчивый товарищ берет в интернете тела моделей (гуглится реверсивным поиском по картинке) и добавляет лицо.
Начинаем 2024 с похищения тел!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Поболтали о всяком https://youtu.be/wDIVUob58oo?si=ZZU08Cf4Mx7DF8D-
YouTube
Что будет с творчеством | КРЕАТОР АЛЕКСАНДР ДОБРОКОТОВ (AI Molodca)
Производство: БИГ НАМБРЗ
телеграм канал Сергея Мезенцева - https://t.me/simbackstage
Сегодня у нас в гостя креативный директор, креатор, сценарист, комик и друг Сережи Александр Доброкотов. Говорим про нейросети с точки зрения творчества: убьет ли его искусственный…
телеграм канал Сергея Мезенцева - https://t.me/simbackstage
Сегодня у нас в гостя креативный директор, креатор, сценарист, комик и друг Сережи Александр Доброкотов. Говорим про нейросети с точки зрения творчества: убьет ли его искусственный…
НЕЙРОТРЕНДРЕПОРТ 2024 😋
Этот пост был написан в начале января, но я был слишком погоревший, чтобы его выкладывать. Сейчас же, вышло пару новостей, которые подтвердили его тезисы, я отдохнул, поэтому с новыми силами, возвращаюсь к постингу!
В целом.
Магия уходит, технологии остаются.
Вспоминаю свою упавшую челюсть от первых генерации в Midjourney V3 и первого опыта общения с ChatGpt 3.5 в 2022 году. Сейчас же нейросети — как утренний кофе — норма. Шаманской техномагии для избранных больше нет. Есть полезные сервисы интегрированные в повседневную жизнь людей. Конечно, пока далеко не всех, но это вопрос плавно решает плотная интеграции ИИ в привычные массовые экосистемы (Google, Adobe, Microsoft, телефоны и т.д). Потому что: удобно, быстро и полезно. Конечно, будут еще яркие вспышки т.н хайпа, когда придется подбирать челюсть с пола, например SORA или возможность генерировать анимешных девочек и дипломы силой мысли через Нейролинк Маска. Но в целом, нейронные сети в этом году окончательно станут новой нормой.
Это будет год видео.
2023 был разминкой. Здесь можно было написать одно слово: SORA. Но ведь еще нас ждет гиперконтролируемая модель от ТикТока, новые версии Gen и Pika, Stable Diffusion Video обрастающий новым функционалом от энтузиастов и многое другое. Цунами генеративных клипов, рекламы,порно, фильмов, образовательных материалов — на подходе. А про страх перед этой волной хорошо написал мой товарищ Сережа Валяев.
Это будет год скандалов.
Обратная сторона возросшей доступности и качества нейросетей. Мы с вами молодцы — используем их возможности во благо. Но есть и киберпреступнки, пропагандисты, дезинформаторы и прочий скам, которые получили новые игрушки. Быстрые и простые дипфейки, клонирование голоса, фотореалистичные генерации - все это приводит к тому, что становятся возможным украсть 25 миллионов долларов у транснациональной корпорации с помощью дипфейка или собирать 28 миллионов просмотров за три дня на фэйковых фото и десятки других случаев. Лагающая регуляция на подходе. OpenAI вводит метаданные и вотермарки для маркировки изображений. Теперь каждая ИИ-картинка на поддерживающих ресурсах будет отмечена вотермаркой. А ЕС вводит уголовную ответственность за дипфейки и нейропорно. Но это все корпоративные игры — благодаря Open Source решениям никто не застрахован от сценария, когда вашей бабушке придет кружок с вашим дипфейком и вашим голосом попросит прислать все накопления.
Привыкайте дважды проверять всё, что видите и слышите в интернете. Также расскажите об этом близким, которые не знакомы с нейросетями.
Это будет год мобильности.
Станем еще ближе к Джарвис Тони Старка. Языковые модели одновременно растут и пухнут, например, новая Гуловская Gemini 1.5 сможет есть больше миллиона токенов на вход (это примерно 700 тысяч слов) и оперировать с ними с высочайшей точностью. И одновременно становятся компактней и локальней, позволяя запускаться на вашемкалькуляторе телефоне. Поэтому мобильные пионеры встроенного LLM: Samsung и Google — это только начало. Совсем скоро можно будет запускать даже на часах. И это не говоря о том, что тренд на персонализацию и мультимодальность никуда не ушел.
Ну и конечно...
Нейроифлюенсеры, музыка, 3D, повышенный спрос на ML специалистов и нейродизайнеров, интеграция в бизнес, засилье нейроинфоцыган и другие интересные вещи. Здесь я уже подумал, что устанете читать.
В любом случае, будет весело. Так что пристегиваемся.🦆
Этот пост был написан в начале января, но я был слишком погоревший, чтобы его выкладывать. Сейчас же, вышло пару новостей, которые подтвердили его тезисы, я отдохнул, поэтому с новыми силами, возвращаюсь к постингу!
В целом.
Магия уходит, технологии остаются.
Вспоминаю свою упавшую челюсть от первых генерации в Midjourney V3 и первого опыта общения с ChatGpt 3.5 в 2022 году. Сейчас же нейросети — как утренний кофе — норма. Шаманской техномагии для избранных больше нет. Есть полезные сервисы интегрированные в повседневную жизнь людей. Конечно, пока далеко не всех, но это вопрос плавно решает плотная интеграции ИИ в привычные массовые экосистемы (Google, Adobe, Microsoft, телефоны и т.д). Потому что: удобно, быстро и полезно. Конечно, будут еще яркие вспышки т.н хайпа, когда придется подбирать челюсть с пола, например SORA или возможность генерировать анимешных девочек и дипломы силой мысли через Нейролинк Маска. Но в целом, нейронные сети в этом году окончательно станут новой нормой.
Это будет год видео.
2023 был разминкой. Здесь можно было написать одно слово: SORA. Но ведь еще нас ждет гиперконтролируемая модель от ТикТока, новые версии Gen и Pika, Stable Diffusion Video обрастающий новым функционалом от энтузиастов и многое другое. Цунами генеративных клипов, рекламы,
Это будет год скандалов.
Обратная сторона возросшей доступности и качества нейросетей. Мы с вами молодцы — используем их возможности во благо. Но есть и киберпреступнки, пропагандисты, дезинформаторы и прочий скам, которые получили новые игрушки. Быстрые и простые дипфейки, клонирование голоса, фотореалистичные генерации - все это приводит к тому, что становятся возможным украсть 25 миллионов долларов у транснациональной корпорации с помощью дипфейка или собирать 28 миллионов просмотров за три дня на фэйковых фото и десятки других случаев. Лагающая регуляция на подходе. OpenAI вводит метаданные и вотермарки для маркировки изображений. Теперь каждая ИИ-картинка на поддерживающих ресурсах будет отмечена вотермаркой. А ЕС вводит уголовную ответственность за дипфейки и нейропорно. Но это все корпоративные игры — благодаря Open Source решениям никто не застрахован от сценария, когда вашей бабушке придет кружок с вашим дипфейком и вашим голосом попросит прислать все накопления.
Привыкайте дважды проверять всё, что видите и слышите в интернете. Также расскажите об этом близким, которые не знакомы с нейросетями.
Это будет год мобильности.
Станем еще ближе к Джарвис Тони Старка. Языковые модели одновременно растут и пухнут, например, новая Гуловская Gemini 1.5 сможет есть больше миллиона токенов на вход (это примерно 700 тысяч слов) и оперировать с ними с высочайшей точностью. И одновременно становятся компактней и локальней, позволяя запускаться на вашем
Ну и конечно...
Нейроифлюенсеры, музыка, 3D, повышенный спрос на ML специалистов и нейродизайнеров, интеграция в бизнес, засилье нейроинфоцыган и другие интересные вещи. Здесь я уже подумал, что устанете читать.
В любом случае, будет весело. Так что пристегиваемся.
Please open Telegram to view this post
VIEW IN TELEGRAM
Киллер-фича #Midjourney V6 🤔
За всем потоком новостей я её пропустил, а вы не пропускайте. Style Transfer - возможность использовать любую картинку как стилевой референс. То есть, вы можете написать промпт, кинуть URL изображения, и на выходе получится генерация, учитывающая стилистику этого изображения.
Сделал несколько примеров с промптом: CAT WITH KNIFE + (стилевой референс).
Чем это отличается от обычного добавления картинок в промпт?🤨
По классической схеме с картинки бралось и смешивалось всё. То есть, если бы я кинул Марго Робби как обычный референс, то на выходе получилась бы розовая женщина-кошка с ножом.
Стилевой референс - про стиль, эстетику, но не конкретный объект или сюжет.
Почему это круто?😋
Больший контроль и возможность сохранения стилевой последовательности, чего сейчас приходится добиваться танцами с бубном. Midjourney плавно переходит от "сделать капец красиво" к "сделать капец красиво и как надо".
Как использовать стилевые референсы?
После вашего промпта введите --sref вместе с URL изображения
Что еще?
Можно использовать НЕСКОЛЬКО изображений, например --sref urlA urlB urlC
Можно установить ВЕС каждого стиля, например --sref urlA::2 urlB::3 urlC::5
Можно установить СИЛУ стиля через --sw 100 (100 - это по умолчанию, 0 - выключено, 1000 - максимум).
Я пойду дальше проводить эксперименты, а вы кидайте в комментарии свои.🍴
За всем потоком новостей я её пропустил, а вы не пропускайте. Style Transfer - возможность использовать любую картинку как стилевой референс. То есть, вы можете написать промпт, кинуть URL изображения, и на выходе получится генерация, учитывающая стилистику этого изображения.
Сделал несколько примеров с промптом: CAT WITH KNIFE + (стилевой референс).
Чем это отличается от обычного добавления картинок в промпт?
По классической схеме с картинки бралось и смешивалось всё. То есть, если бы я кинул Марго Робби как обычный референс, то на выходе получилась бы розовая женщина-кошка с ножом.
Стилевой референс - про стиль, эстетику, но не конкретный объект или сюжет.
Почему это круто?
Больший контроль и возможность сохранения стилевой последовательности, чего сейчас приходится добиваться танцами с бубном. Midjourney плавно переходит от "сделать капец красиво" к "сделать капец красиво и как надо".
Как использовать стилевые референсы?
После вашего промпта введите --sref вместе с URL изображения
Что еще?
Можно использовать НЕСКОЛЬКО изображений, например --sref urlA urlB urlC
Можно установить ВЕС каждого стиля, например --sref urlA::2 urlB::3 urlC::5
Можно установить СИЛУ стиля через --sw 100 (100 - это по умолчанию, 0 - выключено, 1000 - максимум).
Я пойду дальше проводить эксперименты, а вы кидайте в комментарии свои.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Предложили попробовать Фильтрумы у Шедеврума. Попробовал и рассказываю!
Сразу скажу, я не пользуюсь Шедеврумом в своих процессах. Но всегда советую его тем, кто вообще никогда не сталкивался с диффузионками, но хотел бы вкатиться в генерацию картинок. Потому что проще не бывает: UI, подсказки, промптинг на русском. Ну и лайки-подписки, которые позволяют не терять интерес к процессу. Это крутой продуктовый пример, когда сложная начинка завернута в очень простую и понятную обертку. Ну а потом сразу в Comfy, хехе (нет).
Так вот, так называемые Фильтрумы продолжают эту концепцию упрощения для массовой аудитории. Если коротко, то это img-to-img с опциональным controlnet (edge). Грузите картинку, пишите промпт, крутите ползунок местного denoise strength, получаете модифицированную картинку.
Классика, но есть продуктовый фишка. Вы можете сохранить свой удачный промпт, а другие им пользоваться. Это сущность и есть фильтрум.
Я сразу сделал идеальный — ВОЛЧАРЫ🐺 . Позволяет превращать себя в Стетхама в героя пацанских цитатников. Дополнительная область прикола — смотреть, как по-разному люди его используют. Посмотреть можно здесь. Ну и попробовать, конечно.
А я пойду делать шрекофикатор.
Сразу скажу, я не пользуюсь Шедеврумом в своих процессах. Но всегда советую его тем, кто вообще никогда не сталкивался с диффузионками, но хотел бы вкатиться в генерацию картинок. Потому что проще не бывает: UI, подсказки, промптинг на русском. Ну и лайки-подписки, которые позволяют не терять интерес к процессу. Это крутой продуктовый пример, когда сложная начинка завернута в очень простую и понятную обертку. Ну а потом сразу в Comfy, хехе (нет).
Так вот, так называемые Фильтрумы продолжают эту концепцию упрощения для массовой аудитории. Если коротко, то это img-to-img с опциональным controlnet (edge). Грузите картинку, пишите промпт, крутите ползунок местного denoise strength, получаете модифицированную картинку.
Классика, но есть продуктовый фишка. Вы можете сохранить свой удачный промпт, а другие им пользоваться. Это сущность и есть фильтрум.
Я сразу сделал идеальный — ВОЛЧАРЫ
А я пойду делать шрекофикатор.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Я тут ушел с основной работы, чтобы играть в плойку, отдыхать и набираться сил для своих проектов. Поэтому появилось некоторое количество времени, чтобы возродить некоторые рубрики канала. Это дайджест новостей/какие-то штуки, которые мне показались интересными на этой неделе.
Назовем это #ЧтоТоИнтересное (4-10 марта 2024)
1. #Claude (главный конкурент ChatGPT) прокачался до третьей версии, поумнел, освоил мультимодальность и вообще держится молодцом. Главное преимущество на данный момент перед GPT4 — возможность подавать на вход большой объем данных (можно закинуть договора или небольшую книжку). Как это остроумно можно использовать в пайплайнах, можно посмотреть у Дениса.
2.Также клодовцы выпустили коллекцию промптов для разнообразных задач — от создания сайтов до генерации игр. Бывалых промтовиков не удивишь, но какие-то заходы можно подсмотреть.
3. #Midjourney круто обновили функцию /describe, которая позволяет превращать вашу картинку в промт и теперь, в комбинации с V6, работает отлично. Надеюсь на этой неделе выкатят обещанных последовательных персонажей.
4. Также Midjourney заблокировали доступ к сервису для сотрудников Stability AI после сбоя, связанного с интенсивным сбором данных. Эмад (глава Stability) пообещал разобраться в хулиганстве.
5. Ну и еще скандал. OpenAI публично пропесочила Илона Маска за лицемерие и судебные иски, указывая (с пруфами) на его прошлые попытки контролировать компанию.
6. Google обновили свой генератор музыки MusicFX — добавили режим DJ. Кидаете запросы, из них генерятся треки, а дальше регулируете их на ходу. Для серьезного продакшена не сгодится, но поиграться можно (только нужен хороший интернет, у меня работает через раз).
7. Ну и красивое. Кто-то смонтировал 75 видео из #SORA в одно большое, нарядное видео. Это мы смотрим и ждем.
Стэй тюнед🍎
Назовем это #ЧтоТоИнтересное (4-10 марта 2024)
1. #Claude (главный конкурент ChatGPT) прокачался до третьей версии, поумнел, освоил мультимодальность и вообще держится молодцом. Главное преимущество на данный момент перед GPT4 — возможность подавать на вход большой объем данных (можно закинуть договора или небольшую книжку). Как это остроумно можно использовать в пайплайнах, можно посмотреть у Дениса.
2.Также клодовцы выпустили коллекцию промптов для разнообразных задач — от создания сайтов до генерации игр. Бывалых промтовиков не удивишь, но какие-то заходы можно подсмотреть.
3. #Midjourney круто обновили функцию /describe, которая позволяет превращать вашу картинку в промт и теперь, в комбинации с V6, работает отлично. Надеюсь на этой неделе выкатят обещанных последовательных персонажей.
4. Также Midjourney заблокировали доступ к сервису для сотрудников Stability AI после сбоя, связанного с интенсивным сбором данных. Эмад (глава Stability) пообещал разобраться в хулиганстве.
5. Ну и еще скандал. OpenAI публично пропесочила Илона Маска за лицемерие и судебные иски, указывая (с пруфами) на его прошлые попытки контролировать компанию.
6. Google обновили свой генератор музыки MusicFX — добавили режим DJ. Кидаете запросы, из них генерятся треки, а дальше регулируете их на ходу. Для серьезного продакшена не сгодится, но поиграться можно (только нужен хороший интернет, у меня работает через раз).
7. Ну и красивое. Кто-то смонтировал 75 видео из #SORA в одно большое, нарядное видео. Это мы смотрим и ждем.
Стэй тюнед
Please open Telegram to view this post
VIEW IN TELEGRAM
claude.ai
Talk with Claude, an AI assistant from Anthropic
Под покровом ночи #Midjourney выкатили долгожданную функцию Character Reference, позволяющую создавать изображения последовательных персонажей на основе вашего референсного изображения. Вот основные моменты из анонса:
Сделал пару тестов со своей фоткой и... Ну, дримбус может спокойно дрим дальше. Самый частый сценарий применения подобной функции — это использование реальных фото. И здесь как раз слабо. Хорошо забирает основные черты, но полное сходство получится примерно никогда. Но если отходить от фотореализма в стилистическую абстракцию, то вполне может быть полезным инструментом для сторителлинга.
В приложении один пример из тестов —
Используйте --cref URL после вашего запроса с URL-адресом изображения персонажа.
--cw изменяет "силу" совпадения от 0 до 100 (по умолчанию 100 - копирует лицо, волосы и одежду).
Функция лучше работает с персонажами, созданными Midjourney, а не с реальными фото.
Можно комбинировать несколько URL для смешивания персонажей.
Также можно комбинировать с --sref для ссылки на стиль.
Сделал пару тестов со своей фоткой и... Ну, дримбус может спокойно дрим дальше. Самый частый сценарий применения подобной функции — это использование реальных фото. И здесь как раз слабо. Хорошо забирает основные черты, но полное сходство получится примерно никогда. Но если отходить от фотореализма в стилистическую абстракцию, то вполне может быть полезным инструментом для сторителлинга.
В приложении один пример из тестов —
character sheet
— довольно показателен.Емое, чуть не забыл рассказать: подготовил стероидную версию тренд-репорта на 2024 год и буду рассказывать о ней на онлайн-конференции по нейронным сетям «Навыки будущего» от Skillbox уже в этот понедельник в 18:00. Советую прийти тем, кто всё ещё слабо понимает, что вообще происходит и куда мы все так весело летим.
Ну и посмотрите программу, там довольно много интересных тем. Планирую как минимум посмотреть, как GPT помогает в запуске стартапов (делаю стартап), а также 3D + Stable. Все это бесплатно, но иногда красивый человек (не я) будет рассказывать вам про курс (хороший).
Так что записывайтесь или не записывайтесь, управляйте своей жизнью сами!
Ну и посмотрите программу, там довольно много интересных тем. Планирую как минимум посмотреть, как GPT помогает в запуске стартапов (делаю стартап), а также 3D + Stable. Все это бесплатно, но иногда красивый человек (не я) будет рассказывать вам про курс (хороший).
Так что записывайтесь или не записывайтесь, управляйте своей жизнью сами!
#ЧтоТоИнтересное (11-17 марта 2024)
1) Мощно зафорсился сервис Face-to-many, который с помощью контролнета аутентично превращает всех подряд в персонажей олдскульных видеоигр. Сегодня попробовал сделать — просит данные биллинга, видимо, из-за спроса. Если вы любите такую стилистику (я люблю), советую проверить лоры и модели вот этого господина, чтобы запускать всё это локально.
2) Самый известный генеративный апскейлер Magnific AI научился переносить стили (1 видео). Результат — отличный, сфер применений — масса.
Тем временем один товарищ в Твиттере деконструировал пайплайн их апскейлера и выложил всё у себя в треде. Если коротко: MultiDiffusion, ControlNet tiles и лоры на детали. Если вы хотите бесплатный Magnific у себя в автоматике — прошу в тред за мякоткой.
В комментарии пришёл основатель Magnific с большим постом о том, что Krea, Leonardo и т. д. нас копируют, но у нас круче. Но в целом, у каждого апскейлера должна быть своя фишка, не нужно пытаться копировать других.
3) Почему-то забытый сообществом Ideogram обновился (аж 28 февраля).
Кто пропустил, это txt-to-img модель от бывших сотрудников Google. Отличное качество, но самая главная фишка — с текстом на генерациях Ideogram справляется лучше (второе видео), чем предстоящий Stable Diffusion 3.
4) OpenAI и производительтерминаторов роботов Figure показали первое совместное демо (3 видео). GPT отвечает за восприятие и общение с человеком, а "спинной мозг" Т-800 робота превращает эту информацию в движения.
Стэй тюнд!🚀
1) Мощно зафорсился сервис Face-to-many, который с помощью контролнета аутентично превращает всех подряд в персонажей олдскульных видеоигр. Сегодня попробовал сделать — просит данные биллинга, видимо, из-за спроса. Если вы любите такую стилистику (я люблю), советую проверить лоры и модели вот этого господина, чтобы запускать всё это локально.
2) Самый известный генеративный апскейлер Magnific AI научился переносить стили (1 видео). Результат — отличный, сфер применений — масса.
Тем временем один товарищ в Твиттере деконструировал пайплайн их апскейлера и выложил всё у себя в треде. Если коротко: MultiDiffusion, ControlNet tiles и лоры на детали. Если вы хотите бесплатный Magnific у себя в автоматике — прошу в тред за мякоткой.
В комментарии пришёл основатель Magnific с большим постом о том, что Krea, Leonardo и т. д. нас копируют, но у нас круче. Но в целом, у каждого апскейлера должна быть своя фишка, не нужно пытаться копировать других.
3) Почему-то забытый сообществом Ideogram обновился (аж 28 февраля).
Кто пропустил, это txt-to-img модель от бывших сотрудников Google. Отличное качество, но самая главная фишка — с текстом на генерациях Ideogram справляется лучше (второе видео), чем предстоящий Stable Diffusion 3.
4) OpenAI и производитель
Стэй тюнд!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM