Forwarded from Технологии | Нейросети | NanoBanana
🔥 OpenAI пишут историю на наших глазах.
Встречаем Sora — новая модель text2video от OpenAI.
Нейросеть создаетслишком реалистичные ролики продолжительностью до минуты и может генерировать сложные сцены с несколькими персонажами и точными деталями даже на фоне. И всё это по довольно простому промпту.
Модель пока тестируют, но обещают дать попробовать и обычным смертным. Ждёмс😃
• Подробнее 1
• Подробнее 2
Встречаем Sora — новая модель text2video от OpenAI.
Нейросеть создает
Модель пока тестируют, но обещают дать попробовать и обычным смертным. Ждёмс
• Подробнее 1
• Подробнее 2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40🔥24👾8
This media is not supported in your browser
VIEW IN TELEGRAM
💻 Генератор изображений с удобным интерфейсом.
Энтузиаст запилил приятный интерфейс для нейронки GLIGEN: тут есть поля для рисования, подсказок и настройки — всё просто и доступно.
Нейросеть известна тем, что может генерировать объекты по текстовой подсказке в заданных вами областях и поддерживает различные стили.
• Github
• Подробнее
• Попробовать на HuggingFace
#иинструмент
Энтузиаст запилил приятный интерфейс для нейронки GLIGEN: тут есть поля для рисования, подсказок и настройки — всё просто и доступно.
Нейросеть известна тем, что может генерировать объекты по текстовой подсказке в заданных вами областях и поддерживает различные стили.
• Github
• Подробнее
• Попробовать на HuggingFace
#иинструмент
❤28🔥21
Forwarded from Технологии | Нейросети | NanoBanana
⚡️Молниеносная генерация изображений.
SDXL-Lightning — модель для генерации картинок по текстовому запросу с разрешением 1024х1024.
— Вводим промпт;
— Выбираем количество шагов от 1 до 8 (чем больше, тем лучше будет качество результата);
— Менее чем за минуту получаем бесплатную готовую пикчу.
• Код на huggingface
• Попробовать
• Colab (Free)
#иинструмент
SDXL-Lightning — модель для генерации картинок по текстовому запросу с разрешением 1024х1024.
— Вводим промпт;
— Выбираем количество шагов от 1 до 8 (чем больше, тем лучше будет качество результата);
— Менее чем за минуту получаем бесплатную готовую пикчу.
• Код на huggingface
• Попробовать
• Colab (Free)
#иинструмент
🔥20
Forwarded from Технологии | Нейросети | NanoBanana
Компания Stability AI выпустила предварительную версию Stable Diffusion 3.0, своей следующей флагманской модели text2image.
Улучшено качество изображений, улучшено написание текста
(?! смотрим прикреплённую пикчу), более высокая производительность и тд.
На данный момент доступ через лист ожидания.
• Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👾7❤4
Forwarded from Технологии | Нейросети | NanoBanana
Конкурс Дамы и Господа.
@deeppaintbot совместно с
@digitalrazor_pc проводит конкурс на лучшую ИИ генерацию.
Главный приз — сотрудничество на постоянной основе с DigitalRazor.
Правила, тематика и призы:
t.me/text2image/314014/314047
@deeppaintbot совместно с
@digitalrazor_pc проводит конкурс на лучшую ИИ генерацию.
Главный приз — сотрудничество на постоянной основе с DigitalRazor.
Правила, тематика и призы:
t.me/text2image/314014/314047
❤7👾5
Forwarded from Технологии | Нейросети | NanoBanana
• DeepPaint Telegram Bot
Бот для работы с фотографией.
- Замена лица на фото.
- Улучшение лица.
- Улучшение фулл фото.
- Удаление фона на фото.
Работает бесплатно, в порядке общей очереди.
• MidJourney Telegram Bot
Бот использует алгоритмы MidJourney, а не аналоги, поэтому полностью платный.
- Простая оплата из РФ.
- Доступны все режимы генераций.
- Адекватные цены.
- Быстрая генерация.
- Доступна 6 версия MidJourney.
• SlookBot
Твой персональный ИИстилист.
- Загружаем фото.
- Пишем запрос.
- Оцениваем себя в новом образе.
@qrcode
Please open Telegram to view this post
VIEW IN TELEGRAM
👾13🔥6❤4
Картинки к сообщению ниже.
1-4) Результаты рисовки по простым промтам.
5-7) Сложносоставной промт на ~120 токенов. Предварительная отработка на 6 и 7 не менялась, картинка рендрилась в разных разрешениях.
8) Потребление памяти при локальном запуске.
9) Интерфейс.
1-4) Результаты рисовки по простым промтам.
5-7) Сложносоставной промт на ~120 токенов. Предварительная отработка на 6 и 7 не менялась, картинка рендрилась в разных разрешениях.
8) Потребление памяти при локальном запуске.
9) Интерфейс.
👾11❤2
Всем привет!
Давно не писал в группу (слишком много дел и мало свободного времени), но тут просто нельзя пройти мимо.
Итак, всем известный разработчик lllyasviel (автор контролнета, Фооокуса, Форджа, свежего Релайта) выпустил новую шикарную вещь.
Omost - https://github.com/lllyasviel/Omost
Это LLM (большая языковая модель), которая по вашему запросу создаёт крутейшую картину с максимальным вниманием к деталям. Что бы было понятнее, принцип как у Dalle-3: вы даёте короткий промт (или максимально развёрнутый, по желанию), а ЛЛМ очень подробно расписывает ваш запрос, раскладывает его на составные части, планирует как всё это будет выглядеть в общем и в частностях.
Если интересно в подробностях, загляните на страницу, Иллия расписал всё сверхпонятно: как описывается начало, как разбивается на регионы, каким образом редактировать растояние до "зрителя", развёртка каждой части промта. После подготовительного этапа вся эта информация отправляется на генерацию. По умолчанию используется чекпоинт XL RealVisXL_V4.0 но можно подкинуть ему любой (в формате Диффузерсов). "Подготовительные" ЛЛМ, кстати, тоже стандартные (ллама-3, phi-3 и дельфин 2.9), единственное что - им требуется специальная дотренировка.
Выше я приложил картинки, которые получаются у Omost. Первые сделаны по простым промтам (битва тысяч орков и людей у города, орк бежит возле рушающейся стены, эльфийки плывут, идут вброд по реке), а следующая - подробно описана (цвет штанов, куртки, футболки, надпись на ней, ночной город с многоэтажками, стилистика аниме/не аниме). Конечно, проблемы нейросетей никуда не делись, но следование промту и внимание к деталям очень хороши.
Как же всё это потрогать, спросите вы?
Во-первых, есть готовая демка на Обнимашках. Работает она быстро (к тому же, абсолютно бесплатно и без ограничений), но порой не хочет рендрить картинку. Тут претензия к самим обнимашкам, да. Где-то 5 из 10 запросов у меня отработало нормально.
И конечно же, Иллия не был бы собой, если бы всё это не было доступно локально! Ссылка на инструкцию по локальной установке. Пройдёмся по пунктам.
Во-первых, естествинно, вам нужен Питон. Автор рекомендует 3.10.хх, соответственно, скачиваете 3.10.6 или 3.10.11 (что бы точно всё заработало). Если вы скачаете последнюю версию - ничего не заработает!
Далее нужны установленные git и Анаконда для 3.10.
Поставив всё в такой очерёдности (не забывайте обязательно ставить галки "добавить в ПУТЬ" и "интеграция с питоном" где они есть), открываем Anaconda Prompt (miniconda3) появившуюся у вас в Пуске и поочерёдно выполняем строчки инструкции на странице выше. Когда всё скачается и установится (5-20 минут) откроется ваш браузер по адресу http://localhost:7860 где будет простенький интерфейс для работы.
Что по памяти? Тут всё отлично, "базовая" ллама-3 q4 спокойно входит в 8 гигабайт VRAM (Скриншоты выше - во время работы ЛЛМ), ну а картинки рисуются на XL, что так же спокойно помещается там же.
На моей 3060 предварительный этап (развёртка через ЛЛМ) занимает где-то полторы-две минуты, рисовка картинки 1536х896 - секунд 40 без Хайрес-фикса и 3-4 минуты с ним.
Интерфейс, пока, максимально простой - нет ни смены чекпоинта, ни семплеров, ни сохранения картинок, ни даже батника запуска. Очень надеюсь на сообщество, что это нам быстро прикрутят :) Но если вы хотите пощупать одним из первых - то уже можно.
Давно не писал в группу (слишком много дел и мало свободного времени), но тут просто нельзя пройти мимо.
Итак, всем известный разработчик lllyasviel (автор контролнета, Фооокуса, Форджа, свежего Релайта) выпустил новую шикарную вещь.
Omost - https://github.com/lllyasviel/Omost
Это LLM (большая языковая модель), которая по вашему запросу создаёт крутейшую картину с максимальным вниманием к деталям. Что бы было понятнее, принцип как у Dalle-3: вы даёте короткий промт (или максимально развёрнутый, по желанию), а ЛЛМ очень подробно расписывает ваш запрос, раскладывает его на составные части, планирует как всё это будет выглядеть в общем и в частностях.
Если интересно в подробностях, загляните на страницу, Иллия расписал всё сверхпонятно: как описывается начало, как разбивается на регионы, каким образом редактировать растояние до "зрителя", развёртка каждой части промта. После подготовительного этапа вся эта информация отправляется на генерацию. По умолчанию используется чекпоинт XL RealVisXL_V4.0 но можно подкинуть ему любой (в формате Диффузерсов). "Подготовительные" ЛЛМ, кстати, тоже стандартные (ллама-3, phi-3 и дельфин 2.9), единственное что - им требуется специальная дотренировка.
Выше я приложил картинки, которые получаются у Omost. Первые сделаны по простым промтам (битва тысяч орков и людей у города, орк бежит возле рушающейся стены, эльфийки плывут, идут вброд по реке), а следующая - подробно описана (цвет штанов, куртки, футболки, надпись на ней, ночной город с многоэтажками, стилистика аниме/не аниме). Конечно, проблемы нейросетей никуда не делись, но следование промту и внимание к деталям очень хороши.
Как же всё это потрогать, спросите вы?
Во-первых, есть готовая демка на Обнимашках. Работает она быстро (к тому же, абсолютно бесплатно и без ограничений), но порой не хочет рендрить картинку. Тут претензия к самим обнимашкам, да. Где-то 5 из 10 запросов у меня отработало нормально.
И конечно же, Иллия не был бы собой, если бы всё это не было доступно локально! Ссылка на инструкцию по локальной установке. Пройдёмся по пунктам.
Во-первых, естествинно, вам нужен Питон. Автор рекомендует 3.10.хх, соответственно, скачиваете 3.10.6 или 3.10.11 (что бы точно всё заработало). Если вы скачаете последнюю версию - ничего не заработает!
Далее нужны установленные git и Анаконда для 3.10.
Поставив всё в такой очерёдности (не забывайте обязательно ставить галки "добавить в ПУТЬ" и "интеграция с питоном" где они есть), открываем Anaconda Prompt (miniconda3) появившуюся у вас в Пуске и поочерёдно выполняем строчки инструкции на странице выше. Когда всё скачается и установится (5-20 минут) откроется ваш браузер по адресу http://localhost:7860 где будет простенький интерфейс для работы.
Что по памяти? Тут всё отлично, "базовая" ллама-3 q4 спокойно входит в 8 гигабайт VRAM (Скриншоты выше - во время работы ЛЛМ), ну а картинки рисуются на XL, что так же спокойно помещается там же.
На моей 3060 предварительный этап (развёртка через ЛЛМ) занимает где-то полторы-две минуты, рисовка картинки 1536х896 - секунд 40 без Хайрес-фикса и 3-4 минуты с ним.
Интерфейс, пока, максимально простой - нет ни смены чекпоинта, ни семплеров, ни сохранения картинок, ни даже батника запуска. Очень надеюсь на сообщество, что это нам быстро прикрутят :) Но если вы хотите пощупать одним из первых - то уже можно.
🔥52❤14👾4