Stable diffusion, ComfyUI, Flux
3.45K subscribers
7.44K photos
90 videos
20 files
879 links
Все вместе тут: обучающие ролики по Stable diffusion, ссылки на что полезное, генерации, промпты. Донат https://boosty.to/stable/donate
Download Telegram
Forwarded from Neurogen
Подборка бесплатных онлайн нейронок для работы с фото.

PuLID for FLUX. При помощи данного инструмента вы можете сгенерировать как нейросетевое фото, так и арт с вашим лицом или лицом любого человека. Работает на базе Flux, по этому качество генераций весьма достойное.
Попробовать PuLID for FLUX

Expression Editor. Позволяет менять выражение лица и мимику на фото. Также можно поменять положение головы, направление взгляда. Работает достаточно быстро, но из минусов - кропает картинку до квадрата.
Попробовать Expression Editor

IC-Light V2. Данный инструмент позволяет сделать релайт фотографии - поменять освещение в кадре. Важный момент - также меняется фон, а также нормально работает только с изображениями в портретной ориентации.
Попробовать IC-Light V2

Diffusers Image Outpaint. Позволяет дорисовать фон на изображении, тем самым расширяя его.
Попробовать Diffusers Image Outpaint

Neurogen - подпишись, тут рассказывают про нейросети
Нашел призанятнейший сайтец, на котором можно создавать игры с помощью нейронки не написав самостоятельно вообще ни строчки кода. Просто выбираем шаблон и говорим нейронке, что мы хотим получить, а она поэтапно с этим помогает. Скрафтил это примерно за пару часов с нескольких попыток (нейронка порой люто тупит, хотя и понимает запросы на русском). Сайт позволяет генерировать ассеты графона прямо на нем, но я предпочел сгенерить их в другом месте и притащить туда уже готовые. Сгенерил всю графику, музыку и звуки.

Вашему вниманию представляю мини-игру Sailor Moon Pineapple Maze
Цель игры - заработать как можно очков. Очки зарабатываются при совершении шагов, сборе ананасов, убийстве монстров и прохождении уровня. Изначально дается 75 шагов. Битва с монстром отнимает шаги. Сбор ананасов добавляет. Убил всех монстров? Получи бонус! Собрал все ананасы? Еще бонус! Чтобы перейти на следующий уровень необходимо собрать все ананасы и пройти в дверь (и получить за это еще бонус естественно). А как далеко вы сможете зайти? делитесь скринами ваших результатов в комментариях! Также пробуйте тоже создавать свои игры и делитесь ссылками на них.

Управление мышь/стрелочки/wasd

Попробовать игру (а также опробовать сам сайт и сотворить свою) можно тут: https://play.rosebud.ai/games/5e96ef6c-6739-4676-84ba-86ab5df772ee
Forwarded from Движитал
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Psy Eyes
Дайджест:

📹 ВИДЕО + АРТ 🎨

PostShot: появилась интеграция с UE 5.4 для редактирования в нём сплатов, исправили баги при тренировке сцен и импорте/экспорте файлов, и другие улучшения.

Runway: расширили генерацию видео до 20 сек. Плюс обновили API, добавив доступ к контролю камеры Turbo.

Neurogen: появилась оптимизированная версия дипфейкера DeepFaceLab, а также FaceFusion 3.1.

Recraft: обновили свой генератор картинок до V3 и вышли в топ text-2-image моделей, обогнав Flux, MJ, Ideogram, и всех остальных. Можно бесплатно опробовать у них на сайте. Также есть версия, которая затюнена выдавать SVG.

BFL: релизнули Flux 1.1 Pro Ulta для генерации изображений в 4MP и RAW версию с имитацией "обычных фото". Доступно только по API.

Bytedance: выпустили SeeEdit для стайлтрансфера картинки с высокой точностью.

Nvidia: дропнули Llama Mesh для генерации 3D мешей по текстовому описанию с помощью LLM, плюс чата и редактирования.

DimensionX: опенсорсное создание видео с контролем камеры на основе одного изображения. На данный момент движение есть влево и вверх. Работает в связке с CogVideoX.

MagicQuill: онлайн редактирование изображение рисованием и промтом. Напоминает Invoke.

PyramidFlow: ещё один открытый видеогенератор с поддержкой Img2Video. Теперь с кадрами на основе Flux. На выходе видео 768p длиной в 10 сек. Установка через Pinokio.

Bria: обновлённый удалятор фона RMBG-2. Хорошо работает со сложной композицией, есть пакетная обработка, и можно кормить картинки как с компа, так и по ссылкам. Установка через Pinokio.

InstantX: выкатили апскейлер изображений InstantIR. Есть восстановление с точным следованием рефу или по "своему видению" (creative restoration). Установка в Pinokio.

Также они опубликовали метод более точного следования промту в t2i без тренировки + ещё одна работа на эту тему (спс @JohnDoe171).

CogVideoX: выпустили версию v 1.5 своего генератора видео с 5B параметрами. Тесты.

Vidu: обновили видеогенератор до V 1.5. Подняли качество генераций, улучшили следование промту, добавили консистентную работу с персонажами.

Добавление текста на задний фон с его настройкой.

🎸 ЗВУК 🎸

DeepL: представили Voice режим для перевода голоса в текст для бизнес сегмента.

SI: выпустили Hertz-dev, генератор речи (TTS) работающий в audio-2-audio с маленькой задержкой. Может выдавать как слова за одно человека, так и за двоих.

Hallucinator: моделька на основе Hertz выше для продолжения слов в загруженном аудио семпле.

e2f5: появилась возможность делать генерацию речи на основе фантюнов e2f5 от других людей через выбор Custom модели для инференса. На русском не видно пока тюнов.

Веб-интерфейс для работы с разными опенсорсными TTS.

🤖 ЧАТЫ 🤖

Alibaba: рвёт и мечет и после своего опенсорсного кодера, выпустили Turbo — языковую модель (LLM) с контекстом 1 млн токенов. Можно скормить книг 10, или 150 часов транскрибации речи, или 30к строк кода. Демо. API дешевле GPT-4o-mini.

Llama 3.2-11B, умеющая из коробки чатиться по визуалу, вышла в тираж и доступна в Ollama через OpenWebUI. Нужно минимум 8ГБ VRAM.

Mistral: выпустили Pixtral Large, визуальную языковую модель (VLM) для чата по визуалу, которая на бенчах лучше других открытых и закрытых, но размером 124B и её не погонять дома в отличие от Ламы 3.2-11B. Онлайн демо.

MinerU: конвертер PDF файлов в текст с markdown форматированием или JSON.

Google: выкатили Gemini-Exp-1114 и он попал в топ лидерборда LLM. Можно погонять на арене.

OpenAI: дропнули приложение ChatGPT на Windows.

Anthropic: с помощью Computer Use можно дать Claude выполнять задания на компе через API. Плюс тулза от сообщества для этого на Win/Mac... Microsoft Recall ты ли это?

AnyChat: в онлайн чат, где есть последние модели Qwen, Claude итд, добавили DeepSeek v2.5. Некоторые можно потестить бесплатно.

Cinnamon: выпустили Kotaemon, фреймворк, который пользователи могут использовать для чата по докам, а разрабы как шаблон для RAG.

💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
Please open Telegram to view this post
VIEW IN TELEGRAM
https://pinokio.computer/
Для установки нейронок. Спасибо подписчику, благодаря которому я всё-таки поставил. Много слышал о нём, но игнорировал. Подписчик заметил, что там всё раньше появляется. Очень удобно, так как не требуются выполнять кучу шагов в терминале.
Всем привет. Как вы, наверное, заметили, я стал реже постить. Связано это с тем, что мой компьютер с октября выдает синие экраны после 5 минут работы. Сейчас я ищу туториал как поставить ComfyUI на мак с api к black forest. Чтобы шла генерация за кредиты через их сайт. Если у кого есть ролик, как установить, киньте ссылку в коментариях.
А пока в качестве новости сообщаю, что есть сайт промптов к различным моделям. Из-за того, что я немного выпал, то узнал о нём только сейчас.
https://prompthero.com/flux-prompts
https://youtu.be/F2tUaaSiU8g?si=NHZRTe9RARik5AN7
Блоггер живёт где-то за рубежом. Поэтому говорит с акцентом. А так как он иностранец, ему не нужны ваши копейки на бусти. Благодаря этому нету этого всего, что в последнее время у всех блоггеров: "Заплатите мне бабос, чтобы получить все схемы".
Всё ребята. Я в деле. Вчера потратил сутки на решение проблемы с ноутбуком. Проблема была в сломаных кодовых таблицах на жестком диске и повреждении системных файлов винды. Несмотря на исправление, синие экраны смерти окончательно добили Граб. Сутки я потратил на поиск идеального Линукса. Понравился Manjaro, но там пришлось много пакетов ставить, чтобы запустить Комфи. Я хотел, чтобы было очень просто, как на винде. И я такой вариант нашёл. Linux Mint просто идеален, я сейчас с него пишу. После установки, выбрал пропиетарные драйвера Nvidia, затем скачал pinokio, deb пакет, который встал без проблем. Затем просто выбрал Комфи и просто сел ждать, когда он поставит все зависимости. Два недостатка: Пинокио скачивает в конце модель flux, которая мне не подходит и у меня есть своя. Второй недостаток, виден на скрине. У Пинокио нет иконки, поэтому в панели задач он выглядит, как невидимая иконка. И надо знать куда нажимать. Хотя, если вы на работе, то это даже фича 😁. Что по скорости? Тоже самое, что и на винде. Но винда за год раздулась до неприличных размеров. Так что остаюсь на Минте.
Сгенерировал обои для рабочего стола Linux. Я видел похожие обои в Manjaro и они мне очень понравились. В комментариях к посту найдете архив, где все эти генерации в несжатом виде, можете перетащить одну из них в ComfyUI и вы получите все настройки.

Prompt: sea, lighthouse, autumn in close, mountains with snow picks in far, flat art, light vector