Forwarded from Neurogen
Подборка бесплатных онлайн нейронок для работы с фото.
PuLID for FLUX. При помощи данного инструмента вы можете сгенерировать как нейросетевое фото, так и арт с вашим лицом или лицом любого человека. Работает на базе Flux, по этому качество генераций весьма достойное.
Попробовать PuLID for FLUX
Expression Editor. Позволяет менять выражение лица и мимику на фото. Также можно поменять положение головы, направление взгляда. Работает достаточно быстро, но из минусов - кропает картинку до квадрата.
Попробовать Expression Editor
IC-Light V2. Данный инструмент позволяет сделать релайт фотографии - поменять освещение в кадре. Важный момент - также меняется фон, а также нормально работает только с изображениями в портретной ориентации.
Попробовать IC-Light V2
Diffusers Image Outpaint. Позволяет дорисовать фон на изображении, тем самым расширяя его.
Попробовать Diffusers Image Outpaint
Neurogen - подпишись, тут рассказывают про нейросети
PuLID for FLUX. При помощи данного инструмента вы можете сгенерировать как нейросетевое фото, так и арт с вашим лицом или лицом любого человека. Работает на базе Flux, по этому качество генераций весьма достойное.
Попробовать PuLID for FLUX
Expression Editor. Позволяет менять выражение лица и мимику на фото. Также можно поменять положение головы, направление взгляда. Работает достаточно быстро, но из минусов - кропает картинку до квадрата.
Попробовать Expression Editor
IC-Light V2. Данный инструмент позволяет сделать релайт фотографии - поменять освещение в кадре. Важный момент - также меняется фон, а также нормально работает только с изображениями в портретной ориентации.
Попробовать IC-Light V2
Diffusers Image Outpaint. Позволяет дорисовать фон на изображении, тем самым расширяя его.
Попробовать Diffusers Image Outpaint
Neurogen - подпишись, тут рассказывают про нейросети
Стабили выпустило статью о том, как правильно писать промпт
https://stability.ai/learning-hub/stable-diffusion-3-5-prompt-guide?utm_medium=email&_hsenc=p2ANqtz--A0C0EPeK_YqE72Mk3xDVM9NWzEsTDyHvwk1Xu5Izbe_0TQsfzPCc__ltlrYgHWobHVZMzsM0NrDLBNv58g9_ermZfxw&_hsmi=98780518&utm_content=98780518&utm_source=hs_email
https://stability.ai/learning-hub/stable-diffusion-3-5-prompt-guide?utm_medium=email&_hsenc=p2ANqtz--A0C0EPeK_YqE72Mk3xDVM9NWzEsTDyHvwk1Xu5Izbe_0TQsfzPCc__ltlrYgHWobHVZMzsM0NrDLBNv58g9_ermZfxw&_hsmi=98780518&utm_content=98780518&utm_source=hs_email
Stability AI
Stable Diffusion 3.5 Prompt Guide — Stability AI
This guide offers practical prompting tips for Stable Diffusion 3.5, allowing you to refine image concepts quickly and precisely.
Forwarded from Нейромаргиналы 18+
Нашел призанятнейший сайтец, на котором можно создавать игры с помощью нейронки не написав самостоятельно вообще ни строчки кода. Просто выбираем шаблон и говорим нейронке, что мы хотим получить, а она поэтапно с этим помогает. Скрафтил это примерно за пару часов с нескольких попыток (нейронка порой люто тупит, хотя и понимает запросы на русском). Сайт позволяет генерировать ассеты графона прямо на нем, но я предпочел сгенерить их в другом месте и притащить туда уже готовые. Сгенерил всю графику, музыку и звуки.
Вашему вниманию представляю мини-игру Sailor Moon Pineapple Maze
Цель игры - заработать как можно очков. Очки зарабатываются при совершении шагов, сборе ананасов, убийстве монстров и прохождении уровня. Изначально дается 75 шагов. Битва с монстром отнимает шаги. Сбор ананасов добавляет. Убил всех монстров? Получи бонус! Собрал все ананасы? Еще бонус! Чтобы перейти на следующий уровень необходимо собрать все ананасы и пройти в дверь (и получить за это еще бонус естественно). А как далеко вы сможете зайти? делитесь скринами ваших результатов в комментариях! Также пробуйте тоже создавать свои игры и делитесь ссылками на них.
Управление мышь/стрелочки/wasd
Попробовать игру (а также опробовать сам сайт и сотворить свою) можно тут: https://play.rosebud.ai/games/5e96ef6c-6739-4676-84ba-86ab5df772ee
Вашему вниманию представляю мини-игру Sailor Moon Pineapple Maze
Цель игры - заработать как можно очков. Очки зарабатываются при совершении шагов, сборе ананасов, убийстве монстров и прохождении уровня. Изначально дается 75 шагов. Битва с монстром отнимает шаги. Сбор ананасов добавляет. Убил всех монстров? Получи бонус! Собрал все ананасы? Еще бонус! Чтобы перейти на следующий уровень необходимо собрать все ананасы и пройти в дверь (и получить за это еще бонус естественно). А как далеко вы сможете зайти? делитесь скринами ваших результатов в комментариях! Также пробуйте тоже создавать свои игры и делитесь ссылками на них.
Управление мышь/стрелочки/wasd
Попробовать игру (а также опробовать сам сайт и сотворить свою) можно тут: https://play.rosebud.ai/games/5e96ef6c-6739-4676-84ba-86ab5df772ee
Forwarded from Движитал
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Psy Eyes
Дайджест:
📹 ВИДЕО + АРТ 🎨
PostShot: появилась интеграция с UE 5.4 для редактирования в нём сплатов, исправили баги при тренировке сцен и импорте/экспорте файлов, и другие улучшения.
Runway: расширили генерацию видео до 20 сек. Плюс обновили API, добавив доступ к контролю камеры Turbo.
Neurogen: появилась оптимизированная версия дипфейкера DeepFaceLab, а также FaceFusion 3.1.
Recraft: обновили свой генератор картинок до V3 и вышли в топ text-2-image моделей, обогнав Flux, MJ, Ideogram, и всех остальных. Можно бесплатно опробовать у них на сайте. Также есть версия, которая затюнена выдавать SVG.
BFL: релизнули Flux 1.1 Pro Ulta для генерации изображений в 4MP и RAW версию с имитацией "обычных фото". Доступно только по API.
Bytedance: выпустили SeeEdit для стайлтрансфера картинки с высокой точностью.
Nvidia: дропнули Llama Mesh для генерации 3D мешей по текстовому описанию с помощью LLM, плюс чата и редактирования.
DimensionX: опенсорсное создание видео с контролем камеры на основе одного изображения. На данный момент движение есть влево и вверх. Работает в связке с CogVideoX.
MagicQuill: онлайн редактирование изображение рисованием и промтом. Напоминает Invoke.
PyramidFlow: ещё один открытый видеогенератор с поддержкой Img2Video. Теперь с кадрами на основе Flux. На выходе видео 768p длиной в 10 сек. Установка через Pinokio.
Bria: обновлённый удалятор фона RMBG-2. Хорошо работает со сложной композицией, есть пакетная обработка, и можно кормить картинки как с компа, так и по ссылкам. Установка через Pinokio.
InstantX: выкатили апскейлер изображений InstantIR. Есть восстановление с точным следованием рефу или по "своему видению" (creative restoration). Установка в Pinokio.
Также они опубликовали метод более точного следования промту в t2i без тренировки + ещё одна работа на эту тему (спс @JohnDoe171).
CogVideoX: выпустили версию v 1.5 своего генератора видео с 5B параметрами. Тесты.
Vidu: обновили видеогенератор до V 1.5. Подняли качество генераций, улучшили следование промту, добавили консистентную работу с персонажами.
Добавление текста на задний фон с его настройкой.
🎸 ЗВУК 🎸
DeepL: представили Voice режим для перевода голоса в текст для бизнес сегмента.
SI: выпустили Hertz-dev, генератор речи (TTS) работающий в audio-2-audio с маленькой задержкой. Может выдавать как слова за одно человека, так и за двоих.
Hallucinator: моделька на основе Hertz выше для продолжения слов в загруженном аудио семпле.
e2f5: появилась возможность делать генерацию речи на основе фантюнов e2f5 от других людей через выбор Custom модели для инференса. На русском не видно пока тюнов.
Веб-интерфейс для работы с разными опенсорсными TTS.
🤖 ЧАТЫ 🤖
Alibaba: рвёт и мечет и после своего опенсорсного кодера, выпустили Turbo — языковую модель (LLM) с контекстом 1 млн токенов. Можно скормить книг 10, или 150 часов транскрибации речи, или 30к строк кода. Демо. API дешевле GPT-4o-mini.
Llama 3.2-11B, умеющая из коробки чатиться по визуалу, вышла в тираж и доступна в Ollama через OpenWebUI. Нужно минимум 8ГБ VRAM.
Mistral: выпустили Pixtral Large, визуальную языковую модель (VLM) для чата по визуалу, которая на бенчах лучше других открытых и закрытых, но размером 124B и её не погонять дома в отличие от Ламы 3.2-11B. Онлайн демо.
MinerU: конвертер PDF файлов в текст с markdown форматированием или JSON.
Google: выкатили Gemini-Exp-1114 и он попал в топ лидерборда LLM. Можно погонять на арене.
OpenAI: дропнули приложение ChatGPT на Windows.
Anthropic: с помощью Computer Use можно дать Claude выполнять задания на компе через API. Плюс тулза от сообщества для этого на Win/Mac... Microsoft Recall ты ли это?
AnyChat: в онлайн чат, где есть последние модели Qwen, Claude итд, добавили DeepSeek v2.5. Некоторые можно потестить бесплатно.
Cinnamon: выпустили Kotaemon, фреймворк, который пользователи могут использовать для чата по докам, а разрабы как шаблон для RAG.
💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
📹 ВИДЕО + АРТ 🎨
PostShot: появилась интеграция с UE 5.4 для редактирования в нём сплатов, исправили баги при тренировке сцен и импорте/экспорте файлов, и другие улучшения.
Runway: расширили генерацию видео до 20 сек. Плюс обновили API, добавив доступ к контролю камеры Turbo.
Neurogen: появилась оптимизированная версия дипфейкера DeepFaceLab, а также FaceFusion 3.1.
Recraft: обновили свой генератор картинок до V3 и вышли в топ text-2-image моделей, обогнав Flux, MJ, Ideogram, и всех остальных. Можно бесплатно опробовать у них на сайте. Также есть версия, которая затюнена выдавать SVG.
BFL: релизнули Flux 1.1 Pro Ulta для генерации изображений в 4MP и RAW версию с имитацией "обычных фото". Доступно только по API.
Bytedance: выпустили SeeEdit для стайлтрансфера картинки с высокой точностью.
Nvidia: дропнули Llama Mesh для генерации 3D мешей по текстовому описанию с помощью LLM, плюс чата и редактирования.
DimensionX: опенсорсное создание видео с контролем камеры на основе одного изображения. На данный момент движение есть влево и вверх. Работает в связке с CogVideoX.
MagicQuill: онлайн редактирование изображение рисованием и промтом. Напоминает Invoke.
PyramidFlow: ещё один открытый видеогенератор с поддержкой Img2Video. Теперь с кадрами на основе Flux. На выходе видео 768p длиной в 10 сек. Установка через Pinokio.
Bria: обновлённый удалятор фона RMBG-2. Хорошо работает со сложной композицией, есть пакетная обработка, и можно кормить картинки как с компа, так и по ссылкам. Установка через Pinokio.
InstantX: выкатили апскейлер изображений InstantIR. Есть восстановление с точным следованием рефу или по "своему видению" (creative restoration). Установка в Pinokio.
Также они опубликовали метод более точного следования промту в t2i без тренировки + ещё одна работа на эту тему (спс @JohnDoe171).
CogVideoX: выпустили версию v 1.5 своего генератора видео с 5B параметрами. Тесты.
Vidu: обновили видеогенератор до V 1.5. Подняли качество генераций, улучшили следование промту, добавили консистентную работу с персонажами.
Добавление текста на задний фон с его настройкой.
🎸 ЗВУК 🎸
DeepL: представили Voice режим для перевода голоса в текст для бизнес сегмента.
SI: выпустили Hertz-dev, генератор речи (TTS) работающий в audio-2-audio с маленькой задержкой. Может выдавать как слова за одно человека, так и за двоих.
Hallucinator: моделька на основе Hertz выше для продолжения слов в загруженном аудио семпле.
e2f5: появилась возможность делать генерацию речи на основе фантюнов e2f5 от других людей через выбор Custom модели для инференса. На русском не видно пока тюнов.
Веб-интерфейс для работы с разными опенсорсными TTS.
🤖 ЧАТЫ 🤖
Alibaba: рвёт и мечет и после своего опенсорсного кодера, выпустили Turbo — языковую модель (LLM) с контекстом 1 млн токенов. Можно скормить книг 10, или 150 часов транскрибации речи, или 30к строк кода. Демо. API дешевле GPT-4o-mini.
Llama 3.2-11B, умеющая из коробки чатиться по визуалу, вышла в тираж и доступна в Ollama через OpenWebUI. Нужно минимум 8ГБ VRAM.
Mistral: выпустили Pixtral Large, визуальную языковую модель (VLM) для чата по визуалу, которая на бенчах лучше других открытых и закрытых, но размером 124B и её не погонять дома в отличие от Ламы 3.2-11B. Онлайн демо.
MinerU: конвертер PDF файлов в текст с markdown форматированием или JSON.
Google: выкатили Gemini-Exp-1114 и он попал в топ лидерборда LLM. Можно погонять на арене.
OpenAI: дропнули приложение ChatGPT на Windows.
Anthropic: с помощью Computer Use можно дать Claude выполнять задания на компе через API. Плюс тулза от сообщества для этого на Win/Mac... Microsoft Recall ты ли это?
AnyChat: в онлайн чат, где есть последние модели Qwen, Claude итд, добавили DeepSeek v2.5. Некоторые можно потестить бесплатно.
Cinnamon: выпустили Kotaemon, фреймворк, который пользователи могут использовать для чата по докам, а разрабы как шаблон для RAG.
Please open Telegram to view this post
VIEW IN TELEGRAM
https://pinokio.computer/
Для установки нейронок. Спасибо подписчику, благодаря которому я всё-таки поставил. Много слышал о нём, но игнорировал. Подписчик заметил, что там всё раньше появляется. Очень удобно, так как не требуются выполнять кучу шагов в терминале.
Для установки нейронок. Спасибо подписчику, благодаря которому я всё-таки поставил. Много слышал о нём, но игнорировал. Подписчик заметил, что там всё раньше появляется. Очень удобно, так как не требуются выполнять кучу шагов в терминале.
https://youtu.be/v4Wr7_5spK0?si=NF7wFDTRLom2VmUi
Очередной продавец курсов и схем для ComfyUI. Ставлю его ролик в информационных целях.
Очередной продавец курсов и схем для ComfyUI. Ставлю его ролик в информационных целях.
YouTube
Очень крутая модель Flux.1 - Lite-8B-alpha
В этом видео мы познакомимся с ещё одной классной модификацией модели Flux, которая весит меньше Dev, а работает быстрее без существенной потери качества.
Ссылка на модель:
https://huggingface.co/Freepik/flux.1-lite-8B-alpha
Ссылка на Бусти:
https://bo…
Ссылка на модель:
https://huggingface.co/Freepik/flux.1-lite-8B-alpha
Ссылка на Бусти:
https://bo…
Всем привет. Как вы, наверное, заметили, я стал реже постить. Связано это с тем, что мой компьютер с октября выдает синие экраны после 5 минут работы. Сейчас я ищу туториал как поставить ComfyUI на мак с api к black forest. Чтобы шла генерация за кредиты через их сайт. Если у кого есть ролик, как установить, киньте ссылку в коментариях.
А пока в качестве новости сообщаю, что есть сайт промптов к различным моделям. Из-за того, что я немного выпал, то узнал о нём только сейчас.
https://prompthero.com/flux-prompts
А пока в качестве новости сообщаю, что есть сайт промптов к различным моделям. Из-за того, что я немного выпал, то узнал о нём только сейчас.
https://prompthero.com/flux-prompts
PromptHero
Best FLUX Prompts
Search the best prompts for FLUX. Showing only good FLUX prompts, most upvoted and popular first.
https://youtu.be/F2tUaaSiU8g?si=NHZRTe9RARik5AN7
Блоггер живёт где-то за рубежом. Поэтому говорит с акцентом. А так как он иностранец, ему не нужны ваши копейки на бусти. Благодаря этому нету этого всего, что в последнее время у всех блоггеров: "Заплатите мне бабос, чтобы получить все схемы".
Блоггер живёт где-то за рубежом. Поэтому говорит с акцентом. А так как он иностранец, ему не нужны ваши копейки на бусти. Благодаря этому нету этого всего, что в последнее время у всех блоггеров: "Заплатите мне бабос, чтобы получить все схемы".
YouTube
ComfyUI с нуля
Мы собираемся изучить ComfyUI с самого начала: где его скачать, как установить, как он работает, что делают узлы и параметры, что необходимо установить, как добавить кастомные узлы и как создавать свои собственные. Это первый шаг в нашем путешествии по ComfyUI.…
Всё ребята. Я в деле. Вчера потратил сутки на решение проблемы с ноутбуком. Проблема была в сломаных кодовых таблицах на жестком диске и повреждении системных файлов винды. Несмотря на исправление, синие экраны смерти окончательно добили Граб. Сутки я потратил на поиск идеального Линукса. Понравился Manjaro, но там пришлось много пакетов ставить, чтобы запустить Комфи. Я хотел, чтобы было очень просто, как на винде. И я такой вариант нашёл. Linux Mint просто идеален, я сейчас с него пишу. После установки, выбрал пропиетарные драйвера Nvidia, затем скачал pinokio, deb пакет, который встал без проблем. Затем просто выбрал Комфи и просто сел ждать, когда он поставит все зависимости. Два недостатка: Пинокио скачивает в конце модель flux, которая мне не подходит и у меня есть своя. Второй недостаток, виден на скрине. У Пинокио нет иконки, поэтому в панели задач он выглядит, как невидимая иконка. И надо знать куда нажимать. Хотя, если вы на работе, то это даже фича 😁. Что по скорости? Тоже самое, что и на винде. Но винда за год раздулась до неприличных размеров. Так что остаюсь на Минте.
Сгенерировал обои для рабочего стола Linux. Я видел похожие обои в Manjaro и они мне очень понравились. В комментариях к посту найдете архив, где все эти генерации в несжатом виде, можете перетащить одну из них в ComfyUI и вы получите все настройки.
Prompt:
Prompt:
sea, lighthouse, autumn in close, mountains with snow picks in far, flat art, light vector