ERNIE‑Image
Baidu вчера выпустили генератор картинок
8B параметров. Из коробки работает на 24 ГБ VRAM. Качественно отображает текст, выполняет сложные запросы с несколькими объектами, постеры, раскадровки, комиксы.
#SOTA, уверенно тягается с лидерами
Есть base и turbo - 8-шаговая дистилляция
Prompt Enhancer - вспомогательная LLM на 3B параметров
Гитхаб
HF
ComfyOrg
AI STudio
Демо
ComfyUI:
base
turbo
#text2image #workflow
Baidu вчера выпустили генератор картинок
8B параметров. Из коробки работает на 24 ГБ VRAM. Качественно отображает текст, выполняет сложные запросы с несколькими объектами, постеры, раскадровки, комиксы.
#SOTA, уверенно тягается с лидерами
Есть base и turbo - 8-шаговая дистилляция
Prompt Enhancer - вспомогательная LLM на 3B параметров
Гитхаб
HF
ComfyOrg
AI STudio
Демо
ComfyUI:
base
turbo
#text2image #workflow
❤9👍7
Uni-ViGU
Мультимодальная модель для генерации и понимания видео. В отличие от других моделей, здесь в основе лежит видеогенератор, а не модели, ориентированные на понимание
Генерирует сразу видео и текстовое описание
Гитхаб
HF - 14ГБ
#text2video
Мультимодальная модель для генерации и понимания видео. В отличие от других моделей, здесь в основе лежит видеогенератор, а не модели, ориентированные на понимание
Генерирует сразу видео и текстовое описание
Гитхаб
HF - 14ГБ
#text2video
👍8
Forwarded from Светлый уголок
GPT Image 2: повторное тестирование на arena.ai.
Эти модели являются новыми версиями GPT Image 2. Вероятно, это средняя версия, так как результаты хоть и крутые, но хуже, чем у maskingtape-alpha.
Радует то, что по сравнению с тем, что было 11 числа, эти модели избавились от ужасного шума, который сильно мешал.
Порог знаний у этих моделей выше, чем у maskingtape-alpha.
Обновленная версия старой maskingtape-alpha. Вероятно, это самая сильная версия GPT Image 2 с мышлением.
Все четыре модели превосходят в логических рассуждениях, данных и знаниях такие популярные модели, как nano banana 2 / pro.
Единственная проблема в GPT Image - отрисовка мелких деталей: всё ещё есть галлюцинации, например, 6 пальцев, но это гораздо круче, чем раньше.
🌌 Geometry90
Сейчас, вероятно, тестируются четыре разные модели:
• duct-tape-1
• duct-tape-2
• duct-tape-3
Эти модели являются новыми версиями GPT Image 2. Вероятно, это средняя версия, так как результаты хоть и крутые, но хуже, чем у maskingtape-alpha.
Радует то, что по сравнению с тем, что было 11 числа, эти модели избавились от ужасного шума, который сильно мешал.
Порог знаний у этих моделей выше, чем у maskingtape-alpha.
Ещё одна более сильная версия была добавлена через несколько минут:
• maskingtape-alpha
Обновленная версия старой maskingtape-alpha. Вероятно, это самая сильная версия GPT Image 2 с мышлением.
Все четыре модели превосходят в логических рассуждениях, данных и знаниях такие популярные модели, как nano banana 2 / pro.
Единственная проблема в GPT Image - отрисовка мелких деталей: всё ещё есть галлюцинации, например, 6 пальцев, но это гораздо круче, чем раньше.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Sonilo
Коммерческий сервис, создает музыку к загруженному видео. Предлагает несколько вариантов, есть контроль микса с оригинальным звуком.
Есть бесплатный тариф
Есть партнерские ноды в #ComfyUI
workflow
#video2music
Коммерческий сервис, создает музыку к загруженному видео. Предлагает несколько вариантов, есть контроль микса с оригинальным звуком.
Есть бесплатный тариф
Есть партнерские ноды в #ComfyUI
workflow
#video2music
👍7😱1