wan2.2 I2V
воркфлоу генерации видео по нескольким исходным объектам
Инструкции от автора на реддите
#wan22 #image2video #referencing #personalization #multireference
воркфлоу генерации видео по нескольким исходным объектам
Инструкции от автора на реддите
#wan22 #image2video #referencing #personalization #multireference
❤7🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Genie 3: A new frontier for world models
Новое поколение модели от Googleб #SOTA в создании игровых миров с навигацией по ним
Я тут перечислял что он умеет но тг сожрал текст и сказал что ничего не было.
Да и пофиг, потому что попробовать все равно не дают а только хвастаются
#text2world #research #text2game
Новое поколение модели от Googleб #SOTA в создании игровых миров с навигацией по ним
Я тут перечислял что он умеет но тг сожрал текст и сказал что ничего не было.
Да и пофиг, потому что попробовать все равно не дают а только хвастаются
#text2world #research #text2game
👍4😁3🔥2
Media is too big
VIEW IN TELEGRAM
Eleven Music
У Elevenlabs свой генератор музыкис блэкджеком и ш который может полностью контролировать жанр, стиль и структуру композиций. Знает разные языки. Можно редактировать звук и текст отдельных секций или всей песни.
Работает на бесплатном тарифе. Чтобы задать ему слова песни, в конце промпта пишем
#text2music #musicediting #music
У Elevenlabs свой генератор музыки
Работает на бесплатном тарифе. Чтобы задать ему слова песни, в конце промпта пишем
lyrics:
и дальше свой текст#text2music #musicediting #music
6👍9❤1
Forwarded from Сиолошная
OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров.
Модели рассуждающие, поддерживают 3 типа длины рассуждений: low, medium, high.
Ссылки:
— https://openai.com/open-models/
— https://openai.com/index/gpt-oss-model-card/
— https://cookbook.openai.com/articles/openai-harmony
— https://gpt-oss.com/ - тут можно поиграть с моделью
Судя по лендингу, модели уже сегодня будут доступны на Groq и Cerebas, предлагая очень быструю генерацию. И почти все инференс-движки уже поддерживают модель.
И самое крутое — как и o3, модели поддерживают вызов инструментов (поиск, Python, etc) в цепочке рассуждений.
Модели рассуждающие, поддерживают 3 типа длины рассуждений: low, medium, high.
Ссылки:
— https://openai.com/open-models/
— https://openai.com/index/gpt-oss-model-card/
— https://cookbook.openai.com/articles/openai-harmony
— https://gpt-oss.com/ - тут можно поиграть с моделью
Судя по лендингу, модели уже сегодня будут доступны на Groq и Cerebas, предлагая очень быструю генерацию. И почти все инференс-движки уже поддерживают модель.
И самое крутое — как и o3, модели поддерживают вызов инструментов (поиск, Python, etc) в цепочке рассуждений.
1🔥9❤2
Wan2.2 Image | Krea
Все, генерацию картинок силами #WAN22 завезли на Krea.ai
Бесплатных кредитов хватило на две генерации
#text2image #image2image #neuronaut_art
Все, генерацию картинок силами #WAN22 завезли на Krea.ai
Бесплатных кредитов хватило на две генерации
#text2image #image2image #neuronaut_art
👍3😁3❤1
Claude Opus 4.1
Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей
#news #assistant
Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей
#news #assistant
👍3
Нейронавт | Нейросети в творчестве
qwen-image-gguf-test а вот и #GGUF под Qwen-Image Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке реддит #text2image
city96/Qwen-Image-gguf
Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда
Если не запускается, попробуйте обновить ComfyUI-GGUF
Альтернативные GGUF спасибо @ArtNeiroDz
ворклоу
#text2image
Нормальные #GGUF Qwen-Image
Кто скачал старые - перекачайте отсюда
Если не запускается, попробуйте обновить ComfyUI-GGUF
Альтернативные GGUF спасибо @ArtNeiroDz
ворклоу
#text2image
huggingface.co
city96/Qwen-Image-gguf at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
1👍3😈1
This media is not supported in your browser
VIEW IN TELEGRAM
Kitten TTS
#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма
По языкам нет информации. Должна завестись даже на Raspberry Pi
Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!
Код
Веса
#tts #text2speech #realtime
#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма
По языкам нет информации. Должна завестись даже на Raspberry Pi
Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!
Код
Веса
#tts #text2speech #realtime
🔥10😱2
MiDashengLM
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Browser MCP
Автоматизация задач в браузере
Устанавливаем браузерное расширение, дальше вас проведут через процесс настройки
Гитхаб
#mcp #agent
Автоматизация задач в браузере
Устанавливаем браузерное расширение, дальше вас проведут через процесс настройки
Гитхаб
#mcp #agent
👍8
LoRA Training for Qwen-Image
Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?
Инструмент для обучения подогнали FlyMy.ai
А также опубликовали лору реализм
qwen-image-realism-lora
#TEXT2IMAGE #LORA #FINETUNING
Ладно, интересных картинок от qwen image из коробки получить не удалось. Может с лорами она себя покажет?
Есть смельчаки-первопроходцы обучить лору?
Инструмент для обучения подогнали FlyMy.ai
А также опубликовали лору реализм
qwen-image-realism-lora
#TEXT2IMAGE #LORA #FINETUNING
👍6❤2