Нейронавт | Нейросети в творчестве
11.4K subscribers
5.02K photos
4.26K videos
48 files
5.35K links
№ 6913927904 заявка на регистрацию в РКН

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
Download Telegram
https://openrouter.ai/openrouter/free

роутер, который подбирает бесплатные модели на OpenRouter

— выбирает модели случайно из тех, что доступны

— фильтрует модели, чтобы найти те, которые подходят под твои запросы

— поддерживает разные фишки, например понимание изображений, вызов инструментов, структурированный вывод и прочее

Короче, ты отправляешь запрос, а роутер сам подбирает подходящую бесплатную модель, которая справится с задачей

#assistant #api #llm #agent #tools
👍9👎5👀2
MiniMax Music 2.5

Недавно обновился генератор музыки от Hailuo

— контроль эмоций и музыкальной экспрессии

— поддерживает 14 вариантов структуры для создания песен — от вступления до хука

— не знаю кому из нас это нужно, но хорошо работает с китайским поп-жанром

— помимо китайского хорошо работает с английской речью

— делает естественные голоса: умеет передавать эмоции и разные оттенки голоса, создаёт эффект живого выступления;

— подстраивает микс под стиль музыки: автоматически меняет настройки в зависимости от жанра, например, может передать дух 80-х или стиль джаза

— работает со множеством инструментов: использует более 100 видов инструментов и хорошо смешивает их с вокалом, так что каждый инструмент слышно чётко

Странно что этого анонса нет в официальном твиттере MiniMax. Зато там объявлена скидка 50% для всех пользователей на Wavespeed AI до 14 февраля

#text2music #music
👍9
Агент Genspark в честь Суперкубка раздает по 1000 кредитов.

Получить тут: genspark.ai (вход через 3 буквы)

Если не дают, по сделайте репост и попробуйте пройти по ссылке из QR кода

Ну и еще у них новое Рабочее пространство Genspark AI 2.0

#agent #giveaway
5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Впервые на Суперкубке показана ИИ-реклама, и она создана в ComfyUI

Svedka Vodka - шведский бренд водки

Напомню, что на Суперкубке самое дорогое в мире рекламное время, и за вложенные деньги бренды стараются показать самые эффектные и запоминающиеся видеоролики

Ну оказывается что можно платить только за эфирное время, а на креативе сэкономить, лишь бы засветиться

#news
🥴16👍4🍌31🔥1
LongCat-Flash-Lite

Еще одна модель от длинного кота на 68,5B параметров с 2.9B–4.5B активных

— работает с контекстом до 256 тысяч токенов

#SOTA, показывает топовые результаты в тестах SWE-Bench (54,4 %) и τ²-Bench

— 50 миллионов бесплатных токенов в день через Open API

Гитхаб
MS
HF
API
Чат

#assistant #llm
👍7
Media is too big
VIEW IN TELEGRAM
DuoGen

Мультимодальная модель от NVIDIA, автоматически переключается между модальностями текста и изображения

Может работать как генератор-редактор изображений, но это не все. Может обучать роботаов, управлять ими, ориентировать их в пространстве

Код ждем

#text2image #imageediting #multimodal #vlm
👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
CYANPUPPETS

Безмаркерный мокап в рилтайме с 1080p камеры

Для рилтайма достаточно 8ГБ VRAM

Интегрируется с #UE, #Unity, #Blender

Есть бесплатная версия, раздают в дискорде

Если кому лень заходить в ДС, ссылка из него - спасибо @Dmitriy_Ru6ts0v

#mocap #3d #plugin
👍15🔥4🤷‍♂1
dpdmd: Diversity-Preserved Distribution Matching Distillation for Fast Visual Synthesis

Ускорялка генерации изображений с сохранением разнообразия

Сайта нет, только препринт

Код ждем

#optimization
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Daggr

библиотека для создания AI-workflow от разработчика Gradio. Строит надёжные сложные AI-приложения из ненадёжных простых моделей

— соединяет Gradio-приложения, модели машинного обучения (через Hugging Face Inference) и пользовательские Python-функции

— позволяет наблюдать за выполнением каждого шага на холсте

— даёт возможность перезапускать любой шаг

— поддерживает резервные шаги для работы с нестабильными моделями

— позволяет возвращаться к любым прошлым результатам вместе с цепочкой входных данных

— можно использовать самостоятельно, шерить через Gradio или размещать на Hugging Face Spaces

Гитхаб
Демо - бесплатные кредиты заканчиваются уже на второй ноде

#tools #lib
👍7🔥42
ComfyUI-QwenTTS

Еще один пак нод Qwen3-TTS

Клонированные голоса можно сохранять в библиотеку и снова использовать
———————————

ComfyUI-QwenASR

Ноды распознавания QwenASR

воркфлоу собранный на обоих этих штуках

#tts #text2speech #voicecloning #voicedesign #text2voice #comfyui #asr #stt
8👍3😎1
End-of-January LTX-2 Drop: Better Control for Real Workflows

Оказывается в конце января обновили LTX-2
И контролнет LTX-2 19B IC-LoRA Union Control был только частью этого обновления

А я и не знал

— Упрощена работа с Gemma: новые ноды LTXVSaveConditioning / LTXVLoadConditioning позволяют сохранять и загружать кодировки промптов без перезагрузки Gemma. Неужели эмбеддинги из SD вернулись?

— Multimodal Guider. Можно отдельно настраивать следование подсказке, стабильность изображения и синхронизацию модальностей

Улучшения трейна:

— Улучшена работа тренера для IC-LoRA: ускорены циклы итераций и поведение памяти, обучение более предсказуемо на локальных или ограниченных GPU

— Ускорен инференс (примерно в 2 раза, в зависимости от длины и разрешения видео)

В следующем обновлении ждем

→ Новый VAE для лучшего сохранения мелких деталей
→ Улучшеную согласованность и точность обработки входных данных
→ Более чистый и надежный звук
→ Значительно улучшенный режим преобразования изображения в видео
→ Улучшенное понимание промпта

#ltx2 #news
👍16🌚1
Z-Image-i2L

Эта штуковина создает лору для #zimage из одной картинки

Работает как я понимаю в DiffSynth-Studio

Демо

#image2lora #i2l
👍8😱5