Нейронавт | Нейросети в творчестве
11.7K subscribers
5.46K photos
4.6K videos
49 files
5.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
Твой агент — теперь наш агент

Исследователи скомпрометировали 26 LLM-роутеров и украли $500K.

Если между агентом и моделью есть цепочка роутеров, любой из них может:
- внедрять вредоносные tool-вызовы;
- воровать креды;
- подменять ответы.

Короче, ребята отравили роутеры для перенаправления трафика, что за несколько часов позволило захватить ~400 хостов.

#news #security
👍2🔥2🫡1
MiniMax Music 2.6

Улучшили качество сведения и следование инструкциям. Теперь через промпт задаётся BPM, тональность, порядок вступления партий, эмоциональная дуга.

Глубокая оптимизация средних и низких частот.

Функция Cover: извлекает мелодический каркас из загруженного аудио и позволяет полностью изменить жанр или аранжировку, сохраняя исходный мотив и ритмику.

Три новых Music Skills: интеграция в сторонние сервисы, динамические плейлисты, виртуальные ассистенты с вокалом для импровизаций.

Попробовать в бете - 14 дней бесплатно.

#musicediting
5👍4
OmniVoice Studio

Локальная студия на OmniVoice для дубляжа и генерации голоса.

— транскрибирует речь и переводит на выбранный язык;

— вставляет сгенерированный голос в видео

— изолирует вокал и сохраняет фоновую музыку и звуковые эффекты

— создаёт новые голоса по простым тегам (например, «женский», «пожилой», «британский акцент»)

— клонирует голос по 3-секундному фрагменту

Спасибо @m_franz

#voicecloning #dubbing #tts #desktop
👍161
GBrain

Слой памяти для OpenClaw и Hermes от президента YCombinator

Автор пишет что он проиндексировал и может искать по 10000+ маркдаун файлов

#agent #memory #skill
👍5
Open Higgsfield AI

Бесплатная альтернатива Higgsfield


На самом деле работает через платный API muapi но обещают самые низкие цены. Есть сиденс 2

Собрано около 200 инструментов для генерации изображений, видео, липсинка

Надо понимать что большинство из них не ровня коммерческим моделям

Все криво работает в браузере, есть какие удобства по UX

#tools #apiкриво
😁21
Media is too big
VIEW IN TELEGRAM
LTX-2.3-22b-IC-LoRA-Ungrade

Лора убирает с видео цветокоррекцию, придавая более нейтральный вид

#lora #ltx23
👍164🌚4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree бегает со скоростью 10 м/с
А если снимет еще и руки, аэродинамика станет еще лучше. Но руки нужны когда догонит человеков

Нет, Усейн Болт не убежит, он устанет через 100 метров

Все, бег не поможет, остается электромагнтный импульс и дружба с роботами

#robot
👍83😁2
Claw bench

Бенчмарк опенклошек. Загляните сюда прежде чем выбрать модель под агентные задачи

153 реальных задания на 144 платформах и в 8 категориях: от покупок и бронирования до подачи заявлений о приеме на работу и прочее

Отличные результаты у моего любимчика GLM-5

#agent #benchmark #leaderboard
👍61
Memory Intelligence Agent (MIA)

Еще один вариант решения проблемы памяти для агентов

Значительно повышает эффективность на Deep Research

HF

#agent #memory #deepresearch
👍2
TIPSv2

Гугл выпустил модель предсказания плотности а потом "впустил обратно" - страница модели выдает 404

Но поисковые ИИшки помнят как ее устанавливать. Наверняка ничего не получится без доступа к модели

TIPSv2 предсказывает визуальные признаки, согласованные с текстовыми эмбеддингами, дальше с ними могут работать визуальные пониматоры

[UPDATE] Найдено на ModelScope, как я и надеялся, спасибо @p0lygon

#image2depth #image2normals
🤔3👍2
Media is too big
VIEW IN TELEGRAM
LPM 1.0

Видеогенератор диалоговых видео с персонажами в реальном времени

— генерирует видео с полнодуплексной беседой

— сохраняет идентичность персонажа при бесконечной генерации

— создаёт эмоциональные и вокальные выступления с точной синхронизацией губ и ритма тела

— совместима с аудио-в-аудио моделями вроде ChatGPT

— управляется мультимодально — через текст, аудио и изображения

— передаёт микровыражения и нюансы человеческого общения

Проект исследовательский, ни опенсорс, ни коммерческий релиз не запланированы

#research #dialog #realtime #characteranimation #av #lipsync
🤷‍♂6👍42
This media is not supported in your browser
VIEW IN TELEGRAM
Lava Genie

Какой ужас. Я понял что почувствовали художники когда пришли ИИ-художники

Там можно настраивать на грифе аккорды, на деке контроль страма, какие-то пресеты и даже вы не поверите - режим творчества.

Первое впечатление - тупо самоиграйка в форме гитары которая умеет выдавать несколько вариантов арпеджио. Но нет, не тупо, там есть иишка для сочинения музыки. Но выглядит как выкидыш диджея

Полный видеоролик сюда не влез, ищите на сайте

А вообще у них есть и настоящая умная гитара со струнами

#music #guitar
😁7👎31👍1🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
Waypoint-1.5

Обновка генератора интерактивных игровых миров в реальном времени от Overworld

Фишка этих ребят в том что ориентируются на домашнее железо и локальный запуск

Две модели: 720p для мощных систем и 360p для более широкого спектра ПК, в будущем — поддержка Apple Silicon

Похоже, даже не для самых богатых конфигураций 60азы при 720p должно быть реально

Установка
Демо
HF демо

Спасибо @EvgenyiPerm

#world #interactive #text2world
🔥8👍4
This media is not supported in your browser
VIEW IN TELEGRAM
camera-comfyUI

Кастом пак для свободного движения камеры и создания 6dof (6 степеней свободы) сцен из фото

Работает с проекциями камеры, преобразует глубину в облака точек, анимирует траектории камеры, делает аутпейнтинг, поддерживает различные типы проекций (pinhole, fisheye, equirectangular)

Хабр

#comfyui #cameracontrol
🍌4🔥3🤔21