Нейронавт | Нейросети в творчестве
11.4K subscribers
5.03K photos
4.28K videos
48 files
5.36K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
Phi-4-reasoning-vision-15B

мультимодальная версия Phi-4 от Microsoft на базе SigLIP-2 энкодера с адаптивным механизмом рассуждений.

Автоматически подстраивает глубину анализа под задачу: глубокий ризонинг для математики/логики, быстрый ответ для OCR и описания изображений.

Подготовлена для ИИ-агентов: понимает содержимое экрана, находит интерактивные элементы GUI, предлагает действия.

Веса:
HF: https://huggingface.co/microsoft/Phi-4-reasoning-vision-15B
Azure: https://ai.azure.com/catalog/models/Phi-4-Reasoning-Vision-15B

#multimodal #agent #vlm

Нейронавт в MAX 📲
7👍2
LTX-desktop-Hero-DK_optimized.webm
834.9 KB
LTX Desktop

бесплатный локальный видео-генератор от Lightricks

Локалка / API

Поддержка #LTX23

Помимо видео генерирует картинки в Z-Image

Экспорт/импорт таймлиний поппулярных видеомонтажек. И вообще некоторые монтажные способности имеет.

Для установки на винду требует 160 ГБ пространства

#desktop #macos (видимо, только API) #windows #videoediting #zimage

Нейронавт в MAX 📲
👍9😱4
HY-WU (Part I)

Фреймворк от Tencent для генерации LoRA-адаптеров на лету без дообучения

Легковесная "нейронная память" генерирует персонализированные адаптеры для базовой модели (прикручено к HunyuanImage-3.0-Instruct) без файнтюнинга.

Моментальная кастомизация: смена одежды, перенос лица/текстур

Масштабируемо до 80B моделей

близок по качеству к серии Nano-Banana.

Ждем дистиллят и адптеры к другим моделям

Гитхаб
HF

#adapter #personalization #referencing
🔥6👍4
Netflix купил Interpositive

Cтартап InterPositive основан Беном Аффлеком в 2022. Компания разрабатывает инструменты для кинопроизводителей на базе ИИ, которые "помогают, но не заменяют творчество". Конкретно - юзают ComfyUI

В рамках сделки к Netflix присоединится вся команда InterPositive из 16 человек

Аффлек станет старшим советником Netflix и будет раздавать советы

Технология InterPositive позволяет создавать ИИ-модель на основе уже существующих материалов производства, а затем использовать её в постпродакшне для цветокоррекции, изменения освещения и добавления визуальных эффектов

Netflix не планирует продавать технологию на коммерческом рынке, а будет предлагать доступ к ней своим творческим партнёрам

Youtube

#news

Нейронавт в MAX 📲
👍7😱2🤔1
Media is too big
VIEW IN TELEGRAM
ArtHOI

Реконструкция артикулированных взаимодействий человека с объектами из монокулярного видео без дообучения

4D-реконструкция из моно-видео-приоров без 3D-супервизии.

Сегментация частей объектов + двухэтапная оптимизация: сначала артикуляция объекта, потом синтез человеческого движения

Решает неоднозначность восстановления 3D из одного вида, обеспечивает движения без коллизий: руки не проваливаются в дверцу холодильника, тело не пересекает шкаф

Гитхаб

#4D #HOI #videoto4d #hsr #hpr

Нейронавт в MAX 📲
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
MultiGO++

3D реконструкция человека в одежде по одной фотографии от китайцев

Решает проблемы текстур (нет данных), геометрии (плохие priors) и системной предвзятости (одна модальность)

Bзвлекает геометрию с помощью модуля, который учитывает особенности разных частей тела

Улучшает качество 3D-сетки и эффективность извлечения данных с помощью гауссова ремешинга

Кода нет

#humanreconstruction #imageto3d #HMR #HPR

Нейронавт в MAX 📲
👍2🔥2
paperclip

инструмент для управления ИИ-агентами, помогает организовать их работу как в компании

— позволяет управлять командой ИИ-агентов: назначать цели, отслеживать их работу и расходы

— выстраивает иерархию и связи между агентами

— контролирует бюджеты агентов и останавливает при достижении лимита

— сохраняет состояние агентов между сессиями

— отслеживает все разговоры и решения агентов, ведёт неизменяемый лог

— связывает каждую задачу с общей миссией компании, чтобы агенты понимали «зачем» они выполняют ту или иную задачу

В отличие от аналогов, Paperclip не просто использует AI-агенты, а координирует их работу, учитывая такие моменты:

— кто сейчас работает над задачей

— как поддерживать сессии и не терять контекст

— как следить за расходами

работает с разными агентами и интегрируется с различными инструментами (OpenClaw, Claude, Codex, Cursor)

#agent

Нейронавт в MAX 📲
👍6🤔1
TapFormer

трекинг произвольных точек из кадров + событий

на черри пиках лучше Cotracker 3

Гитхаб
Веса

#tracking

Нейронавт в MAX 📲
👍4🔥1
ChatGPT for Excel

Да, прямо туда и встроили GPT-5.4
Плюс, интегрировали финансовые данные Bloomberg, Moody's, S&P

— строит и обновляет модели в Excel по описанию пользователя

— анализирует большие таблицы, объясняет изменения в результатах и исправляет ошибки

— показывает, как предположения влияют на модель

— MCP для данных, для агентов/приложений

Плагин доступен на платных подписках в ряде стран

#assistant #plugin

Нейронавт в MAX 📲
👍5👎2🔥1
InSpatio-WorldFM

Генератор 3D миров в реальном времени

В отличие от миро-видеогенераторов, думает в 3D и тем сохраняет консистентность

Создает интерактивные миры по одному фото, по текстовому описанию

Рилтайм не на какихто там H100, а на всего лишь 4090

Ну это на словах. На деле в демо проходишь пару шагов и упираешься в невидимую стену

Гитхаб
HF
Демо

#world #text2world #image2world

Нейронавт в MAX 📲
👍10👎21😁1