Phi-4-reasoning-vision-15B
мультимодальная версия Phi-4 от Microsoft на базе SigLIP-2 энкодера с адаптивным механизмом рассуждений.
Автоматически подстраивает глубину анализа под задачу: глубокий ризонинг для математики/логики, быстрый ответ для OCR и описания изображений.
Подготовлена для ИИ-агентов: понимает содержимое экрана, находит интерактивные элементы GUI, предлагает действия.
Веса:
HF: https://huggingface.co/microsoft/Phi-4-reasoning-vision-15B
Azure: https://ai.azure.com/catalog/models/Phi-4-Reasoning-Vision-15B
#multimodal #agent #vlm
Нейронавт в MAX 📲
мультимодальная версия Phi-4 от Microsoft на базе SigLIP-2 энкодера с адаптивным механизмом рассуждений.
Автоматически подстраивает глубину анализа под задачу: глубокий ризонинг для математики/логики, быстрый ответ для OCR и описания изображений.
Подготовлена для ИИ-агентов: понимает содержимое экрана, находит интерактивные элементы GUI, предлагает действия.
Веса:
HF: https://huggingface.co/microsoft/Phi-4-reasoning-vision-15B
Azure: https://ai.azure.com/catalog/models/Phi-4-Reasoning-Vision-15B
#multimodal #agent #vlm
Нейронавт в MAX 📲
❤7👍2
LTX-desktop-Hero-DK_optimized.webm
834.9 KB
LTX Desktop
бесплатный локальный видео-генератор от Lightricks
Локалка / API
Поддержка #LTX23
Помимо видео генерирует картинки в Z-Image
Экспорт/импорт таймлиний поппулярных видеомонтажек. И вообще некоторые монтажные способности имеет.
Для установки на винду требует 160 ГБ пространства
#desktop #macos (видимо, только API) #windows #videoediting #zimage
Нейронавт в MAX 📲
бесплатный локальный видео-генератор от Lightricks
Локалка / API
Поддержка #LTX23
Помимо видео генерирует картинки в Z-Image
Экспорт/импорт таймлиний поппулярных видеомонтажек. И вообще некоторые монтажные способности имеет.
Для установки на винду требует 160 ГБ пространства
#desktop #macos (видимо, только API) #windows #videoediting #zimage
Нейронавт в MAX 📲
👍9😱4
HY-WU (Part I)
Фреймворк от Tencent для генерации LoRA-адаптеров на лету без дообучения
Легковесная "нейронная память" генерирует персонализированные адаптеры для базовой модели (прикручено к HunyuanImage-3.0-Instruct) без файнтюнинга.
Моментальная кастомизация: смена одежды, перенос лица/текстур
Масштабируемо до 80B моделей
близок по качеству к серии Nano-Banana.
Ждем дистиллят и адптеры к другим моделям
Гитхаб
HF
#adapter #personalization #referencing
Фреймворк от Tencent для генерации LoRA-адаптеров на лету без дообучения
Легковесная "нейронная память" генерирует персонализированные адаптеры для базовой модели (прикручено к HunyuanImage-3.0-Instruct) без файнтюнинга.
Моментальная кастомизация: смена одежды, перенос лица/текстур
Масштабируемо до 80B моделей
близок по качеству к серии Nano-Banana.
Ждем дистиллят и адптеры к другим моделям
Гитхаб
HF
#adapter #personalization #referencing
🔥6👍4
Netflix купил Interpositive
Cтартап InterPositive основан Беном Аффлеком в 2022. Компания разрабатывает инструменты для кинопроизводителей на базе ИИ, которые "помогают, но не заменяют творчество". Конкретно - юзают ComfyUI
В рамках сделки к Netflix присоединится вся команда InterPositive из 16 человек
Аффлек станет старшим советником Netflix и будет раздавать советы
Технология InterPositive позволяет создавать ИИ-модель на основе уже существующих материалов производства, а затем использовать её в постпродакшне для цветокоррекции, изменения освещения и добавления визуальных эффектов
Netflix не планирует продавать технологию на коммерческом рынке, а будет предлагать доступ к ней своим творческим партнёрам
Youtube
#news
Нейронавт в MAX 📲
Cтартап InterPositive основан Беном Аффлеком в 2022. Компания разрабатывает инструменты для кинопроизводителей на базе ИИ, которые "помогают, но не заменяют творчество". Конкретно - юзают ComfyUI
В рамках сделки к Netflix присоединится вся команда InterPositive из 16 человек
Аффлек станет старшим советником Netflix и будет раздавать советы
Технология InterPositive позволяет создавать ИИ-модель на основе уже существующих материалов производства, а затем использовать её в постпродакшне для цветокоррекции, изменения освещения и добавления визуальных эффектов
Netflix не планирует продавать технологию на коммерческом рынке, а будет предлагать доступ к ней своим творческим партнёрам
Youtube
#news
Нейронавт в MAX 📲
Variety
Netflix Acquires AI Filmmaking Start-Up Founded by Ben Affleck, Who Will Serve as Adviser to Streamer
In a rare acquisition, Netflix has bought InterPositive, a start-up founded by Ben Affleck that makes AI-powered tools for filmmakers.
👍7😱2🤔1
Media is too big
VIEW IN TELEGRAM
ArtHOI
Реконструкция артикулированных взаимодействий человека с объектами из монокулярного видео без дообучения
4D-реконструкция из моно-видео-приоров без 3D-супервизии.
Сегментация частей объектов + двухэтапная оптимизация: сначала артикуляция объекта, потом синтез человеческого движения
Решает неоднозначность восстановления 3D из одного вида, обеспечивает движения без коллизий: руки не проваливаются в дверцу холодильника, тело не пересекает шкаф
Гитхаб
#4D #HOI #videoto4d #hsr #hpr
Нейронавт в MAX 📲
Реконструкция артикулированных взаимодействий человека с объектами из монокулярного видео без дообучения
4D-реконструкция из моно-видео-приоров без 3D-супервизии.
Сегментация частей объектов + двухэтапная оптимизация: сначала артикуляция объекта, потом синтез человеческого движения
Решает неоднозначность восстановления 3D из одного вида, обеспечивает движения без коллизий: руки не проваливаются в дверцу холодильника, тело не пересекает шкаф
Гитхаб
#4D #HOI #videoto4d #hsr #hpr
Нейронавт в MAX 📲
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
MultiGO++
3D реконструкция человека в одежде по одной фотографии от китайцев
Решает проблемы текстур (нет данных), геометрии (плохие priors) и системной предвзятости (одна модальность)
Bзвлекает геометрию с помощью модуля, который учитывает особенности разных частей тела
Улучшает качество 3D-сетки и эффективность извлечения данных с помощью гауссова ремешинга
Кода нет
#humanreconstruction #imageto3d #HMR #HPR
Нейронавт в MAX 📲
3D реконструкция человека в одежде по одной фотографии от китайцев
Решает проблемы текстур (нет данных), геометрии (плохие priors) и системной предвзятости (одна модальность)
Bзвлекает геометрию с помощью модуля, который учитывает особенности разных частей тела
Улучшает качество 3D-сетки и эффективность извлечения данных с помощью гауссова ремешинга
Кода нет
#humanreconstruction #imageto3d #HMR #HPR
Нейронавт в MAX 📲
👍2🔥2
Utopai Studios PAI
Комбайн для генерации связных сюжетных видео, до 60 секунд
Что конкретно под капотом - неизвестно
Utopai Studios - бывший Cybever
Записаться в вейтлист
#text2movie
Нейронавт в MAX 📲
Комбайн для генерации связных сюжетных видео, до 60 секунд
Что конкретно под капотом - неизвестно
Utopai Studios - бывший Cybever
Записаться в вейтлист
#text2movie
Нейронавт в MAX 📲
👍2❤1😐1
paperclip
инструмент для управления ИИ-агентами, помогает организовать их работу как в компании
— позволяет управлять командой ИИ-агентов: назначать цели, отслеживать их работу и расходы
— выстраивает иерархию и связи между агентами
— контролирует бюджеты агентов и останавливает при достижении лимита
— сохраняет состояние агентов между сессиями
— отслеживает все разговоры и решения агентов, ведёт неизменяемый лог
— связывает каждую задачу с общей миссией компании, чтобы агенты понимали «зачем» они выполняют ту или иную задачу
В отличие от аналогов, Paperclip не просто использует AI-агенты, а координирует их работу, учитывая такие моменты:
— кто сейчас работает над задачей
— как поддерживать сессии и не терять контекст
— как следить за расходами
работает с разными агентами и интегрируется с различными инструментами (OpenClaw, Claude, Codex, Cursor)
#agent
Нейронавт в MAX 📲
инструмент для управления ИИ-агентами, помогает организовать их работу как в компании
— позволяет управлять командой ИИ-агентов: назначать цели, отслеживать их работу и расходы
— выстраивает иерархию и связи между агентами
— контролирует бюджеты агентов и останавливает при достижении лимита
— сохраняет состояние агентов между сессиями
— отслеживает все разговоры и решения агентов, ведёт неизменяемый лог
— связывает каждую задачу с общей миссией компании, чтобы агенты понимали «зачем» они выполняют ту или иную задачу
В отличие от аналогов, Paperclip не просто использует AI-агенты, а координирует их работу, учитывая такие моменты:
— кто сейчас работает над задачей
— как поддерживать сессии и не терять контекст
— как следить за расходами
работает с разными агентами и интегрируется с различными инструментами (OpenClaw, Claude, Codex, Cursor)
#agent
Нейронавт в MAX 📲
GitHub
GitHub - paperclipai/paperclip: Open-source orchestration for zero-human companies
Open-source orchestration for zero-human companies - paperclipai/paperclip
👍6🤔1
TapFormer
трекинг произвольных точек из кадров + событий
на черри пиках лучше Cotracker 3
Гитхаб
Веса
#tracking
Нейронавт в MAX 📲
трекинг произвольных точек из кадров + событий
на черри пиках лучше Cotracker 3
Гитхаб
Веса
#tracking
Нейронавт в MAX 📲
👍4🔥1
ChatGPT for Excel
Да, прямо туда и встроили GPT-5.4
Плюс, интегрировали финансовые данные Bloomberg, Moody's, S&P
— строит и обновляет модели в Excel по описанию пользователя
— анализирует большие таблицы, объясняет изменения в результатах и исправляет ошибки
— показывает, как предположения влияют на модель
— MCP для данных, для агентов/приложений
Плагин доступен на платных подписках в ряде стран
#assistant #plugin
Нейронавт в MAX 📲
Да, прямо туда и встроили GPT-5.4
Плюс, интегрировали финансовые данные Bloomberg, Moody's, S&P
— строит и обновляет модели в Excel по описанию пользователя
— анализирует большие таблицы, объясняет изменения в результатах и исправляет ошибки
— показывает, как предположения влияют на модель
— MCP для данных, для агентов/приложений
Плагин доступен на платных подписках в ряде стран
#assistant #plugin
Нейронавт в MAX 📲
👍5👎2🔥1
InSpatio-WorldFM
Генератор 3D миров в реальном времени
В отличие от миро-видеогенераторов, думает в 3D и тем сохраняет консистентность
Создает интерактивные миры по одному фото, по текстовому описанию
Рилтайм не на какихто там H100, а на всего лишь 4090
Ну это на словах. На деле в демо проходишь пару шагов и упираешься в невидимую стену
Гитхаб
HF
Демо
#world #text2world #image2world
Нейронавт в MAX 📲
Генератор 3D миров в реальном времени
В отличие от миро-видеогенераторов, думает в 3D и тем сохраняет консистентность
Создает интерактивные миры по одному фото, по текстовому описанию
Рилтайм не на какихто там H100, а на всего лишь 4090
Ну это на словах. На деле в демо проходишь пару шагов и упираешься в невидимую стену
Гитхаб
HF
Демо
#world #text2world #image2world
Нейронавт в MAX 📲
👍10👎2❤1😁1