Нейронавт | Нейросети в творчестве
11.7K subscribers
5.46K photos
4.6K videos
49 files
5.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
Gemini app

Гугл выпустил приложение Gemini на Mac

Ассистент даёт информацию и решает задачи прямо на рабочем столе.

— помогать прояснить тему

— вспоминаtn формулы

— мозговой штурм

— анализ содержимого окна для контекстной помощи

— доступ к творческим инструментам (Nano Banana, Veo)

— синхронизируется с веб-версией и мобильными приложениями

Требует macOS Sequoia (15.0) или позже, работает только на Apple Silicon

#desktop #macos #assistant
4
Motif-Video 2B

Видеогенератор по тексту и картинке на базе WAN со странными претензиями. 2B - видимо параметры трансформера - он весит 7ГБ. Но к нему прилагается токенизатор на 16ГБ, але.

Вообще фишка в экономии на обучении - менее 10 миллионов обучающих роликов и менее 100 000 часов работы на H200. При этом в изображении человеков откровенно плох. Ну ладно, может архитектура интересная

генерирует видео 720p до 121 кадра

Требует 24+ГБ VRAM

HF

Спасибо @m_franz

#t2v #i2v
😁7🥴4🔥2
Habitat-GS

Продолжаем день виртуальных миров

Симулятор для обучения роботов навигации в динамическом виртуальном пространстве на гауссианах с интегрированным движком аватвров

— фотореалистичный рендеринг

— импорт разных 3D-ассетов, включая самовосстановленные сцены и публичные датасеты

— совместим с Habitat ecosystem и позволяет тренировать и оценивать навигационных агентов прямо в Habitat-Lab

— включает систему HabitatAgent, которая понимает команды на естественном языке и может исследовать сцены через чат

На сайте есть интерактивный вьюер - можно побродить. Мне понравилось

Гитхаб

#gaussian #interactive #world #humanavatar
5
This media is not supported in your browser
VIEW IN TELEGRAM
Autograph

Maxon бахнул свой софт для моушн-графики, анимации, композитинга и работы с 2D/3D-проектами. Софт бесплатный для индивидуальных юзеров

Возможности:

— моушн-дизайн и анимация

ммм, ротоскопинг и трекинг

— работа с SVG и PSD-файлами

— GPU-оптимизированные эффекты и плагины OFX, Red Giant, Universe

— 2D и 3D в одном пространстве

— текстурирование

— рендер в Filament

— поддержка ACES и OCIO, Pixar OpenUSD

Давно пора потеснить AE!

#3d #vfx #compositing #motiondesign #design #оффтоп
👍6🤔4🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Happy Oyster

Интерактивные миры от Alibaba

— реагирует на инструкции пользователя и развивает сцену. Влиять на сюжет можно через текст, голос, изображения

— позволяет перемещаться по бесконечно расширяемым мирам

— совместная генерация аудио и видео

— длительность: до 3 минут (режим Directing), до 1 минуты (режим Wandering)

— разрешение: 480p / 720p (Directing), 480p (Wandering)

Заходим на сайт, логинимся через гугл, жмем INVITE CODE в правом верхнем углу, заполняем анкету и ждем письма

Подробности

#world #interactive #realtime #multimodal #any2world
🔥8
Claude Opus 4.7

Новая модель от Anthropic лучше справляется со сложными задачами программной инженерии:
— работает с длительными задачами без потери концентрации
— строго следует инструкциям
— самостоятельно проверяет результаты
— обрабатывает изображения высокого разрешения
— создаёт качественные интерфейсы, слайды и документы
— реже допускает логические ошибки в планировании
— работает быстрее без потери качества
— решает мультимодальные задачи (читает химические структуры и технические диаграммы)
— находит и исправляет сложные ошибки в коде
— использует контекст предыдущих сессий

промпты написанные под старые модели могут сломаться и вообще обойдутся в больше выходных токенов

Гайд по миграции с 4.6 на 4.7

Цена прежняя - 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов

Claude API
Попробовать

#api #news #coding #assistant
👍8
Nucleus Image

Генератор картинок по тексту на #MoE
Активирует только 2B из 17B параметров
Выбирает «экспертов» из 64 специализированных и одного общего

Основная особенность - обучен на огромном наборе данных, что должно положительно сказаться на качестве генераций

На DPG-Bench обошли Qwen-Image и какие-то еще нетоповые модели

Гитхаб - тут будет код обучения
HF - тут есть код инференса
MLX порт модели

#text2image #macos
👍62
Qwen3.6-35B-A3B

Модель работает с текстом и изображениями. Создана с учётом отзывов сообщества, упор на стабильность и практическую пользу.

— 35B параметров, 3B активных

— обрабатывает фронтенд-задачи и умеет рассуждать на уровне репозитория

— сохраняет контекст рассуждений из предыдущих сообщений, что упрощает разработку и сокращает лишние действия

— работает с длинным текстом — до 262 144 токенов «из коробки», а при определённых настройках — до 1 010 000 токенов

— подходит для создания агентов и работы с инструментами

— мультимодальность — может работать с текстом, изображениями и видео

HF
MS
Chat

Кванты
Файнтюны

#coding #multimodal #agent #gguf
10👍3🔥2
Open AI только что обновили Codex

Движутся в сторону универсального помощника

— работает в фоне на Mac, может использовать приложения

— подключается к различным инструментам

— создаёт изображения, макеты в gpt-image-1.5

— учится на основе предыдущих действий

— запоминает ваш стиль работы

— берет на себя повторяющиеся и долгосрочные задачи

— использует более 90 плагинов для сбора информации и выполнения действий

— продолжает работу с того места, где остановился, сохраняя контекст

— планирует будущую работу и автоматически возобновляет долгосрочные задачи

#news #agent #desktop #macos
👍72🔥2