Нейронавт | Нейросети в творчестве
11.7K subscribers
5.47K photos
4.6K videos
49 files
5.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
WildDet3D: Scaling Promptable 3D Detection in the Wild

#SOTA детектор объектов от Allen AI для изображений и видео в реальном времени.

— Распознаёт 3D-объекты по текстовым подсказкам
— Преобразует 2D-рамки в 3D
— Находит похожие объекты по примеру
— Работает с точками на изображении
— Использует монокулярные изображения
— Применяет данные о глубине для точного позиционирования

Гитхаб
HF
Демо
iOS

#detection #3d #segmentation #mobile #ios #realtime
6🔥1
Мифичеcкая мощь Mythos
Компания AISLE провела тесты и выяснила, что небольшие и недорогие модели ИИ могут обнаруживать те же уязвимости, которые находит Mythos. Например, восемь из восьми протестированных моделей обнаружили уязвимость в FreeBSD, при этом одна из них имела всего 3,6 миллиарда активных параметров и стоила $0,11 за миллион токенов

Маленькие модели могут быть эффективны для обнаружения уязвимостей

#news #security
👍7😁4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
MOSS-TTS-Nano

Версия говорилки на всего 100M параметров

— работает на процессоре без видеокарты

— 20 языков, включая русский

— может обрабатывать длинные тексты, автоматически разбивая их на части для клонирования голоса

— звук в формате 48 кГц, 2 канала

Гитхаб
HF
Демо
Студия - вход по китайскому номеру, как зарегаться - непонятно

#TTS #voicecloning #voicedesign #russian #text2sfx #foley #sfx #realtime #longspeech
👍10🔥1😱1
UniCom

Мультимодальная модель для работы с сжатыми визуальными эмбеддингами от Tencent

Предсказывает сжатые визуальные эмбеддинги, при этом сжатие визуальных признаков по канальному измерению помогает сохранить и семантику, и мелкие детали

Умеет:

— генерировать изображения по текстовому описанию

— редактировать одиночные изображения

— редактировать несколько изображений одновременно

— восстанавливать изображения

Гитхаб
HF

#multimodal #imageediting
👍3
RefineAnything

Мультимодальная диффузионная модель на базе Qwen-Image, похоже что лора

Исправляет искаженный текст, логотипы и тонкие структуры внутри любой указанной вами области, оставляя фон нетронутым. Поддерживает редактирование с референсом и без него

Гитхаб
HF
Демо

#imageediting #QIE2511 #imageenhance
👍17
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin Gen 2.5

Ультрадетальная геометрия, больше пока ничего не известно

Чтобы попроситься в вейтлист, напишите сюда:
https://x.com/DeemosTech

#3d #textto3d #imageto3d #3dediting
3👍2
Инсайд от @BrianMItro

Seedance 2.0 API сегодня должен быть доступен для всех

Через пару дней обещают 1080p

китайская новость должна быть тут, но нам ее не показывают

[UPDATE] на BytePlus уже вывесили цены
спасибо @Goog1le

#news #api #seedance2
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Photopea Tab

Интеграция фоторедактора PhotoPea в боковeю панель #ComfyUI

Частенько этого не хватает.

А вот в A1111 это уже было в незапамятные времена, 3 года назад

#imageediting
👍134🔥2
В 2026 без нейронок не справиться: они помогают в учебе, упрощают работу. Это буквально твой личный и надежный ассистент для ЕЖЕДНЕВНЫХ задач ☝️

Например, в создании контента. Просто берешь подписку и получаешь БУСТ 🔎

И не говори, что это трудно: оплачивать подписки выгодно и в рублях помогает Playerok — лучший маркетплейс игровых товаров и услуг с 1+ млн отзывов

Пополнение Steam с комиссией 0% по промокоду GPT и моментальная покупка телеграм-звезд — это всё также доступно на Playerok 💙

Всё для геймеров в одном месте 💙

#промо
😁3🍌2👎11
This media is not supported in your browser
VIEW IN TELEGRAM
OmniShow

Модель для создания видео взаимодействия людей с предметами. Видеогенерация управляется текстом, изображением, аудио и позами одновременно

- Видео реалистичнее и динамичнее, чем у HunyuanCustom, HuMo-17B, VACE и Phantom-14B

- Сохраняет личность персонажа и синхронизирует движения со звуком лучше, чем HunyuanCustom и HuMo-17B

- синхронизирует аудио с видео

- подходит для разных задач, например, создания аватаров, замены объектов в видео или ремикса видео

Гитхаб ждем

#humanavatar #humananimation #lipsync #av #referencing #pose2video #characterswap #characteranimation #any2video
👍9🤷‍♂2🥴1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI-ConnectTheDots

Инструмент для удобного соединения совместимых нод без ползания по графу

#comfyui #tools
👍11🔥6