WildDet3D: Scaling Promptable 3D Detection in the Wild
#SOTA детектор объектов от Allen AI для изображений и видео в реальном времени.
— Распознаёт 3D-объекты по текстовым подсказкам
— Преобразует 2D-рамки в 3D
— Находит похожие объекты по примеру
— Работает с точками на изображении
— Использует монокулярные изображения
— Применяет данные о глубине для точного позиционирования
Гитхаб
HF
Демо
iOS
#detection #3d #segmentation #mobile #ios #realtime
#SOTA детектор объектов от Allen AI для изображений и видео в реальном времени.
— Распознаёт 3D-объекты по текстовым подсказкам
— Преобразует 2D-рамки в 3D
— Находит похожие объекты по примеру
— Работает с точками на изображении
— Использует монокулярные изображения
— Применяет данные о глубине для точного позиционирования
Гитхаб
HF
Демо
iOS
#detection #3d #segmentation #mobile #ios #realtime
❤6🔥1
Мифичеcкая мощь Mythos
Компания AISLE провела тесты и выяснила, что небольшие и недорогие модели ИИ могут обнаруживать те же уязвимости, которые находит Mythos. Например, восемь из восьми протестированных моделей обнаружили уязвимость в FreeBSD, при этом одна из них имела всего 3,6 миллиарда активных параметров и стоила $0,11 за миллион токенов
Маленькие модели могут быть эффективны для обнаружения уязвимостей
#news #security
Компания AISLE провела тесты и выяснила, что небольшие и недорогие модели ИИ могут обнаруживать те же уязвимости, которые находит Mythos. Например, восемь из восьми протестированных моделей обнаружили уязвимость в FreeBSD, при этом одна из них имела всего 3,6 миллиарда активных параметров и стоила $0,11 за миллион токенов
Маленькие модели могут быть эффективны для обнаружения уязвимостей
#news #security
AISLE
AI Cybersecurity After Mythos: The Jagged Frontier
Why the moat is the system, not the model
👍7😁4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
MOSS-TTS-Nano
Версия говорилки на всего 100M параметров
— работает на процессоре без видеокарты
— 20 языков, включая русский
— может обрабатывать длинные тексты, автоматически разбивая их на части для клонирования голоса
— звук в формате 48 кГц, 2 канала
Гитхаб
HF
Демо
Студия - вход по китайскому номеру, как зарегаться - непонятно
#TTS #voicecloning #voicedesign #russian #text2sfx #foley #sfx #realtime #longspeech
Версия говорилки на всего 100M параметров
— работает на процессоре без видеокарты
— 20 языков, включая русский
— может обрабатывать длинные тексты, автоматически разбивая их на части для клонирования голоса
— звук в формате 48 кГц, 2 канала
Гитхаб
HF
Демо
Студия - вход по китайскому номеру, как зарегаться - непонятно
#TTS #voicecloning #voicedesign #russian #text2sfx #foley #sfx #realtime #longspeech
👍10🔥1😱1
UniCom
Мультимодальная модель для работы с сжатыми визуальными эмбеддингами от Tencent
Предсказывает сжатые визуальные эмбеддинги, при этом сжатие визуальных признаков по канальному измерению помогает сохранить и семантику, и мелкие детали
Умеет:
— генерировать изображения по текстовому описанию
— редактировать одиночные изображения
— редактировать несколько изображений одновременно
— восстанавливать изображения
Гитхаб
HF
#multimodal #imageediting
Мультимодальная модель для работы с сжатыми визуальными эмбеддингами от Tencent
Предсказывает сжатые визуальные эмбеддинги, при этом сжатие визуальных признаков по канальному измерению помогает сохранить и семантику, и мелкие детали
Умеет:
— генерировать изображения по текстовому описанию
— редактировать одиночные изображения
— редактировать несколько изображений одновременно
— восстанавливать изображения
Гитхаб
HF
#multimodal #imageediting
👍3
RefineAnything
Мультимодальная диффузионная модель на базе Qwen-Image, похоже что лора
Исправляет искаженный текст, логотипы и тонкие структуры внутри любой указанной вами области, оставляя фон нетронутым. Поддерживает редактирование с референсом и без него
Гитхаб
HF
Демо
#imageediting #QIE2511 #imageenhance
Мультимодальная диффузионная модель на базе Qwen-Image, похоже что лора
Исправляет искаженный текст, логотипы и тонкие структуры внутри любой указанной вами области, оставляя фон нетронутым. Поддерживает редактирование с референсом и без него
Гитхаб
HF
Демо
#imageediting #QIE2511 #imageenhance
👍17
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin Gen 2.5
Ультрадетальная геометрия, больше пока ничего не известно
Чтобы попроситься в вейтлист, напишите сюда:
https://x.com/DeemosTech
#3d #textto3d #imageto3d #3dediting
Ультрадетальная геометрия, больше пока ничего не известно
Чтобы попроситься в вейтлист, напишите сюда:
https://x.com/DeemosTech
#3d #textto3d #imageto3d #3dediting
❤3👍2
Инсайд от @BrianMItro
Seedance 2.0 API сегодня должен быть доступен для всех
Через пару дней обещают 1080p
китайская новость должна быть тут, но нам ее не показывают
[UPDATE] на BytePlus уже вывесили цены
спасибо @Goog1le
#news #api #seedance2
Seedance 2.0 API сегодня должен быть доступен для всех
Через пару дней обещают 1080p
китайская новость должна быть тут, но нам ее не показывают
[UPDATE] на BytePlus уже вывесили цены
спасибо @Goog1le
#news #api #seedance2
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Photopea Tab
Интеграция фоторедактора PhotoPea в боковeю панель #ComfyUI
Частенько этого не хватает.
А вот в A1111 это уже было в незапамятные времена, 3 года назад
#imageediting
Интеграция фоторедактора PhotoPea в боковeю панель #ComfyUI
Частенько этого не хватает.
А вот в A1111 это уже было в незапамятные времена, 3 года назад
#imageediting
👍13❤4🔥2
В 2026 без нейронок не справиться: они помогают в учебе, упрощают работу. Это буквально твой личный и надежный ассистент для ЕЖЕДНЕВНЫХ задач ☝️
Например, в создании контента. Просто берешь подписку и получаешь БУСТ 🔎
И не говори, что это трудно: оплачивать подписки выгодно и в рублях помогает Playerok — лучший маркетплейс игровых товаров и услуг с 1+ млн отзывов ✅
Пополнение Steam с комиссией 0% по промокоду
Всё для геймеров в одном месте 💙
#промо
Например, в создании контента. Просто берешь подписку и получаешь БУСТ 🔎
И не говори, что это трудно: оплачивать подписки выгодно и в рублях помогает Playerok — лучший маркетплейс игровых товаров и услуг с 1+ млн отзывов ✅
Пополнение Steam с комиссией 0% по промокоду
GPT и моментальная покупка телеграм-звезд — это всё также доступно на Playerok 💙Всё для геймеров в одном месте 💙
#промо
😁3🍌2👎1 1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniShow
Модель для создания видео взаимодействия людей с предметами. Видеогенерация управляется текстом, изображением, аудио и позами одновременно
- Видео реалистичнее и динамичнее, чем у HunyuanCustom, HuMo-17B, VACE и Phantom-14B
- Сохраняет личность персонажа и синхронизирует движения со звуком лучше, чем HunyuanCustom и HuMo-17B
- синхронизирует аудио с видео
- подходит для разных задач, например, создания аватаров, замены объектов в видео или ремикса видео
Гитхаб ждем
#humanavatar #humananimation #lipsync #av #referencing #pose2video #characterswap #characteranimation #any2video
Модель для создания видео взаимодействия людей с предметами. Видеогенерация управляется текстом, изображением, аудио и позами одновременно
- Видео реалистичнее и динамичнее, чем у HunyuanCustom, HuMo-17B, VACE и Phantom-14B
- Сохраняет личность персонажа и синхронизирует движения со звуком лучше, чем HunyuanCustom и HuMo-17B
- синхронизирует аудио с видео
- подходит для разных задач, например, создания аватаров, замены объектов в видео или ремикса видео
Гитхаб ждем
#humanavatar #humananimation #lipsync #av #referencing #pose2video #characterswap #characteranimation #any2video
👍9🤷♂2🥴1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI-ConnectTheDots
Инструмент для удобного соединения совместимых нод без ползания по графу
#comfyui #tools
Инструмент для удобного соединения совместимых нод без ползания по графу
#comfyui #tools
👍11🔥6