🔎 Moving Object Segmentation:All You Need Is SAM (and Flow)
SAM + Optical Flow = FlowSAM
FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥
▪ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
▪ Code: https://github.com/Jyxarthur/flowsam
▪Paper: https://arxiv.org/abs/2404.12389
▪ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR
@ai_machinelearning_big_data
SAM + Optical Flow = FlowSAM
FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥
▪ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
▪ Code: https://github.com/Jyxarthur/flowsam
▪Paper: https://arxiv.org/abs/2404.12389
▪ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR
@ai_machinelearning_big_data
👍28🔥7❤6
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤3🔥2🤔2👌1
Ориентированная на конфиденциальность поисковая система Brave расширила функциональность своей системы ответов на запросы пользователей с помощью ИИ.
Теперь при вводе запроса в Brave в поле выдачи сперва отображается выжимка от AI с ссылками на источники, и только потом сайты.
Выглядит наподобие Perplexity и Phind.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤4🔥4🤬2🌭1
🪄👕 Magic Clothing: controllable garment-driven image synthesis
Вышла модель Waifu Dress Up 2024!
Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.
▪Github
▪Paper
@ai_machinelearning_big_data
Вышла модель Waifu Dress Up 2024!
Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.
git clone https://github.com/ShineChen1024/MagicClothing.git
▪Github
▪Paper
@ai_machinelearning_big_data
👍16🔥7❤3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 AI Image Generator: Create images from text.
Новое поколение #Photoshop уже здесь.
Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.
Полный список обновлений здесь.
▪Blog
▪Demo
@ai_machinelearning_big_data
Новое поколение #Photoshop уже здесь.
Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.
Полный список обновлений здесь.
▪Blog
▪Demo
@ai_machinelearning_big_data
👍13🔥7❤6❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️🗣 OpenVoice V2 - a Text-to-Speech model that can clone any voice and speak in any language.
OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.
• Github: https://github.com/myshell-ai/OpenVoice/tree/main
• Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md
@ai_machinelearning_big_data
OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.
• Github: https://github.com/myshell-ai/OpenVoice/tree/main
• Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md
@ai_machinelearning_big_data
👍25🔥8❤5
Сегодня Apple выпустили Openly.
- Новое семейство LM с открытым исходным кодом для обучения моделей и логического вывода
- Работает наравне с OLMo, но требует в 2 раза меньше токенов для обучения
- Модели для различных задач, включая базовые модели (например, CLIP и LLM), классификацию объектов, обнаружение объектов и семантическую сегментацию.
Cписок моделей и подробная информации о каждой из них:
- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct
• gitHub: https://github.com/apple/corenet
• hf: https://huggingface.co/apple/OpenELM
• abs: https://arxiv.org/abs/2404.14619
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11❤3
🖼 HiDiffusion: Unlocking High-Resolution Creativity and Efficiency in Low-Resolution Trained Diffusion Models 🦊
Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion.
Его можно интегрировать в конвейеры diffusion, добавив всего одну строку кода!
• page: https://hidiffusion.github.io
• paper: https://arxiv.org/abs/2311.17528
• code: https://github.com/megvii-research/HiDiffusion
•colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing
@ai_machinelearning_big_data
Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion.
Его можно интегрировать в конвейеры diffusion, добавив всего одну строку кода!
pip3 install hidiffusion
• page: https://hidiffusion.github.io
• paper: https://arxiv.org/abs/2311.17528
• code: https://github.com/megvii-research/HiDiffusion
•colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing
@ai_machinelearning_big_data
👍21🔥5❤4
PyTorch 2.3 is here 😎🔥
Вышел PyTorch 2.3.
В PyTorch 2.3 реализована поддержка пользовательских ядер Triton в torch.compile, что позволяет пользователям переносить свои собственные ядра Triton без снижения производительности или сбоев в графике.
Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA.
В этом выпуске зафиксировано 3393 изменений.
Полный список обновлений: https://pytorch.org/blog/pytorch2-3/
@ai_machinelearning_big_data
Вышел PyTorch 2.3.
В PyTorch 2.3 реализована поддержка пользовательских ядер Triton в torch.compile, что позволяет пользователям переносить свои собственные ядра Triton без снижения производительности или сбоев в графике.
Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA.
В этом выпуске зафиксировано 3393 изменений.
Полный список обновлений: https://pytorch.org/blog/pytorch2-3/
@ai_machinelearning_big_data
👍37🔥16❤5❤🔥3
Полученные стартапом изображения мгновенно преобразуются в анонимные статистические данные, обрабатываемые локально за 100 мс. Стартап не хранит изображения или личные данные, а только статистические данные.
Кстати, в начале 2024 года корпорация купила стартап WaveOne, который предлагает ИИ-алгоритм для сжатия видео.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍11❤7🤔6
🔥 FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent
Массачусетский технологический университет представил FlowMap.
Это новый комплексный дифференцируемый метод для реконструкции 3D сцены, который позволяет точно задать ракурсы камеры, характеристики движения и глубину видеоряда для каждого кадра.
FlowMap позволяет создавать реалистичные ракурсы на 360°.
• Github: https://github.com/dcharatan/flowmap
• Paper: https://arxiv.org/abs/2404.15259
• Dataset: https://drive.google.com/drive/folders/1PqByQSfzyLjfdZZDwn6RXIECso7WB9IY
@ai_machinelearning_big_data
Массачусетский технологический университет представил FlowMap.
Это новый комплексный дифференцируемый метод для реконструкции 3D сцены, который позволяет точно задать ракурсы камеры, характеристики движения и глубину видеоряда для каждого кадра.
FlowMap позволяет создавать реалистичные ракурсы на 360°.
• Github: https://github.com/dcharatan/flowmap
• Paper: https://arxiv.org/abs/2404.15259
• Dataset: https://drive.google.com/drive/folders/1PqByQSfzyLjfdZZDwn6RXIECso7WB9IY
@ai_machinelearning_big_data
👍26🔥8❤4