🔎 Moving Object Segmentation:All You Need Is SAM (and Flow)
SAM + Optical Flow = FlowSAM
FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥
▪ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
▪ Code: https://github.com/Jyxarthur/flowsam
▪Paper: https://arxiv.org/abs/2404.12389
▪ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR
@ai_machinelearning_big_data
SAM + Optical Flow = FlowSAM
FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥
▪ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
▪ Code: https://github.com/Jyxarthur/flowsam
▪Paper: https://arxiv.org/abs/2404.12389
▪ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR
@ai_machinelearning_big_data
👍28🔥7❤6
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤3🔥2🤔2👌1
Ориентированная на конфиденциальность поисковая система Brave расширила функциональность своей системы ответов на запросы пользователей с помощью ИИ.
Теперь при вводе запроса в Brave в поле выдачи сперва отображается выжимка от AI с ссылками на источники, и только потом сайты.
Выглядит наподобие Perplexity и Phind.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤4🔥4🤬2🌭1
🪄👕 Magic Clothing: controllable garment-driven image synthesis
Вышла модель Waifu Dress Up 2024!
Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.
▪Github
▪Paper
@ai_machinelearning_big_data
Вышла модель Waifu Dress Up 2024!
Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.
git clone https://github.com/ShineChen1024/MagicClothing.git
▪Github
▪Paper
@ai_machinelearning_big_data
👍16🔥7❤3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 AI Image Generator: Create images from text.
Новое поколение #Photoshop уже здесь.
Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.
Полный список обновлений здесь.
▪Blog
▪Demo
@ai_machinelearning_big_data
Новое поколение #Photoshop уже здесь.
Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.
Полный список обновлений здесь.
▪Blog
▪Demo
@ai_machinelearning_big_data
👍13🔥7❤6❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️🗣 OpenVoice V2 - a Text-to-Speech model that can clone any voice and speak in any language.
OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.
• Github: https://github.com/myshell-ai/OpenVoice/tree/main
• Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md
@ai_machinelearning_big_data
OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.
• Github: https://github.com/myshell-ai/OpenVoice/tree/main
• Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md
@ai_machinelearning_big_data
👍25🔥8❤5
Сегодня Apple выпустили Openly.
- Новое семейство LM с открытым исходным кодом для обучения моделей и логического вывода
- Работает наравне с OLMo, но требует в 2 раза меньше токенов для обучения
- Модели для различных задач, включая базовые модели (например, CLIP и LLM), классификацию объектов, обнаружение объектов и семантическую сегментацию.
Cписок моделей и подробная информации о каждой из них:
- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct
• gitHub: https://github.com/apple/corenet
• hf: https://huggingface.co/apple/OpenELM
• abs: https://arxiv.org/abs/2404.14619
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11❤3
🖼 HiDiffusion: Unlocking High-Resolution Creativity and Efficiency in Low-Resolution Trained Diffusion Models 🦊
Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion.
Его можно интегрировать в конвейеры diffusion, добавив всего одну строку кода!
• page: https://hidiffusion.github.io
• paper: https://arxiv.org/abs/2311.17528
• code: https://github.com/megvii-research/HiDiffusion
•colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing
@ai_machinelearning_big_data
Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion.
Его можно интегрировать в конвейеры diffusion, добавив всего одну строку кода!
pip3 install hidiffusion
• page: https://hidiffusion.github.io
• paper: https://arxiv.org/abs/2311.17528
• code: https://github.com/megvii-research/HiDiffusion
•colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing
@ai_machinelearning_big_data
👍21🔥5❤4
PyTorch 2.3 is here 😎🔥
Вышел PyTorch 2.3.
В PyTorch 2.3 реализована поддержка пользовательских ядер Triton в torch.compile, что позволяет пользователям переносить свои собственные ядра Triton без снижения производительности или сбоев в графике.
Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA.
В этом выпуске зафиксировано 3393 изменений.
Полный список обновлений: https://pytorch.org/blog/pytorch2-3/
@ai_machinelearning_big_data
Вышел PyTorch 2.3.
В PyTorch 2.3 реализована поддержка пользовательских ядер Triton в torch.compile, что позволяет пользователям переносить свои собственные ядра Triton без снижения производительности или сбоев в графике.
Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA.
В этом выпуске зафиксировано 3393 изменений.
Полный список обновлений: https://pytorch.org/blog/pytorch2-3/
@ai_machinelearning_big_data
👍37🔥16❤5❤🔥3
Полученные стартапом изображения мгновенно преобразуются в анонимные статистические данные, обрабатываемые локально за 100 мс. Стартап не хранит изображения или личные данные, а только статистические данные.
Кстати, в начале 2024 года корпорация купила стартап WaveOne, который предлагает ИИ-алгоритм для сжатия видео.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍11❤7🤔6