Machinelearning

FunASR: A Fundamental End-to-End Speech Recognition Toolkit

FunASR, an open-source speech recognition toolkit designed to bridge the gap between academic research and industrial applications

Фундаментальный набор инструментов для распознавания речи.

🖥

Github: https://github.com/alibaba-damo-academy/FunASR

⭐️

Docs: https://alibaba-damo-academy.github.io/FunASR/en/index.html

⏩

Paper: https://arxiv.org/abs/2305.11013v1

📌 Dataset: https://paperswithcode.com/dataset/wenetspeech

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤2🔥2

8.02K views07:53

Machinelearning

Segment Any Anomaly without Training via Hybrid Prompt Regularization

This project addresses zero-shot anomaly detection by combining SAM and Grouding DINO.

Цель этого проекта - сегментировать любую аномалию без какого-либо обучения. Это интересное демо работает, объединяя Grounding DINO и Segment Anything!

🖥

Github: https://github.com/caoyunkang/segment-any-anomaly

🖥

Colab: https://colab.research.google.com/drive/1Rwio_KfziuLp79Qh_ugum64Hjnq4ZwsE?usp=sharing

⏩

Paper: https://arxiv.org/abs/2305.11013v1

📌 Dataset: https://paperswithcode.com/dataset/visa

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4🔥2🥰1

8.27K views13:02

Machinelearning

Diff-Pruning: Structural Pruning for Diffusion Models

Structural Pruning for Diffusion Models.

Diff-Pruning - новый эффективный метод прунинга для диффузионных моделей.

🖥

Github: https://github.com/vainf/diff-pruning

⏩

Paper: https://arxiv.org/abs/2305.10924v1

📌 Dataset: https://paperswithcode.com/dataset/lsun

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤2🔥1

8.4K views19:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⭐️

Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold

DragGAN, anyone can deform an image with precise control over where pixels go, thus manipulating the pose, shape, expression, and layout of diverse categories such as animals, cars, humans, landscapes, etc.

DragGAN: Новый метод манипуляции сгенерированных изображений, который позволяет изменять позицию объектов, их размеры, выражения лиц, позы одим кликом.

📌 Project: https://vcai.mpi-inf.mpg.de/projects/DragGAN/

🖥

Github: https://github.com/XingangPan/DragGAN

⏩

Paper: https://arxiv.org/pdf/2305.10973.pdf

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤31🔥17👍12

9.65K viewsedited 09:04

Machinelearning

🦙 LLM-Pruner: On the Structural Pruning of Large Language Models

Compress your LLMs to any size;

LLM-Pruner: модель прунинга для больших языковых моделей.

🖥

Github: https://github.com/horseee/llm-pruner

⏩

Paper: https://arxiv.org/abs/2305.11627v1

📌 Dataset: https://paperswithcode.com/dataset/piqa

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12🔥4❤3

8.37K views09:39

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

Mask-Free Video Instance Segmentation

MaskFreeVIS, achieving highly competitive VIS performance, while only using bounding box annotations for the object state.

Новый высокопроизводительный фреймворк для сегментации видео.

🖥

Github: https://github.com/SysCV/maskfreevis

⏩

Paper: https://arxiv.org/pdf/2303.15904.pdf

📌 Project: http://www.vis.xyz/pub/maskfreevis/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17🔥7❤1

8.28K views16:28

Machinelearning

📎 Instruction-tuning Stable Diffusion with InstructPix2Pix

InstructPix2Pix training strategy to follow more specific instructions related to tasks in image translation (such as cartoonization) and low-level image processing (such as image deraining).

В этом посте рассматривается настройка промптов для обучения Stable Diffusion. С помощью этого метода мы сможем легко настраивать Stable Diffusion на обработку изображений, используя входное изображение, в качестве промпта, например - Применить фильтр мультфильма к изображению.

🖥

Post: https://huggingface.co/blog/instruction-tuning-sd

⭐️

Training and inference code: https://github.com/huggingface/instruction-tuned-sd

📌 Demo: https://huggingface.co/spaces/instruction-tuning-sd/instruction-tuned-sd

⏩

InstructPix2Pix: https://huggingface.co/timbrooks/instruct-pix2pix

🔍Datasets and models from this post: https://huggingface.co/instruction-tuning-sd

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥3❤1

8.01K views07:36

🆕 Yandex Cloud добавила новый режим работы в Yandex DataSphere — Dedicated
Yandex DataSphere — это сервис для полного цикла машинного обучения, в котором есть все необходимые инструменты для разработки и интеграции с другими облачными сервисами.
Что открывает выделенный режим Dedicated:
— возможность зарезервировать виртуальную машину в облаке под свой проект и работать с ней сколько нужно;
— ускорение работы моделей машинного обучения для задач по анализу данных.
Что ещё изменилось в Yandex DataSphere:
— режим Serverless остаётся, вы также можете его выбрать и оплачивать вычислительные мощности только во время реального обучения;
— появилась новая версия Jupyter Notebook, это популярный редактор кода для ML-разработки. Обновили интерфейс и добавили предустановленные расширения.
Все подробности можете узнать по ссылке, а обсудить в сообществе разработчиков и аналитиков Yandex DataSphere➡️

👎6🔥6🥱4❤2🤷‍♂1👍1🤔1

7.92K views14:08

Machinelearning

Interactive Data Synthesis for Systematic Vision Adaptation via LLMs-AIGCs Collaboration

GPT-4 can do anything even in visual tasks——Label anything just all in one-pipeline.

Аннотирование чего угодно в визуальных задачах - все в одном конвейере с GPT-4.

🖥

Github: https://github.com/yuqifan1117/labal-anything-pipeline

⏩

Paper: https://arxiv.org/abs/2305.12799v1

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤3🔥2

7.78K views18:38

Machinelearning

EfficientSpeech: An On-Device Text to Speech Model

It generates mel spectrogram at a speed of 104 (mRTF) or 104 secs of speech per sec on an RPi4.

EfficientSpeech, или сокращенно ES, - это мощная нейронная модель преобразования текста в речь (TTS). I

🖥

Github: https://github.com/roatienza/efficientspeech

⏩

Paper: https://arxiv.org/abs/2305.13905v1

📌 Dataset: https://paperswithcode.com/dataset/ljspeech

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13👍5❤1

8.18K views10:31

Machinelearning

Как построить систему геоаналитики с применением ML

Решать аналитические бизнес-задачи с большим количеством значимых признаков помогает машинное обучение. Новая статья на Хабре предлагает рассмотреть примеры работы сервисов геоаналитики VK Predict и демонстрирует, какие модели машинного обучения используются при построении таких систем.

Читать статью: https://habr.com/ru/companies/vk/articles/734102/

ai_machinelearning_big_data

🔥5🥱5👍2

8.32K views15:01

Machinelearning

QLoRA: Efficient Finetuning of Quantized LLMs

Model name Guanaco, outperforms all previous openly released models on the Vicuna benchmark, reaching 99.3% of the performance level of ChatGPT while only requiring 24 hours of finetuning on a single GPU.

QLoRA - эффективный метод файнтюнинга, который позволяет сократить использование памяти, чтобы произвести файнтюнинг модели с 65B параметрами на одном GPU 48 ГБ.

🖥

Github: https://github.com/artidoro/qlora

⏩

Paper: https://arxiv.org/abs/2305.14314

⭐️

Demo: https://huggingface.co/spaces/uwnlp/guanaco-playground-tgi

📌 Dataset: https://paperswithcode.com/dataset/ffhq

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16🔥6❤4

9.18K views17:33

Machinelearning

🦖 Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data Curation

Dynosaur, a large-scale instruction tuning dataset obtained automatically with significantly lower generation costs.

Новый фреймворк для широкого спектра NLP задач для instruction tuning и генерации датсетов, при низких высчислительных затратах и высоком качетсве данных.

🖥

Github: https://github.com/wadeyin9712/dynosaur

🔎 Project: https://dynosaur-it.github.io/

⏩

Paper: https://arxiv.org/abs/2305.14327

📌 Dataset: https://paperswithcode.com/dataset/ffhq

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍9🥰1🌭1

9.52K views10:01

Machinelearning

Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models

The performance of Text2Image is largely dependent on text prompts. In Prompt-Free Diffusion, no prompt is needed, just a reference images.

Prompt-Free Diffusion - это модель диффузии, которая принимает визуальные данные для генерации изображений без ввода текстовых промптов.

🖥

Github: https://github.com/shi-labs/prompt-free-diffusion

🔎 Demo: https://huggingface.co/spaces/shi-labs/Prompt-Free-Diffusion

⏩

Paper: https://arxiv.org/abs/2305.16223v1

📌 Dataset: https://paperswithcode.com/dataset/ffhq

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥3🥰1

9K views06:25

Machinelearning

Large Language Models as Tool Makers

In this work, we take an initial step towards removing this dependency by proposing a closed-loop framework, referred to as LLMs A s Tool Makers (LATM), where LLMs create their own reusable tools for problem-solving.

Фреймворк для работы с большими языковыми моделями для создатния инструментов и скриптов на Python.

🖥

Github: https://github.com/ctlllll/llm-toolmaker

⏩

Paper: https://arxiv.org/pdf/2305.17126v1.pdf

📌 Dataset: https://paperswithcode.com/dataset/big-bench

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤2🔥2

8.53K views09:58

Machinelearning

Стань лучшим на онлайн-хакатоне PROFBUH HACKATHON | JUNE 🏆

Открыта регистрация на онлайн-хакатон от компании Профбух и Акселератора Возможностей!

Кейс:
🔹Автоматическое создание текстовых публикаций на основе записанного видео.

Даты хакатона:
23 – 25 июня 2023 года
Дедлайн регистрации:
19 июня 23:59
Регистрация и подробности - https://clck.ru/34WoFU

Кому подходит хакатон?
🔸Студентам, разработчикам, дизайнерам, продакт-менеджерам и аналитикам.

Что нужно будет сделать?
🔸Разработать web-систему для автоматического создания уникальных статей на основе видео из YouTube.

Что тебя ждёт?
🔹2 дня в онлайн-формате
🔹встречи с экспертами, мастер-классы и питчи
🔹крутой командный проект и интересный кейс в резюме
🔹призовой фонд – 300.000₽

Регистрируйся, решай кейс и выигрывай призы!🏆

❤2👍2

7.93K views08:01

About

Blog

Apps

Platform