Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
RuLeanALBERT — cамая большая BERT-подобная модель на русском, которую можно скачать и которая даже поместится на ваш компьютер. Создана в Yandex Research. На бенчмарках по пониманию языка показывает результаты, сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art.

Вы можете использовать открытый код модели в своих проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации.

#GitHub #ML #AI #BERT
👍12🔥21
🧠 GraphSAGE: как масштабировать графовые нейронные сети до миллиардов соединений

Что общего между UberEats и Pinterest? Их рекомендательные системы работают с помощью GraphSAGE в огромных масштабах с миллионами и миллиардами узлов и ребер.

Pinterest разработал собственную версию под названием PinSAGE, чтобы рекомендовать пользователям наиболее актуальные изображения (пины). Граф этого ресурса содержит 18 миллиардов соединений и 3 миллиарда узлов.
UberEats также использует модифицированную версию GraphSAGE, чтобы предлагать блюда, рестораны и различные виды кухни. Эта платформа утверждает, что поддерживает более 600 000 ресторанов и 66 миллионов пользователей.
В этом руководстве мы используем набор данных с 20 тысячами узлов, а не миллиардами, из-за ограничений Google Colab. В процессе изучения будем придерживаться архитектуры оригинального GraphSAGE, а также затронем некоторые интересные функции из предыдущих вариантов.

➡️ Читать дальше
⚙️ Код
🗒 Dataset

@machinelearning_ru
👍14
🦾 Искусственный интеллект с примерами на Python

Автор начинает с рассмотрения общих концепций искусственного интеллекта, после чего переходит к обсуждению более сложных тем, таких как предельно случайные леса, скрытые марковские модели, генетические алгоритмы, сверточные нейронные сети и др. Вы узнаете о том, как принимать обоснованные решения при выборе необходимых алгоритмов, а также о том, как реализовывать эти алгоритмы на языке Python для достижения наилучших результатов. Если вы хотите создавать многоцелевые приложения для обработки информации, содержащейся в изображениях, тексте, голосовых и других данных, то эта книга станет для вас надежным подспорьем.


Основные темы книги:
Различные методы классификации и регрессии данных
Концепция кластеризации и ее применение для автоматического сегментирования данных
Создание интеллектуальных рекомендательных систем
Логическое программирование и способы его применения
Построение автоматизированных систем распознавания речи
Основы эвристического поиска и генетического программирования
Разработка игр с использованием искусственного интеллекта
Обучение с подкреплением
Создание интеллектуальных приложений, связанных с обработкой изображений, текста и последовательных данных
Алгоритмы глубокого обучения и создание приложений на их основе
Книга обсуждается в отдельном сообщении в блоге Виктора Штонда.

📓 Книга

@machinelearning_ru
👍5
📊 TimberTrek

Trek, первая интерактивная система визуализации, которая визуализирует тысячи деревьев решений.

⚙️ Github
🗒 Статья
🎞 Video
🚀 Демо

@machinelearning_ru
🔥14👍3
🦾 HiPart: Hierarchical divisive clustering toolbox

HiPart — это пакет, созданный для реализации алгоритмов иерархической кластеризации.

pip install HiPart

Github:
📄Статья
📎Dataset

@machinelearning_ru
👍62🔥1
👨 Как за месяц создать систему учета посещаемости на базе распознавания лиц

В этом месяце наша система управления посещаемостью достигла отметки в 900 000 событий всего через год после запуска. Однако радость от сегодняшних достижений не может стереть из памяти то, как нелегко начиналась работа над этим проектом.

Наша команда, состоящая всего из двух инженеров, смогла создать рабочий прототип системы управления посещаемостью менее чем за месяц и масштабировать ее до более чем 1 000 сотрудников менее чем за 3 месяца.

Эта статья  —  история о подготовке к запуску программного продукта и технических проблемах, с которыми пришлось столкнуться при его создании.

➡️ Читать дальше

@machinelearning_ru
👍10🔥21
👺 txt2mask

это надстройка для веб-интерфейса AUTOMATIC1111, в основе которой лежит Stable Diffusion. txt2mask позволяет вам вводить текст в режиме img2img и автоматически генерировать маску изображения.

⚙️ Github
➡️ Stable Diffusion

@machinelearning_ru
👍72🔥2
💊 Medical Open Network for AI

MONAI — это основанная на PyTorch библиотека глубокого обучения с открытым исходным кодом для визуализации мед данных, входящая в экосистему PyTorch.

pip install monai

⚙️ Code
🗒 Docs

@machinelearning_ru
👍11🔥21
CMGAN: Conformer-Based Metric-GAN for Monaural Speech Enhancement

мы предлагаем основанную на конформере метрическую генеративную состязательную сеть (CMGAN) для SE в частотно-временной (TF) области.

⚙️ Github
🗒 Статья
💻 Demo

@machinelearning_ru
👍82🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
⚜️ Руководство по созданию интерактивных визуализаций на Python

Визуализация данных — один из важнейших этапов проекта в области науки о данных и аналитики данных. Она помогает как изучать и понимать данные, так и эффективно обмениваться результатами.

Самыми распространенными библиотеками для создания визуализаций на Python являются Matplotlib и Seaborn, но существует и множество других инструментов.

В этом руководстве мы изучим инструменты HoloViz, а точнее Panel и hvPlot  — библиотеки с открытым исходным кодом, которые используются для создания интерактивных диаграмм и контрольных панелей. Также узнаем, как легко развернуть и поделиться контрольной панелью с помощью Jupyter Notebook.

В этом проекте мы будем использовать данные о различных покемонах, доступные на Kaggle и Wikipedia, а также данные о продажах игр про покемонов.

Краткий обзор
Мы выполним следующие задачи.

Создадим простой интерактивный график, используя hvPlot и Pandas.
Построим более сложные визуализации, используя Panel для создания виджетов, которые будут фильтровать данные, и hvPlot для отображения этих данных.
Создадим контрольную панель, показывающую табличные данные, информацию о проекте, а также различные интерактивные диаграммы.
Узнаем, как развертывать контрольную панель на Heroku, чтобы проектом можно было делиться.

➡️ Читать дальше
⚙️ Код

@machinelearning_ru
👍8🔥3🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
👱‍♂️ Редактор 3D лиц в онлайн

C данным алгоритмом можно легко и просто сгенерить на основе GAN лицо и отредактировать его в 3D.
Исследователи из Tencent AI Lab, ByteDance и Университета Цинхуа представили IDE-3D, новую генеративную модель для рисования лица в режиме свободного просмотра, редактирования и управления стилем. Система, работающая на базе GAN, обеспечивает локальное управление формой и текстурой лица, а также интерактивное редактирование в режиме онлайн.
Тем, кто следит за нашими постами, очевидно, что совместили сразу несколько GAN нейросетей, добавив визуальный редактор.

Установка

git clone --recursive https://github.com/MrTornado24/IDE-3D.git
cd IDE-3D
conda env create -f environment.yml


➡️ Проект
⚙️ Код
🗒 Статья

@machinelearning_ru
👍94🔥2
📌 MGAD-multimodal-guided-artwork-diffusion

Алгоритм создания цифровых иллюстраций на основе диффузии, который использует мультимодальные подсказки в качестве руководства для управления моделью.

git clone https://github.com/openai/CLIP
pip install -e ./CLIP
pip install -e ./guided-diffusion
pip install lpips

⚙️ Код
🗒 Статья

@machinelearning_ru
👍5🔥21
📎 TVLT: Textless Vision-Language Transformer

conda create -n TVLT python=3.8 # You can also use other environment.


⚙️ Код
🗒 Статья
Colab
➡️ Dataset

@machinelearning_ru
👍51🔥1
✔️ 6 алгоритмов машинного обучения, которые должен знать каждый исследователь данных

Алгоритмы машинного обучения делятся на контролируемые и неконтролируемые.

Алгоритмы контролируемого обучения моделируют отношения между помеченными входными и выходными данными (также известными как целевые данные). Впоследствии такая модель используется для предсказания метки новых наблюдений с помощью новых помеченных входных данных. Если целевая переменная дискретная, алгоритм решает задачи классификации, а если целевая переменная непрерывная  —  алгоритм используется для задач регрессии.

В отличие от контролируемого, неконтролируемое обучение не опирается на помеченные входные/выходные данные, а обрабатывает непомеченные данные.

➡️ Читать дальше

@machinelearning_ru
👍81🔥1
🎓 Stanford CS25 бесплатный курс по Трансформерам

✔️ Курс: https://web.stanford.edu/class/cs25/

➡️ Лекции: https://www.youtube.com/playlist?list=PLoROMvodv4rNiJRchCzutFw5ItR_Z27CM

@machinelearning_ru
👍71🔥1
🔋 Denoising of 3D MR images using a voxel-wise hybrid residual MLP-CNN model to improve small lesion diagnostic confidence

⚙️ Код
🗒 Статья
➡️ Dataset


@machinelearning_ru
👍5🥰2🔥1