RuLeanALBERT — cамая большая BERT-подобная модель на русском, которую можно скачать и которая даже поместится на ваш компьютер. Создана в Yandex Research. На бенчмарках по пониманию языка показывает результаты, сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art.
Вы можете использовать открытый код модели в своих проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации.
#GitHub #ML #AI #BERT
Вы можете использовать открытый код модели в своих проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации.
#GitHub #ML #AI #BERT
👍12🔥2❤1
🧠 GraphSAGE: как масштабировать графовые нейронные сети до миллиардов соединений
Что общего между UberEats и Pinterest? Их рекомендательные системы работают с помощью GraphSAGE в огромных масштабах с миллионами и миллиардами узлов и ребер.
Pinterest разработал собственную версию под названием PinSAGE, чтобы рекомендовать пользователям наиболее актуальные изображения (пины). Граф этого ресурса содержит 18 миллиардов соединений и 3 миллиарда узлов.
UberEats также использует модифицированную версию GraphSAGE, чтобы предлагать блюда, рестораны и различные виды кухни. Эта платформа утверждает, что поддерживает более 600 000 ресторанов и 66 миллионов пользователей.
В этом руководстве мы используем набор данных с 20 тысячами узлов, а не миллиардами, из-за ограничений Google Colab. В процессе изучения будем придерживаться архитектуры оригинального GraphSAGE, а также затронем некоторые интересные функции из предыдущих вариантов.
➡️ Читать дальше
⚙️ Код
🗒 Dataset
@machinelearning_ru
Что общего между UberEats и Pinterest? Их рекомендательные системы работают с помощью GraphSAGE в огромных масштабах с миллионами и миллиардами узлов и ребер.
Pinterest разработал собственную версию под названием PinSAGE, чтобы рекомендовать пользователям наиболее актуальные изображения (пины). Граф этого ресурса содержит 18 миллиардов соединений и 3 миллиарда узлов.
UberEats также использует модифицированную версию GraphSAGE, чтобы предлагать блюда, рестораны и различные виды кухни. Эта платформа утверждает, что поддерживает более 600 000 ресторанов и 66 миллионов пользователей.
В этом руководстве мы используем набор данных с 20 тысячами узлов, а не миллиардами, из-за ограничений Google Colab. В процессе изучения будем придерживаться архитектуры оригинального GraphSAGE, а также затронем некоторые интересные функции из предыдущих вариантов.
➡️ Читать дальше
⚙️ Код
🗒 Dataset
@machinelearning_ru
👍14
🦾 Искусственный интеллект с примерами на Python
Автор начинает с рассмотрения общих концепций искусственного интеллекта, после чего переходит к обсуждению более сложных тем, таких как предельно случайные леса, скрытые марковские модели, генетические алгоритмы, сверточные нейронные сети и др. Вы узнаете о том, как принимать обоснованные решения при выборе необходимых алгоритмов, а также о том, как реализовывать эти алгоритмы на языке Python для достижения наилучших результатов. Если вы хотите создавать многоцелевые приложения для обработки информации, содержащейся в изображениях, тексте, голосовых и других данных, то эта книга станет для вас надежным подспорьем.
Основные темы книги:
Различные методы классификации и регрессии данных
Концепция кластеризации и ее применение для автоматического сегментирования данных
Создание интеллектуальных рекомендательных систем
Логическое программирование и способы его применения
Построение автоматизированных систем распознавания речи
Основы эвристического поиска и генетического программирования
Разработка игр с использованием искусственного интеллекта
Обучение с подкреплением
Создание интеллектуальных приложений, связанных с обработкой изображений, текста и последовательных данных
Алгоритмы глубокого обучения и создание приложений на их основе
Книга обсуждается в отдельном сообщении в блоге Виктора Штонда.
📓 Книга
@machinelearning_ru
Автор начинает с рассмотрения общих концепций искусственного интеллекта, после чего переходит к обсуждению более сложных тем, таких как предельно случайные леса, скрытые марковские модели, генетические алгоритмы, сверточные нейронные сети и др. Вы узнаете о том, как принимать обоснованные решения при выборе необходимых алгоритмов, а также о том, как реализовывать эти алгоритмы на языке Python для достижения наилучших результатов. Если вы хотите создавать многоцелевые приложения для обработки информации, содержащейся в изображениях, тексте, голосовых и других данных, то эта книга станет для вас надежным подспорьем.
Основные темы книги:
Различные методы классификации и регрессии данных
Концепция кластеризации и ее применение для автоматического сегментирования данных
Создание интеллектуальных рекомендательных систем
Логическое программирование и способы его применения
Построение автоматизированных систем распознавания речи
Основы эвристического поиска и генетического программирования
Разработка игр с использованием искусственного интеллекта
Обучение с подкреплением
Создание интеллектуальных приложений, связанных с обработкой изображений, текста и последовательных данных
Алгоритмы глубокого обучения и создание приложений на их основе
Книга обсуждается в отдельном сообщении в блоге Виктора Штонда.
📓 Книга
@machinelearning_ru
👍5
🔥 NVIDIA’s AI: Amazing DeepFakes And Virtual Avatars!
🎞Разбор статьи
🗒 Статья
⚙️ Демо
@machinelearning_ru
🎞Разбор статьи
🗒 Статья
⚙️ Демо
@machinelearning_ru
YouTube
NVIDIA’s AI: Amazing DeepFakes And Virtual Avatars!
❤️ Check out Weights & Biases and say hi in their community forum here: https://wandb.me/paperforum
📝 The paper "One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing" is available here:
https://nvlabs.github.io/face-vid2vid/
Try it out:…
📝 The paper "One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing" is available here:
https://nvlabs.github.io/face-vid2vid/
Try it out:…
👍7🔥1
Машинное обучение RU
🔥 NVIDIA’s AI: Amazing DeepFakes And Virtual Avatars! 🎞Разбор статьи 🗒 Статья ⚙️ Демо @machinelearning_ru
This media is not supported in your browser
VIEW IN TELEGRAM
#️⃣ BlendGAN
интересная нейронка позволяющая смешивать лица и преобразовывать их в портреты.
⚙️ GitHub
🔋 Demo
#python #github #soft
@machinelearning_ru
интересная нейронка позволяющая смешивать лица и преобразовывать их в портреты.
⚙️ GitHub
🔋 Demo
#python #github #soft
@machinelearning_ru
👍6❤2😁2🔥1
📊 TimberTrek
Trek, первая интерактивная система визуализации, которая визуализирует тысячи деревьев решений.
⚙️ Github
🗒 Статья
🎞 Video
🚀 Демо
@machinelearning_ru
Trek, первая интерактивная система визуализации, которая визуализирует тысячи деревьев решений.
⚙️ Github
🗒 Статья
🎞 Video
🚀 Демо
@machinelearning_ru
🔥14👍3
🦾 HiPart: Hierarchical divisive clustering toolbox
HiPart — это пакет, созданный для реализации алгоритмов иерархической кластеризации.
⚙️Github:
📄Статья
📎Dataset
@machinelearning_ru
HiPart — это пакет, созданный для реализации алгоритмов иерархической кластеризации.
pip install HiPart⚙️Github:
📄Статья
📎Dataset
@machinelearning_ru
👍6❤2🔥1
🔋 NVIDIA’s New AI: Beautiful Simulations, Cheaper!
🎞Разбор статьи
🗒 Статья
➡️ Подробнее
@machinelearning_ru
🎞Разбор статьи
🗒 Статья
➡️ Подробнее
@machinelearning_ru
YouTube
NVIDIA’s New AI: Beautiful Simulations, Cheaper! 💨
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers
📝 The paper "NeuralVDB: High-resolution Sparse Volume Representation using Hierarchical Neural Networks" is available here:
https://developer.nvidia.com/rendering-te…
📝 The paper "NeuralVDB: High-resolution Sparse Volume Representation using Hierarchical Neural Networks" is available here:
https://developer.nvidia.com/rendering-te…
👍6❤2🔥2🎉2
👨 Как за месяц создать систему учета посещаемости на базе распознавания лиц
В этом месяце наша система управления посещаемостью достигла отметки в 900 000 событий всего через год после запуска. Однако радость от сегодняшних достижений не может стереть из памяти то, как нелегко начиналась работа над этим проектом.
Наша команда, состоящая всего из двух инженеров, смогла создать рабочий прототип системы управления посещаемостью менее чем за месяц и масштабировать ее до более чем 1 000 сотрудников менее чем за 3 месяца.
Эта статья — история о подготовке к запуску программного продукта и технических проблемах, с которыми пришлось столкнуться при его создании.
➡️ Читать дальше
@machinelearning_ru
В этом месяце наша система управления посещаемостью достигла отметки в 900 000 событий всего через год после запуска. Однако радость от сегодняшних достижений не может стереть из памяти то, как нелегко начиналась работа над этим проектом.
Наша команда, состоящая всего из двух инженеров, смогла создать рабочий прототип системы управления посещаемостью менее чем за месяц и масштабировать ее до более чем 1 000 сотрудников менее чем за 3 месяца.
Эта статья — история о подготовке к запуску программного продукта и технических проблемах, с которыми пришлось столкнуться при его создании.
➡️ Читать дальше
@machinelearning_ru
👍10🔥2❤1
👺 txt2mask
это надстройка для веб-интерфейса AUTOMATIC1111, в основе которой лежит Stable Diffusion. txt2mask позволяет вам вводить текст в режиме img2img и автоматически генерировать маску изображения.
⚙️ Github
➡️ Stable Diffusion
@machinelearning_ru
это надстройка для веб-интерфейса AUTOMATIC1111, в основе которой лежит Stable Diffusion. txt2mask позволяет вам вводить текст в режиме img2img и автоматически генерировать маску изображения.
⚙️ Github
➡️ Stable Diffusion
@machinelearning_ru
👍7❤2🔥2
💊 Medical Open Network for AI
MONAI — это основанная на PyTorch библиотека глубокого обучения с открытым исходным кодом для визуализации мед данных, входящая в экосистему PyTorch.
⚙️ Code
🗒 Docs
@machinelearning_ru
MONAI — это основанная на PyTorch библиотека глубокого обучения с открытым исходным кодом для визуализации мед данных, входящая в экосистему PyTorch.
pip install monai⚙️ Code
🗒 Docs
@machinelearning_ru
👍11🔥2❤1
CMGAN: Conformer-Based Metric-GAN for Monaural Speech Enhancement
мы предлагаем основанную на конформере метрическую генеративную состязательную сеть (CMGAN) для SE в частотно-временной (TF) области.
⚙️ Github
🗒 Статья
💻 Demo
@machinelearning_ru
мы предлагаем основанную на конформере метрическую генеративную состязательную сеть (CMGAN) для SE в частотно-временной (TF) области.
⚙️ Github
🗒 Статья
💻 Demo
@machinelearning_ru
👍8❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
⚜️ Руководство по созданию интерактивных визуализаций на Python
Визуализация данных — один из важнейших этапов проекта в области науки о данных и аналитики данных. Она помогает как изучать и понимать данные, так и эффективно обмениваться результатами.
Самыми распространенными библиотеками для создания визуализаций на Python являются Matplotlib и Seaborn, но существует и множество других инструментов.
В этом руководстве мы изучим инструменты HoloViz, а точнее Panel и hvPlot — библиотеки с открытым исходным кодом, которые используются для создания интерактивных диаграмм и контрольных панелей. Также узнаем, как легко развернуть и поделиться контрольной панелью с помощью Jupyter Notebook.
В этом проекте мы будем использовать данные о различных покемонах, доступные на Kaggle и Wikipedia, а также данные о продажах игр про покемонов.
Краткий обзор
Мы выполним следующие задачи.
Создадим простой интерактивный график, используя hvPlot и Pandas.
Построим более сложные визуализации, используя Panel для создания виджетов, которые будут фильтровать данные, и hvPlot для отображения этих данных.
Создадим контрольную панель, показывающую табличные данные, информацию о проекте, а также различные интерактивные диаграммы.
Узнаем, как развертывать контрольную панель на Heroku, чтобы проектом можно было делиться.
➡️ Читать дальше
⚙️ Код
@machinelearning_ru
Визуализация данных — один из важнейших этапов проекта в области науки о данных и аналитики данных. Она помогает как изучать и понимать данные, так и эффективно обмениваться результатами.
Самыми распространенными библиотеками для создания визуализаций на Python являются Matplotlib и Seaborn, но существует и множество других инструментов.
В этом руководстве мы изучим инструменты HoloViz, а точнее Panel и hvPlot — библиотеки с открытым исходным кодом, которые используются для создания интерактивных диаграмм и контрольных панелей. Также узнаем, как легко развернуть и поделиться контрольной панелью с помощью Jupyter Notebook.
В этом проекте мы будем использовать данные о различных покемонах, доступные на Kaggle и Wikipedia, а также данные о продажах игр про покемонов.
Краткий обзор
Мы выполним следующие задачи.
Создадим простой интерактивный график, используя hvPlot и Pandas.
Построим более сложные визуализации, используя Panel для создания виджетов, которые будут фильтровать данные, и hvPlot для отображения этих данных.
Создадим контрольную панель, показывающую табличные данные, информацию о проекте, а также различные интерактивные диаграммы.
Узнаем, как развертывать контрольную панель на Heroku, чтобы проектом можно было делиться.
➡️ Читать дальше
⚙️ Код
@machinelearning_ru
👍8🔥3🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
👱♂️ Редактор 3D лиц в онлайн
C данным алгоритмом можно легко и просто сгенерить на основе GAN лицо и отредактировать его в 3D.
Исследователи из Tencent AI Lab, ByteDance и Университета Цинхуа представили IDE-3D, новую генеративную модель для рисования лица в режиме свободного просмотра, редактирования и управления стилем. Система, работающая на базе GAN, обеспечивает локальное управление формой и текстурой лица, а также интерактивное редактирование в режиме онлайн.
Тем, кто следит за нашими постами, очевидно, что совместили сразу несколько GAN нейросетей, добавив визуальный редактор.
Установка
➡️ Проект
⚙️ Код
🗒 Статья
@machinelearning_ru
C данным алгоритмом можно легко и просто сгенерить на основе GAN лицо и отредактировать его в 3D.
Исследователи из Tencent AI Lab, ByteDance и Университета Цинхуа представили IDE-3D, новую генеративную модель для рисования лица в режиме свободного просмотра, редактирования и управления стилем. Система, работающая на базе GAN, обеспечивает локальное управление формой и текстурой лица, а также интерактивное редактирование в режиме онлайн.
Тем, кто следит за нашими постами, очевидно, что совместили сразу несколько GAN нейросетей, добавив визуальный редактор.
Установка
git clone --recursive https://github.com/MrTornado24/IDE-3D.git
cd IDE-3D
conda env create -f environment.yml➡️ Проект
⚙️ Код
🗒 Статья
@machinelearning_ru
👍9❤4🔥2
📌 MGAD-multimodal-guided-artwork-diffusion
Алгоритм создания цифровых иллюстраций на основе диффузии, который использует мультимодальные подсказки в качестве руководства для управления моделью.
⚙️ Код
🗒 Статья
@machinelearning_ru
Алгоритм создания цифровых иллюстраций на основе диффузии, который использует мультимодальные подсказки в качестве руководства для управления моделью.
git clone https://github.com/openai/CLIP
pip install -e ./CLIP
pip install -e ./guided-diffusion
pip install lpips
⚙️ Код
🗒 Статья
@machinelearning_ru
👍5🔥2❤1
📎 TVLT: Textless Vision-Language Transformer
⚙️ Код
🗒 Статья
Colab
➡️ Dataset
@machinelearning_ru
conda create -n TVLT python=3.8 # You can also use other environment.⚙️ Код
🗒 Статья
Colab
➡️ Dataset
@machinelearning_ru
👍5❤1🔥1
✔️ 6 алгоритмов машинного обучения, которые должен знать каждый исследователь данных
Алгоритмы машинного обучения делятся на контролируемые и неконтролируемые.
Алгоритмы контролируемого обучения моделируют отношения между помеченными входными и выходными данными (также известными как целевые данные). Впоследствии такая модель используется для предсказания метки новых наблюдений с помощью новых помеченных входных данных. Если целевая переменная дискретная, алгоритм решает задачи классификации, а если целевая переменная непрерывная — алгоритм используется для задач регрессии.
В отличие от контролируемого, неконтролируемое обучение не опирается на помеченные входные/выходные данные, а обрабатывает непомеченные данные.
➡️ Читать дальше
@machinelearning_ru
Алгоритмы машинного обучения делятся на контролируемые и неконтролируемые.
Алгоритмы контролируемого обучения моделируют отношения между помеченными входными и выходными данными (также известными как целевые данные). Впоследствии такая модель используется для предсказания метки новых наблюдений с помощью новых помеченных входных данных. Если целевая переменная дискретная, алгоритм решает задачи классификации, а если целевая переменная непрерывная — алгоритм используется для задач регрессии.
В отличие от контролируемого, неконтролируемое обучение не опирается на помеченные входные/выходные данные, а обрабатывает непомеченные данные.
➡️ Читать дальше
@machinelearning_ru
👍8❤1🔥1
🎓 Stanford CS25 бесплатный курс по Трансформерам
✔️ Курс: https://web.stanford.edu/class/cs25/
➡️ Лекции: https://www.youtube.com/playlist?list=PLoROMvodv4rNiJRchCzutFw5ItR_Z27CM
@machinelearning_ru
✔️ Курс: https://web.stanford.edu/class/cs25/
➡️ Лекции: https://www.youtube.com/playlist?list=PLoROMvodv4rNiJRchCzutFw5ItR_Z27CM
@machinelearning_ru
👍7❤1🔥1
🔋 Denoising of 3D MR images using a voxel-wise hybrid residual MLP-CNN model to improve small lesion diagnostic confidence
⚙️ Код
🗒 Статья
➡️ Dataset
@machinelearning_ru
⚙️ Код
🗒 Статья
➡️ Dataset
@machinelearning_ru
👍5🥰2🔥1