Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🖥 AWS Personalize для рекомендации новых фильмов пользователям на основе их оценок по сравнению с другими похожими фильмами.

Amazon Personalize позволяет разработчикам, не имеющим опыта машинного обучения, легко встраивать сложные возможности персонализации в свои приложения. С помощью Personalize вы предоставляете поток действий из своего приложения, а также список элементов, которые хотите порекомендовать, и Personalize обработает данные для обучения модели персонализации, настроенной для ваших данных.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
📚 Phenaki

Проект для генерации видео любой длины из текстовых описаний.

Проект: https://phenaki.video/index.html
Статья: https://openreview.net/forum?id=vOEXS39nOF

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥21
Как увеличить скорость Pandas и обрабатывать 10 млн необработанных наборов данных за миллисекунды

За последние годы использование Pandas выросло в бесчисленное количество раз. Покажу вам, как использовать Pandas максимально быстрым способом. Потому что вы не можете ускорить то, что и так быстро работает.

Было бы странным использовать функции, которые в документации Pandas четко указаны как медленные, а не как самые быстрые методы.

В этой статье покажем вам лучшие практики некоторых наиболее распространенных операций с данными в Pandas. Вы даже можете рассматривать эти рекомендации как «здравый смысл», потому что именно так создатель Pandas намеревался использовать свою библиотеку.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥2
🖥 Нейронные сети решают задачу массового обслуживания

Применение современного аппарата искусственных нейронных сетей в различных технических системах способствует повышению эффективности их функционирования. Рассмотрю это на примере организации движения транспортных средств. Была поставлена задача разработать интеллектуальную систему управления светофорами, которая позволит управлять транспортными потоками на основе данных о загрузке направлений перекрестка и дорог, выходящих с соседних перекрестков.

Для решения этой задачи используется алгоритм, который предполагает реализацию принципа декомпозиции выработки решений. Он считается общепринятым для сетевых адаптивных методов управления.

В основе декомпозиции управления лежит разбиение района города на взаимно пересекающиеся дороги.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥21🤔1
🖥 @github_code - лучшие проекты с Github теперь доступны в одном канале.

Проекты , которые реально помогут в разработке и помогут прокачать навыки программирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1
Media is too big
VIEW IN TELEGRAM
⭐️ Musika! Fast Infinite Waveform Music Generation

Моментальная генерация стереомузыки:
Техно, Метал, Лофи (пример в видео).

Возможность обучать Musika на своем собственном музыкальном наборе данных .

conda create -n musika python=3.9

🔩 GitHub
➡️ Попробовать
🚀 Demo

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
Perspective — API для модерации комментариев и обсуждений

Инструмент использует технологию машинного обучения для распознавания "токсичных" формулировок: оскорблений, угроз, домогательств. Набор триггеров выбирается самостоятельно. Каждый комментарий получает оценку по 100-балльной шкале, чем выше оценка — тем оскорбительнее комментарий. Это значительно упрощает модерацию — достаточно только отфильтровать обсценные высказывания и отклонить их. Со стороны пользователя предусмотрена сортировка по шкале оскорбительности, чтобы не сталкиваться с такими высказываниями. Инструмент также можно внедрить в поле написания комментария — тогда пользователь сразу будет знать оценку оскорбительности.

Доступно для русского, английского, китайского, французского, немецкого и других языков.

Стоимость: #бесплатно.

#API #веб

@machinelearning_ru
👍62🔥1
🖥 Зачем вам нужно использовать активное обучение при обучении нейронных сетей

Часто разметка данных оказывается самой серьёзной преградой для машинного обучения — сбор больших объёмов данных, их обработка и разметка для создания достаточно производительной модели могут занимать недели или даже месяцы. Активное обучение позволяет обучать модели машинного обучения на гораздо меньшем количестве размеченных данных. Лучшие компании в сфере ИИ, например, Tesla, уже используют активное обучение. Мы считаем, что и вам тоже оно необходимо.

В этом посте мы расскажем, что такое активное обучение, рассмотрим инструменты для его практического применения и продемонстрируем, как мы сами упрощаем внедрение активного обучения в процесс NLP.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🔥1
🖥 Большие данные: 70 невероятных бесплатных источников данных.

Вся отличная визуализация данных начинается с хороших, чистых данных. Большинство считают, что сбор больших данных будет трудной работой, но это неправда. На сайте доступны тысячи бесплатных наборов данных, готовых для анализа и просмотра любым пользователем.

Здесь мы собрали 70 источников свободных данных на правительство, преступности, здравоохранения, финансовых и экономических данных, маркетинга и социальных сетей, журналистики и средств массовой информации, недвижимости, каталог, обзор бизнеса и многое другое.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍31
🖥 EnCodec: высокоточное нейронное сжатие звука

pip install -U encodec # stable release
pip install -U git+https://git@github.com/facebookresearch/encodec#egg=encodec # bleeding edge
# of if you cloned the repo locally
pip install .


➡️ Github
📃 Статья
↪️ Образец

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
⭐️ DiffusionDB

DiffusionDB — это первый крупный набор данных для преобразования текста в изображение. Он содержит 2 миллиона изображений, сгенерированных Stable Diffusion с использованием подсказок и гиперпараметров, заданных реальными пользователями. Беспрецедентный масштаб и разнообразие этого набора данных, открывают захватывающие возможности для исследований в понимании работы с генеративными моделями, обнаружении дипфейков и разработке инструментов взаимодействия человека и ИИ, чтобы упростить пользователям использование этих моделей.

🖥 Github
🗒 Статья:
➡️ Датасет

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥31
📚 Сегментация изображений с использованием сети обратного внимания

Большинство методов семантической сегментации на основе СNN (convolutional neural network, сверточной нейронной сети) сосредоточены на простом получении правильных предсказаний без обучения модели различать классы. По этой причине характеристики менее распространенных классов могут быть проигнорированы.

Из-за визуального сходства классы обладают общими высокоуровневыми признаками, что может привести к запутанным результатам в областях, где классы смешиваются или граничат между собой. Например, фон может сливаться с объектом, поскольку они имеют схожую силу активации.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2
🔥 Best it channels

🖥 Machine learning
@ai_machinelearning_big_data – все о машинном обучении
@data_analysis_ml – все о анализе данных.
@machinelearning_ru – машинное обучении на русском от новичка до профессионала.
@machinelearning_interview – подготовка к собеседования Data Science
@datascienceiot – бесплатные книги Machine learning
@ArtificialIntelligencedl – канал о искусственном интеллекте
@neural – все о нейронных сетях
@machinee_learning – чат о машинном обучении
@datascienceml_jobs - работа ds, ml
@machinelearning_books - ml notes
@bigdatai - big data
@vistehno - ai news

🖥 Python
@pythonl
@python_job_interview – подготовка к Python собеседованию
@pro_python_code – погружение в python
@python_testit тесты на python
@pythonlbooks - книги Python
@Django_pythonl django
@python_djangojobs - работа Python

📢 English for coders

@english_forprogrammers - Английский для программистов

🖥 Java
@javatg - Java для програмистов
@javachats Java чат
@java_library - книги Java
@android_its Android разработка
@java_quizes - тесты Java
@Java_workit - работа Java
@progersit - шпаргалки ит

🖥 Javascript / front
@react_tg - react js
@javascriptv - js канал
@about_javascript - javascript продвинутый
@JavaScript_testit -тесты JS
@htmlcssjavas - web
@hashdev - web разработка

👣 Golang
@Golang_google - go для разработчиков
@golang_interview - вопросы и ответы с собеседований по Go.
@golangtests - тесты и задачи GO
@golangl - чат Golang
@GolangJobsit - вакансии и работа GO
@golang_jobsgo - чат вакансий
@golang_books - книги Golang
@golang_speak - обсуждение задач Go

🖥 Linux
@linux_kal - чат kali linux
@linuxkalii - linux kali
@linux_read - книги linux

👷‍♂️ IT работа

@hr_itwork - ит-вакансии
@GolangJobsit
@python_djangojobs - python jobs
@javascriptjobjs - js jobs
@Java_workit - java jobs

🖥 SQL
@sqlhub - базы данных
@chat_sql - базы данных чат

🤡It memes
@memes_prog - ит-мемы

⚙️ Rust
@rust_code - язык программирования rust
@rust_chats - чат rust

#️⃣ c# c++
@csharp_ci - c# c++кодинг
@csharp_cplus чат

📓 Книги

@programming_books_it
@datascienceiot
@pythonlbooks
@golang_books
@frontendbooksit
@progersit
@linux_read
@java_library
@frontendbooksit

🖥 Github
@github_code
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Shapash

Shapash делает модели машинного обучения прозрачными и понятными каждому. Инструмент предоставляет несколько видов визуализации, которые отображают явные метки, понятные каждому.

🔩 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍102🔥2
⭐️ 8 паттернов проектирования, которые должен знать каждый ML-разработчик

Паттерны проектирования предлагают комплексные решения проблем, с которыми разработчики сталкиваются каждый день. В этой статье мы рассмотрим 8 паттернов проектирования с примерами кода на Python.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101🔥1
📓 Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка

Технологии анализа текстовой информации стремительно меняются под влиянием машинного обучения. Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения.
Нейронные сети способны решать самые сложные задачи обработки естественного языка, никого не удивляет машинный перевод, «беседа» с роботом в интернет-магазине, перефразирование, ответы на вопросы и поддержание диалога.

➡️ Книга

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥5🥰2
⭐️ Как помочь pandas в обработке больших объёмов данных? От Pandas к Dask

Библиотека pandas — это один из лучших инструментов для разведочного анализа данных. Но это не означает, что pandas — это универсальное средство, подходящее для решения любых задач. В частности, речь идёт об обработке больших объемов данных. Мне довелось провести очень и очень много времени, ожидая, пока pandas прочтёт множество файлов, или обработает их, вычислив на основе находящихся в них сведений какие-то интересующие меня показатели. Дело в том, что pandas не поддерживает механизмы параллельной обработки данных. В результате этому пакету не удаётся на полную мощность воспользоваться возможностями современных многоядерных процессоров. Большие наборы данных в pandas обрабатываются медленно.

Читать дальше
🗒 Dask документация

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101🔥1
⭐️ atoti

atoti — это бесплатная аналитическая платформа Python BI для количественных расчетов и аналитики данных. Полезный инструмент для специалистов по данным и бизнес-пользователей, который позволяет быстрее анализировать и преобразовывать нееобходимые данные .

> pip install atoti[jupyterlab]

➡️ Github
🗒 Инструкция
➡️ Видео

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
🔥 Более 100 бесплатных курсов и ресурсов по аналитике

Большая подборка для аналитиков данных, продуктовых аналитиков, веб аналитиков, маркетинговых аналитиков и особенно тех, кто хочет ими стать!

Все материалы бесплатны!

Подборка составлена по областям знаний, которые нужны аналитику, чтобы быть востребованным на рынке.

Обязательно сохраняйте и пересылайте друзьям!

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥1
🔘 Как решить судоку при помощи компьютерного зрения

Судоку – это игра, в которой игровое поле представляет собой квадрат размером 9×9, разделённый на меньшие квадраты со стороной в 3 клетки. Таким образом, всё игровое поле состоит из 81 клетки. В них уже в начале игры стоят некоторые числа (от 1 до 9), называемые подсказками. От игрока требуется заполнить свободные клетки цифрами от 1 до 9 так, чтобы в каждой строке, в каждом столбце и в каждом малом квадрате 3×3 каждая цифра встречалась бы только один раз.

➡️ Читать дальше
🖥 Код из статьи

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🔥2