Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🖥 7 малоизвестных команд и приемов Git

Cегодня Git является стандартным инструментом для хранения кодовых баз ПО. Практически любая команда разработчиков использует инструменты и сервисы удаленного хостинга Git, поддерживающие разные способы работы с кодовыми базами. Одни программисты довольствуются лишь официальным интерфейсом Git CLI (Command-Line Interface). Другие дополнительно используют инструменты визуализации, такие как Gitk. Между тем есть разработчики, которые редко работают с CLI, но часто используют GUI, даже для staging и committing.

Git CLI предлагает комплексное решение для управления репозиториями Git через терминальные интерфейсы. Кроме того, множество сокращенных параметров командной строки позволяют максимизировать производительность.

Всем известны повседневно используемые команды Git для подготовки файлов (staging), фиксации состояния репозитария (committing), ветвления и слияния файлов, управления удаленными репозиториями. Несмотря на то, что интерфейс командной строки Git предоставляет множество опций и субкоманд, мы обычно пользуемся привычным набором. А ведь в Git есть еще и другие полезные скрытые возможности. Рассмотрим несколько таких команд и приемов.

↪️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥21
⚙️ Как визуализировать модели причинно-следственных связей с помощью интуитивно понятных таблиц условной вероятности

В этой статье мы рассмотрим, как создать интуитивно понятные и полные таблицы условной вероятности для визуализации и понимания моделей причинно-следственных связей в 1 строке кода Python.

К концу этой статьи вы сможете генерировать визуально богатые таблицы условной вероятности всего за одну строку Python, и у вас будет полный доступ к исходному коду и документации.

Причинно-следственный вывод является горячей темой на данный момент, но различные существующие библиотеки могут быть усложнены противоречивой документацией и примерами, и большинство доступных статей и сообщений сосредоточены на конкретном аспекте причинно-следственного вывода, не охватывая все, что нужно знать специалисту по данным.

↪️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101🔥1
🖥 Введение в алгоритмы машинного обучения: линейная регрессия

Данные и алгоритмы находятся в центре внимания специалиста по науке о данных. Понимание данных помогает ему принимать приоритетные решения, а понимание алгоритмов — моделировать данные в соответствии с точными расчетами. Линейная регрессия считается отправным пунктом, с которого новички в области науки о данных приступают к моделированию данных.

Цель этой статьи — дать представление об алгоритме линейной регрессии, его реализации на языке программирования Python и практическом применении. Для начала выясним, что такое алгоритм линейной регрессии.

➡️ Читать дальше
🔩 Код

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍111🔥1
🖥 Основы глубокого обучения. Создание алгоритмов для искусственного интеллекта следующего поколения

Авторы рассказывают о принципах решения задач в глубоком обучении и способах внедрения его алгоритмов.

📓 Книга

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
🕘 Модель Orbit для прогнозирования временных рядов

Временные ряды и бизнес
Большое количество современных данных имеют временную структуру. Такой структурой, например, обладают экономические и финансовые переменные (ВВП, инфляция, цены акций), продажи и другие. Многим компаниям необходимо планирование, поэтому прогнозирование с помощью моделей временных рядов является неотъемлемой частью анализа данных в бизнесе. Интерес к этой теме заметен и по количеству инструментов, которое выпускается компаниями. Модель Orbit, про которую я расскажу была создана в компании Uber, её предшественником был Prophet. Обе модели были выпущены в виде Python-библиотек для открытого использования.

➡️ Читать дальше
🔩 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥2
🖥 Погружаемся в графы. Изучаем применение графов в аналитике данных.

Графы — это способ аналитики данных, который был известен ещё с древних времён. С увеличением вычислительных мощностей процессоров и развитием компьютерных алгоритмов удалось приспособить их для решения современных сложных задач. Рассказываем о графовой аналитике, практических решениях и первых шагах для новичков.

Графы — одна из самых древних структур представления информации. Как только люди научились рисовать кружочки и проводить между ними линии, стало понятно, что таким образом можно представлять связи объектов друг с другом.

Графы позволяют находить взаимосвязи и предсказывать вероятные связи в сложных взаимосвязанных структурах. Например, в социальных сетях мы можем предположить, что Иван Иванович знаком с Иваном Васильевичем, потому что у них один и тот же круг общения. Графы помогают строить маршруты в навигаторах, а также выявлять фрод.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥21
🖥 Пишите эффективный код на Python: определение и измерение эффективности кода

В качестве специалиста по данным, вы должны тратить большую часть своего времени на получение информации из данных, не дожидаясь завершения работы вашего кода. Написание эффективного кода Python может помочь сократить время выполнения и сэкономить вычислительные ресурсы, что в конечном итоге освободит вас для выполнения более важных задач.

В этой статье мы обсудим, что такое эффективный код Python и как использовать различные встроенные структуры данных, функции и модули Python для написания более чистого, быстрого и эффективного кода. Мы рассмотрим, как рассчитать время и профилировать код, чтобы найти узкие места. Затем в следующей статье мы попрактикуемся в устранении этих узких мест и других плохих шаблонов проектирования, используя библиотеки Python, наиболее часто используемые специалистами по данным: NumPy и pandas.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥21
🖥 AWS Personalize для рекомендации новых фильмов пользователям на основе их оценок по сравнению с другими похожими фильмами.

Amazon Personalize позволяет разработчикам, не имеющим опыта машинного обучения, легко встраивать сложные возможности персонализации в свои приложения. С помощью Personalize вы предоставляете поток действий из своего приложения, а также список элементов, которые хотите порекомендовать, и Personalize обработает данные для обучения модели персонализации, настроенной для ваших данных.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
📚 Phenaki

Проект для генерации видео любой длины из текстовых описаний.

Проект: https://phenaki.video/index.html
Статья: https://openreview.net/forum?id=vOEXS39nOF

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥21
Как увеличить скорость Pandas и обрабатывать 10 млн необработанных наборов данных за миллисекунды

За последние годы использование Pandas выросло в бесчисленное количество раз. Покажу вам, как использовать Pandas максимально быстрым способом. Потому что вы не можете ускорить то, что и так быстро работает.

Было бы странным использовать функции, которые в документации Pandas четко указаны как медленные, а не как самые быстрые методы.

В этой статье покажем вам лучшие практики некоторых наиболее распространенных операций с данными в Pandas. Вы даже можете рассматривать эти рекомендации как «здравый смысл», потому что именно так создатель Pandas намеревался использовать свою библиотеку.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥2
🖥 Нейронные сети решают задачу массового обслуживания

Применение современного аппарата искусственных нейронных сетей в различных технических системах способствует повышению эффективности их функционирования. Рассмотрю это на примере организации движения транспортных средств. Была поставлена задача разработать интеллектуальную систему управления светофорами, которая позволит управлять транспортными потоками на основе данных о загрузке направлений перекрестка и дорог, выходящих с соседних перекрестков.

Для решения этой задачи используется алгоритм, который предполагает реализацию принципа декомпозиции выработки решений. Он считается общепринятым для сетевых адаптивных методов управления.

В основе декомпозиции управления лежит разбиение района города на взаимно пересекающиеся дороги.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥21🤔1
🖥 @github_code - лучшие проекты с Github теперь доступны в одном канале.

Проекты , которые реально помогут в разработке и помогут прокачать навыки программирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1
Media is too big
VIEW IN TELEGRAM
⭐️ Musika! Fast Infinite Waveform Music Generation

Моментальная генерация стереомузыки:
Техно, Метал, Лофи (пример в видео).

Возможность обучать Musika на своем собственном музыкальном наборе данных .

conda create -n musika python=3.9

🔩 GitHub
➡️ Попробовать
🚀 Demo

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
Perspective — API для модерации комментариев и обсуждений

Инструмент использует технологию машинного обучения для распознавания "токсичных" формулировок: оскорблений, угроз, домогательств. Набор триггеров выбирается самостоятельно. Каждый комментарий получает оценку по 100-балльной шкале, чем выше оценка — тем оскорбительнее комментарий. Это значительно упрощает модерацию — достаточно только отфильтровать обсценные высказывания и отклонить их. Со стороны пользователя предусмотрена сортировка по шкале оскорбительности, чтобы не сталкиваться с такими высказываниями. Инструмент также можно внедрить в поле написания комментария — тогда пользователь сразу будет знать оценку оскорбительности.

Доступно для русского, английского, китайского, французского, немецкого и других языков.

Стоимость: #бесплатно.

#API #веб

@machinelearning_ru
👍62🔥1
🖥 Зачем вам нужно использовать активное обучение при обучении нейронных сетей

Часто разметка данных оказывается самой серьёзной преградой для машинного обучения — сбор больших объёмов данных, их обработка и разметка для создания достаточно производительной модели могут занимать недели или даже месяцы. Активное обучение позволяет обучать модели машинного обучения на гораздо меньшем количестве размеченных данных. Лучшие компании в сфере ИИ, например, Tesla, уже используют активное обучение. Мы считаем, что и вам тоже оно необходимо.

В этом посте мы расскажем, что такое активное обучение, рассмотрим инструменты для его практического применения и продемонстрируем, как мы сами упрощаем внедрение активного обучения в процесс NLP.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🔥1
🖥 Большие данные: 70 невероятных бесплатных источников данных.

Вся отличная визуализация данных начинается с хороших, чистых данных. Большинство считают, что сбор больших данных будет трудной работой, но это неправда. На сайте доступны тысячи бесплатных наборов данных, готовых для анализа и просмотра любым пользователем.

Здесь мы собрали 70 источников свободных данных на правительство, преступности, здравоохранения, финансовых и экономических данных, маркетинга и социальных сетей, журналистики и средств массовой информации, недвижимости, каталог, обзор бизнеса и многое другое.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍31
🖥 EnCodec: высокоточное нейронное сжатие звука

pip install -U encodec # stable release
pip install -U git+https://git@github.com/facebookresearch/encodec#egg=encodec # bleeding edge
# of if you cloned the repo locally
pip install .


➡️ Github
📃 Статья
↪️ Образец

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21