Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
📌 Шпаргалка по математической статистике (пригодится в машинном обучении)

Основные определения и формулы
Статистические тесты с примерами
Теория вероятностей
Таблицы критических значений

#cheatsheet
👏13🔥43👍2
🖥 Как найти лучшую комбинацию слов Wordle First с Python

При игре Wordle поиск правильных букв обычно определяется первыми словами. Чем эффективнее первое слово, тем больше подсказок мы можем получить, чтобы правильно написать букву. Обычно у каждого свои предпочтения.

Для тех из вас, кто не знает, Wordle - это ежедневная игра в слова, созданная Джошем Уордлом, в которой каждый день вам предстоит разгадывать новую словесную головоломку. Для получения дополнительной информации вы можете получить https://www.nytimes.com/games/wordle/index.html.

В этом посте я буду искать решение с использованием Python для получения наилучшего первого слова. Здесь буду использовать основные статистические методы, чтобы всем было легко их понять.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
🔥 Внимание! — Сбер снова организовал AI Journey Contest!
👉 Это отличная возможность для увлекающихся технологиями искусственного интеллекта прокачать свои навыки, приобрести новый опыт и, конечно же, выиграть часть призового фонда, который составляет более 5 млн рублей.

Мы продлили прием решений до 13 ноября, но время ограничено!

Участникам предлагаются четыре интересные задачи: от прикладных, таких как идентификация бактерий по масс-спектрам или восстановление данных по вылову рыбы, до распознавания речи малых народов России и разработки единой multitask-модели, которая сможет решать сразу 12 задач в двух модальностях – визуальной и текстовой.

В этом году к проведению конкурса присоединился Институт искусственного интеллекта AIRI. Все задачи уже на платформе DS Works. Стань участником соревнования!
👍51🔥1
👣 DALL·E API

Доступно в общедоступной бета-версии. С сегодняшнего дня разработчики могут создавать приложения с помощью DALL·E API. Теперь появится много приложений на DALLE-2.

https://openai.com/blog/dall-e-api-now-available-in-public-beta/

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4🔥1
⚡️ Explainapaper: ии толкователь научных статей

После загрузки статьи, выбираем необходимую часть для пояснения, далее алгоритм переводит научный текст в понятную и простую форму.

Попробовать можно здесь

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81🔥1
✔️ Stable Diffusion становится невероятно крутым! 🤯

➡️ Разбор статьи
📝 Статья
🖥Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥3👍2
➡️ Ускорение вычислений при помощи фреймворка машинного обучения JAX

В процессе написания научной работы, я столкнулся с такой проблемой, как относительно невысокая скорость выполнения вычислений. Из-за этого приходится тратить больше времени или жертвовать точностью вычислений, но что делать, если не хочется идти на компромисс и чем-то жертвовать? Воспользоваться новым фреймворком JAX от google. В связке с различными ускорителями, например, GPU (Graphics Processing Unit, или графический процессор) или TPU (Tensor Processing Unit, или тензорный процессор), он покажет достойный результат.

- Поговорим об этом по подробнее. Google JAX – фреймворк машинного обучения, разработанный командой исследователей компании Google, для высокопроизводительных вычислений и исследований. В его основе лежит два компонента:

- библиотека Autograd от PyTorch
компилятор XLA (Accelerated Linear Algebra, или ускоренная линейная алгебра) разработанный компанией TensorFlow

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥31😁1🤩1
EasyNMT

EasyNMT – мини-библиотека для машинного перевода, которая использует несколько предобученных моделей

pip install -U easynmt

Поддерживается более 150 языков, включая русский, также есть автодетекция языка

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥1
🖥 Алгоритмы Data Science и их практическая реализация на Python. 2022

Рассмотрен полный каскад разработки моделей искусственного интеллекта. Проанализирована область Data Science, из которой выделены все необходимые для прикладной сферы алгоритмы машинного обучения, расположенные по уровню возрастания сложности работы с ними.
Для студентов, изучающих информационные технологии. Может быть полезно как начинающим программистам, так и специалистам высокого уровня.

➡️ Книга

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥2
🖥 Простой способ решить алгоритм Apriori с нуля

Среди методов машинного обучения — ассоциации, корреляции, классификации и кластеризации — акцент в этом руководстве сделан на обучении ассоциативным правилам, по которым выявляется набор элементов и атрибутов, встречающихся вместе в таблице.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥1🤔1
🖥 Сбер проводит ежегодное онлайн-соревнование по искусственному интеллекту — AI Journey Contest.

В этом году соревнование проводится совместно с Институтом искусственного интеллекта AIRI, а общий призовой фонд — более 5 млн рублей. Проверить себя и свои навыки (и еще неплохо на этом заработать в случае успеха) можно в четырех задачах.

Среди них есть создание алгоритма быстрой идентификации бактерий по масс-спектрам — AI4Biology, а также разработка алгоритма для восстановления данных по вылову рыбы на Дальнем Востоке — AI4Sea.

Решение нужно прислать до 13 ноября. Времени очень мало, так что желающим стоит поторопиться! Эти две задачи действительно можно решить за выходные. Все же любят неожиданные финалы, когда победитель решается в последний момент? Ворвись в лидерборды, где кто-то уже замер в ожидании победы 😈
Если тебе уже есть 18 лет — переходи по ссылке и вперед!

@machinelearning_ru
👍10👎21🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
HairCLIP: создайте прическу с помощью текста и эталонного изображения.

GitHub:
https://github.com/wty-ustc/HairCLIP
Web demo: https://huggingface.co/spaces/Gradio-Blocks/HairCLIP

@machinelearning_ru
👍71🔥1
⭐️ Тестовое задание для DS в Accenture Moscow

Время на выполнение 3-4 дня
Решение лучше кидайте в комменты в виде jupyter notebook’а.

Задание #1:
Таблица (task2.txt) содержит 11 столбцов чисел. Первые 10 столбцов - входные переменные (x_1 , …. , x_10), 11-й столбец - выходная прогнозируемая переменная y. Каждая строка в файле - это один обучающий пример для построения статистической модели для зависимости y = y(x_1,x_2,..,x_10). Конкретный вид связи между выходной и входными переменными не известен.
Требуется провести разведочный анализ данных, выбрать критерий для точности модели, и указать степень важности (информативности) каждой из 10 входных переменных с точки зрения точности модели. Что еще можно предложить чтобы улучшить получившийся результат?
Файл: tesk2.txt

Задание #2:
Нужно предложить и обосновать подход для группировки идентичных наименований товаров.
Пример входа:
[1] "Кисломолочный напиток Актимель ежевично-черничный 100 г"
[2] "Напиток Данон Актимель черника/ежевика 2,5% 6*0,1л Россия"
[3] "Гель для душа Роскошная мягкость Черная орхидея Palmolive, 250 мл". [4] "Гель Palmolive Naturals д/душа Роскошная мягкость Черная орхидея 250мл Италия"
[5] "Гель для душа Palmolive "Черная орхидея" 250 мл"
[6] "Корм Whiskas говядина/кролик канапе новогодний 85г Россия"
Пример выхода: [1 2] [3 4 5] 6 (см. вложенный файл).
Файл: test_task_NLP.json.
final_top.csv

Решение
Решение 2

Другие решения: Решение от одного из DS Accenture (для задания 1):
https://github.com/pdudukin/Regression-Guide/blob/master/Regression%20Guide.ipynbRegression%20Guide.ipynb

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥1👏1
💨Тематическое моделирование с использованием LDA

Что такое скрытое распределение Дирихле (Latent Dirichlet Allocation)?

Скрытое распределение Дирихле (LDA) - популярная модель, когда речь идет об анализе больших объемов текста. Это генеративная вероятностная модель, которая позволяет пользователям обнаруживать скрытые («латентные») темы из коллекции документов. LDA моделирует каждый документ как созданный в процессе многократной выборки слов и тем из статистических распределений. Применяя умные алгоритмы, LDA может восстановить наиболее вероятные распределения, которые использовались в этом генеративном процессе (Blei, 2003). Эти дистрибутивы рассказывают нам кое-что о том, какие темы существуют и как они распределены между каждым документом.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
🖥 THINGSvision

Thingsvision — это пакет Python, который позволяет легко извлекать изображений из множества современных нейронных сетей для задач компьютерного зрения.

$ pip install --upgrade thingsvision



🖥 Github
🖥 Colab

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Настройка нейронной сети с помощью keras python

Построение нейронной сети является актуальной темой в самых разных задачах — от классификации продуктов на категории до распознавания лиц на видео. Однако для получения качественного результата необходимо грамотно настроить ее параметры.

Сегодня я рассмотрю процесс построения нейронной сети и регулирования ее гиперпараметров с помощью keras python.

Анализ будет проведен на примере открытого датасета из kaggle “Otto group product classification challenge”. Количество строк в данном датасете составляет примерно 62 тысячи. Каждая строка соответствует одному продукту. Необходимо классифицировать продукты компании по 9-ти категориям, основываясь на 93 характеристиках. Каждая категория – это тип продукта, например, мода, электроника. Классы несбалансированы, что можно увидеть на графике.

➡️ Читать дальше
➡️ Датасет

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73👎1🔥1