📌 Шпаргалка по математической статистике (пригодится в машинном обучении)
✅ Основные определения и формулы
✅ Статистические тесты с примерами
✅ Теория вероятностей
✅ Таблицы критических значений
#cheatsheet
✅ Основные определения и формулы
✅ Статистические тесты с примерами
✅ Теория вероятностей
✅ Таблицы критических значений
#cheatsheet
👏13🔥4❤3👍2
При игре Wordle поиск правильных букв обычно определяется первыми словами. Чем эффективнее первое слово, тем больше подсказок мы можем получить, чтобы правильно написать букву. Обычно у каждого свои предпочтения.
Для тех из вас, кто не знает, Wordle - это ежедневная игра в слова, созданная Джошем Уордлом, в которой каждый день вам предстоит разгадывать новую словесную головоломку. Для получения дополнительной информации вы можете получить https://www.nytimes.com/games/wordle/index.html.
В этом посте я буду искать решение с использованием Python для получения наилучшего первого слова. Здесь буду использовать основные статистические методы, чтобы всем было легко их понять.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1🔥1
🔥 Внимание! — Сбер снова организовал AI Journey Contest!
👉 Это отличная возможность для увлекающихся технологиями искусственного интеллекта прокачать свои навыки, приобрести новый опыт и, конечно же, выиграть часть призового фонда, который составляет более 5 млн рублей.
Мы продлили прием решений до 13 ноября, но время ограничено!
Участникам предлагаются четыре интересные задачи: от прикладных, таких как идентификация бактерий по масс-спектрам или восстановление данных по вылову рыбы, до распознавания речи малых народов России и разработки единой multitask-модели, которая сможет решать сразу 12 задач в двух модальностях – визуальной и текстовой.
В этом году к проведению конкурса присоединился Институт искусственного интеллекта AIRI. Все задачи уже на платформе DS Works. Стань участником соревнования!
👉 Это отличная возможность для увлекающихся технологиями искусственного интеллекта прокачать свои навыки, приобрести новый опыт и, конечно же, выиграть часть призового фонда, который составляет более 5 млн рублей.
Мы продлили прием решений до 13 ноября, но время ограничено!
Участникам предлагаются четыре интересные задачи: от прикладных, таких как идентификация бактерий по масс-спектрам или восстановление данных по вылову рыбы, до распознавания речи малых народов России и разработки единой multitask-модели, которая сможет решать сразу 12 задач в двух модальностях – визуальной и текстовой.
В этом году к проведению конкурса присоединился Институт искусственного интеллекта AIRI. Все задачи уже на платформе DS Works. Стань участником соревнования!
👍5❤1🔥1
Доступно в общедоступной бета-версии. С сегодняшнего дня разработчики могут создавать приложения с помощью DALL·E API. Теперь появится много приложений на DALLE-2.
https://openai.com/blog/dall-e-api-now-available-in-public-beta/
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4🔥1
После загрузки статьи, выбираем необходимую часть для пояснения, далее алгоритм переводит научный текст в понятную и простую форму.
Попробовать можно здесь
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤1🔥1
📝 Статья
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥3👍2
В процессе написания научной работы, я столкнулся с такой проблемой, как относительно невысокая скорость выполнения вычислений. Из-за этого приходится тратить больше времени или жертвовать точностью вычислений, но что делать, если не хочется идти на компромисс и чем-то жертвовать? Воспользоваться новым фреймворком JAX от google. В связке с различными ускорителями, например, GPU (Graphics Processing Unit, или графический процессор) или TPU (Tensor Processing Unit, или тензорный процессор), он покажет достойный результат.
- Поговорим об этом по подробнее. Google JAX – фреймворк машинного обучения, разработанный командой исследователей компании Google, для высокопроизводительных вычислений и исследований. В его основе лежит два компонента:
- библиотека Autograd от PyTorch
компилятор XLA (Accelerated Linear Algebra, или ускоренная линейная алгебра) разработанный компанией TensorFlow
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3❤1😁1🤩1
EasyNMT – мини-библиотека для машинного перевода, которая использует несколько предобученных моделей
pip install -U easynmtПоддерживается более 150 языков, включая русский, также есть автодетекция языка
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🔥1
Рассмотрен полный каскад разработки моделей искусственного интеллекта. Проанализирована область Data Science, из которой выделены все необходимые для прикладной сферы алгоритмы машинного обучения, расположенные по уровню возрастания сложности работы с ними.
Для студентов, изучающих информационные технологии. Может быть полезно как начинающим программистам, так и специалистам высокого уровня.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥2
Среди методов машинного обучения — ассоциации, корреляции, классификации и кластеризации — акцент в этом руководстве сделан на обучении ассоциативным правилам, по которым выявляется набор элементов и атрибутов, встречающихся вместе в таблице.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥1🤔1
🖥 Сбер проводит ежегодное онлайн-соревнование по искусственному интеллекту — AI Journey Contest.
В этом году соревнование проводится совместно с Институтом искусственного интеллекта AIRI, а общий призовой фонд — более 5 млн рублей. Проверить себя и свои навыки (и еще неплохо на этом заработать в случае успеха) можно в четырех задачах.
Среди них есть создание алгоритма быстрой идентификации бактерий по масс-спектрам — AI4Biology, а также разработка алгоритма для восстановления данных по вылову рыбы на Дальнем Востоке — AI4Sea.
Решение нужно прислать до 13 ноября. Времени очень мало, так что желающим стоит поторопиться! Эти две задачи действительно можно решить за выходные. Все же любят неожиданные финалы, когда победитель решается в последний момент? Ворвись в лидерборды, где кто-то уже замер в ожидании победы 😈
Если тебе уже есть 18 лет — переходи по ссылке и вперед!
@machinelearning_ru
В этом году соревнование проводится совместно с Институтом искусственного интеллекта AIRI, а общий призовой фонд — более 5 млн рублей. Проверить себя и свои навыки (и еще неплохо на этом заработать в случае успеха) можно в четырех задачах.
Среди них есть создание алгоритма быстрой идентификации бактерий по масс-спектрам — AI4Biology, а также разработка алгоритма для восстановления данных по вылову рыбы на Дальнем Востоке — AI4Sea.
Решение нужно прислать до 13 ноября. Времени очень мало, так что желающим стоит поторопиться! Эти две задачи действительно можно решить за выходные. Все же любят неожиданные финалы, когда победитель решается в последний момент? Ворвись в лидерборды, где кто-то уже замер в ожидании победы 😈
Если тебе уже есть 18 лет — переходи по ссылке и вперед!
@machinelearning_ru
👍10👎2❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
HairCLIP: создайте прическу с помощью текста и эталонного изображения.
GitHub:
https://github.com/wty-ustc/HairCLIP
Web demo: https://huggingface.co/spaces/Gradio-Blocks/HairCLIP
@machinelearning_ru
GitHub:
https://github.com/wty-ustc/HairCLIP
Web demo: https://huggingface.co/spaces/Gradio-Blocks/HairCLIP
@machinelearning_ru
👍7❤1🔥1
Forwarded from Machine learning Interview
Время на выполнение 3-4 дня
Решение лучше кидайте в комменты в виде jupyter notebook’а.
Задание #1:
Таблица (task2.txt) содержит 11 столбцов чисел. Первые 10 столбцов - входные переменные (x_1 , …. , x_10), 11-й столбец - выходная прогнозируемая переменная y. Каждая строка в файле - это один обучающий пример для построения статистической модели для зависимости y = y(x_1,x_2,..,x_10). Конкретный вид связи между выходной и входными переменными не известен.
Требуется провести разведочный анализ данных, выбрать критерий для точности модели, и указать степень важности (информативности) каждой из 10 входных переменных с точки зрения точности модели. Что еще можно предложить чтобы улучшить получившийся результат?
Файл: tesk2.txt
Задание #2:
Нужно предложить и обосновать подход для группировки идентичных наименований товаров.
Пример входа:
[1] "Кисломолочный напиток Актимель ежевично-черничный 100 г"
[2] "Напиток Данон Актимель черника/ежевика 2,5% 6*0,1л Россия"
[3] "Гель для душа Роскошная мягкость Черная орхидея Palmolive, 250 мл". [4] "Гель Palmolive Naturals д/душа Роскошная мягкость Черная орхидея 250мл Италия"
[5] "Гель для душа Palmolive "Черная орхидея" 250 мл"
[6] "Корм Whiskas говядина/кролик канапе новогодний 85г Россия"
Пример выхода: [1 2] [3 4 5] 6 (см. вложенный файл).
Файл: test_task_NLP.json.
final_top.csv
Другие решения: Решение от одного из DS Accenture (для задания 1):
https://github.com/pdudukin/Regression-Guide/blob/master/Regression%20Guide.ipynbRegression%20Guide.ipynb
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥1👏1
Что такое скрытое распределение Дирихле (Latent Dirichlet Allocation)?
Скрытое распределение Дирихле (LDA) - популярная модель, когда речь идет об анализе больших объемов текста. Это генеративная вероятностная модель, которая позволяет пользователям обнаруживать скрытые («латентные») темы из коллекции документов. LDA моделирует каждый документ как созданный в процессе многократной выборки слов и тем из статистических распределений. Применяя умные алгоритмы, LDA может восстановить наиболее вероятные распределения, которые использовались в этом генеративном процессе (Blei, 2003). Эти дистрибутивы рассказывают нам кое-что о том, какие темы существуют и как они распределены между каждым документом.
➡️ Читать дальше
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥1
Thingsvision — это пакет Python, который позволяет легко извлекать изображений из множества современных нейронных сетей для задач компьютерного зрения.
$ pip install --upgrade thingsvision@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2❤1
Настройка нейронной сети с помощью keras python
Построение нейронной сети является актуальной темой в самых разных задачах — от классификации продуктов на категории до распознавания лиц на видео. Однако для получения качественного результата необходимо грамотно настроить ее параметры.
Сегодня я рассмотрю процесс построения нейронной сети и регулирования ее гиперпараметров с помощью keras python.
Анализ будет проведен на примере открытого датасета из kaggle “Otto group product classification challenge”. Количество строк в данном датасете составляет примерно 62 тысячи. Каждая строка соответствует одному продукту. Необходимо классифицировать продукты компании по 9-ти категориям, основываясь на 93 характеристиках. Каждая категория – это тип продукта, например, мода, электроника. Классы несбалансированы, что можно увидеть на графике.
➡️ Читать дальше
➡️ Датасет
@machinelearning_ru
Построение нейронной сети является актуальной темой в самых разных задачах — от классификации продуктов на категории до распознавания лиц на видео. Однако для получения качественного результата необходимо грамотно настроить ее параметры.
Сегодня я рассмотрю процесс построения нейронной сети и регулирования ее гиперпараметров с помощью keras python.
Анализ будет проведен на примере открытого датасета из kaggle “Otto group product classification challenge”. Количество строк в данном датасете составляет примерно 62 тысячи. Каждая строка соответствует одному продукту. Необходимо классифицировать продукты компании по 9-ти категориям, основываясь на 93 характеристиках. Каждая категория – это тип продукта, например, мода, электроника. Классы несбалансированы, что можно увидеть на графике.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3👎1🔥1