Путь к обучению, чтобы стать специалистом по данным Стать профессиональным специалистом по обработке данных может быть не так просто, как «1 ... 2 ... 3 ...», но эти 10 шагов могут стать вашей самообучающейся дорожной картой, чтобы дать толчок вашему будущему в захватывающей и постоянно расширяющейся области наука о данных. https://clck.ru/VxyQq
KDnuggets
A Learning Path To Becoming a Data Scientist - KDnuggets
Becoming a professional data scientist may not be as easy as "1... 2... 3...", but these 10 steps can be your self-learning roadmap to kickstarting your future in the exciting and ever-expanding field of data science.
11 классических методов прогнозирования временных рядов в Python (шпаргалка) https://clck.ru/VzmKg
Machine Learning Mastery
11 Classical Time Series Forecasting Methods in Python (Cheat Sheet) - Machine Learning Mastery
Machine learning methods can be used for classification and forecasting on time series problems.
Before exploring machine learning methods for time series, it is a good idea to ensure you have exhausted classical linear time series forecasting methods.…
Before exploring machine learning methods for time series, it is a good idea to ensure you have exhausted classical linear time series forecasting methods.…
Как изучить машинное обучение - советы и ресурсы для практического изучения машинного обучения В наши дни многие люди хотят изучать машинное обучение. Но устрашающая учебная программа, предлагаемая большинством преподавателей машинного обучения, отпугивает многих новичков.
В этом уроке я переворачиваю учебный план с ног на голову и обрисовываю, что я считаю самым быстрым и простым способом получить твердое представление о машинном обучении. https://clck.ru/VzbDp
В этом уроке я переворачиваю учебный план с ног на голову и обрисовываю, что я считаю самым быстрым и простым способом получить твердое представление о машинном обучении. https://clck.ru/VzbDp
freeCodeCamp.org
How to Learn Machine Learning – Tips and Resources to Learn ML the Practical Way
A lot of people want to learn machine learning these days. But the daunting bottom-up curriculum that most ML teachers propose is enough discourage a lot of newcomers. In this tutorial I flip the curriculum upside down and will outline what I think is the…
Легкое введение в наклоны и касательные В этом уроке вы узнаете, каков наклон линии и какова касательная к кривой. https://clck.ru/VzmQw 7 библиотек с открытым исходным кодом для графов глубокого обучения В этой статье мы познакомимся с графами глубокого обучения и рассмотрим 7 перспективных библиотек с открытым исходным кодом для глубокого обучения графов, ранжированных в порядке возрастания их популярности. https://clck.ru/W2reb Реконструкция изображения лица с помощью автоэнкодеров в Керасе Полное руководство по восстановлению зашумленных изображений с помощью автоэнкодеров https://clck.ru/W33Cm
Machine Learning Mastery
A Gentle Introduction to Slopes and Tangents - Machine Learning Mastery
The slope of a line, and its relationship to the tangent line of a curve is a fundamental concept in calculus. It is important for a general understanding of function derivatives.
In this tutorial, you will discover what is the slope of a line and what…
In this tutorial, you will discover what is the slope of a line and what…
Рабочий процесс машинного обучения с использованием MLFLOW - руководство для начинающих Цель этой статьи состоит в том, чтобы познакомить читателя с mlflow и заложить основу для его использования. Что такое mlflow?
MLflow - это платформа с открытым исходным кодом для управления непрерывным жизненным циклом машинного обучения. Проще говоря, mlflow помогает отслеживать сотни моделей, контейнерных сред, наборов данных, параметров моделей и гиперпараметров и воспроизводить их при необходимости. https://clck.ru/W4QtD Интуитивно понятное и простое руководство по наборам Python - необходимо, чтобы стать профессионалом в области науки о данных.
https://clck.ru/W5i2Q
MLflow - это платформа с открытым исходным кодом для управления непрерывным жизненным циклом машинного обучения. Проще говоря, mlflow помогает отслеживать сотни моделей, контейнерных сред, наборов данных, параметров моделей и гиперпараметров и воспроизводить их при необходимости. https://clck.ru/W4QtD Интуитивно понятное и простое руководство по наборам Python - необходимо, чтобы стать профессионалом в области науки о данных.
https://clck.ru/W5i2Q
Analytics Vidhya
Machine Learning Workflow Using MLFLOW -A Beginners Guide - Analytics Vidhya
MLflow is an open-source platform for managing the end-to-end machine learning workflow. let's see how to use mlflow to build ml pipeline.
Разница между алгоритмом и искусственным интеллектом Слова «искусственный интеллект» (ИИ) и алгоритмы чаще всего используются неправильно. Часто используются как взаимозаменяемые, хотя и не должны. Это приводит к ненужной путанице. В этой статье давайте разберемся, что такое ИИ и алгоритмы, и в чем их разница. https://clck.ru/W73Ny Как отличить себя от сотен других кандидатов в области науки о данных? Несколько простых (и не очень простых) способов доказать работодателям, что ваши навыки и отношение ставят вас в более высокую категорию. https://clck.ru/W7cxn
Datasciencecentral
Difference Between Algorithm and Artificial Intelligence
By 2035 AI could boost average profitability rates by 38 percent and lead to an economic increase of $14 Trillion.
Accenture
The words Artificial Intellige…
Accenture
The words Artificial Intellige…
This media is not supported in your browser
VIEW IN TELEGRAM
5 лучших книг по машинному обучению для начинающих Чтение книг важно, потому что оно дает бесконечные знания. Если вы планируете стать специалистом по анализу данных или инженером по машинному обучению, чтение книг по машинному обучению поможет вам получить знания и навыки, необходимые в этой области. https://clck.ru/W7dhJ
Выбор функций для машинного обучения Желательно уменьшить количество входных переменных как для уменьшения вычислительных затрат на моделирование, так и, в некоторых случаях, для повышения производительности модели. https://clck.ru/W8iP8
Machine Learning Mastery
How to Choose a Feature Selection Method For Machine Learning - Machine Learning Mastery
Feature selection is the process of reducing the number of input variables when developing a predictive model.
It is desirable to reduce the number of input variables to both reduce the computational cost of modeling and, in some cases, to improve the…
It is desirable to reduce the number of input variables to both reduce the computational cost of modeling and, in some cases, to improve the…
Распознавание речевых эмоций с помощью сверточных нейронных сетей Изучение человеческих эмоций всегда было увлекательным занятием для dаtа sсientists. В последнее время я работаю над экспериментальным проектом «Знание эмоций» (SER), чтобы изучить его потенциальные возможности. https://clck.ru/W9F6d Генераторы и итераторы Python за 2 минуты для новичков в области науки о данных Мы продолжаем нашу серию « Python: понимание за 2 минуты », в которой мы рассмотрим темы среднего уровня, которые также часто задают в собеседованиях по Python и Data Science. В прошлый раз мы говорили о важной теме под названием * args и ** kwargs за 2 минуты . Эта серия предназначена для начинающих специалистов по обработке данных, которые хотят сделать «следующий шаг» в Python после изучения основ. Сегодня мы продолжим обсуждение еще одной важной темой под названием «Генератор и итератор». https://clck.ru/WARmT
Analytics Vidhya
Speech Emotions Recognition with Convolutional Neural Networks -
In this article, we are going to explain a project on how to perform speech emotions recognition using convolutional neural network.
Объяснение искусственного интеллекта и машинного обучения Искусственный интеллект - это быстро меняющаяся область, и уследить за терминами и сокращениями может быть непросто. Эта страница с объяснениями искусственного интеллекта и машинного обучения - ваш начальный путеводитель по новейшему жаргону. https://clck.ru/WASpP
Unity
AI explained | Machine learning explained | Glossary
This artificial intelligence (AI) and machine learning explainer page is your starter guide to the latest lingo.
Инструменты для анализа данных: понимание мультивселенной В мультивселенной науки о данных возможности инструментов продолжают расширяться и развиваться. Хотя, безусловно, есть инженеры и ученые, которые могут закрепиться в том или ином лагере (например, лагерь R против Python или SAS против MATLAB), наблюдается растущая тенденция к распространению инструментов науки о данных. https://clck.ru/WBkNg
Dominodatalab
Data Science Tools: Understanding the Multiverse
Data scientists have a wide array of data science tools to choose from to do their jobs, both open source and proprietary, as well as gui based or code based. Organizations should choose tools that ca
23 лучших общедоступных набора данных для практики машинного обучения https://clck.ru/WF9Fk Как выбрать функции потерь при обучении нейронных сетей с глубоким обучением https://clck.ru/WF9KW Глубокое понимание дискриминативных и генеративных моделей в машинном обучении https://clck.ru/WFJY6 Пошаговое руководство по классификации изображений в пользовательских наборах данных https://clck.ru/WFJg2
Rubik's Code
Top 23 Best Public Datasets for Practicing Machine Learning
Find out which public real-world datasets are best for practicing applied machine learning, deep learning and data science.
Поиск лучшего языка программирования для науки о данных
Язык программирования - это практически основа науки о данных, и в связи с развитием современных технологий у нас есть много доступных языков. Но вопрос в том, какой из них больше всего подходит для специалиста по данным. В настоящее время группа языков программирования, которые используют специалисты по данным, - это Python, Julia и R. Все эти языки имеют свои уникальные особенности, а также области знаний. Например, экосистема Python загружена библиотеками, инструментами и приложениями, которые делают работу по научным вычислениям и анализу данных быстрой и удобной, но Джулия стремится дать ученым и аналитикам данных не только быструю и удобную разработку, но и невероятную скорость выполнения. С другой стороны, язык R, как никакой другой, увеличивает скорость статистических вычислений.
Преимущества Python
Выпущенный в 1991 году Python - это язык программирования, который используется для веб-разработки, разработки программного обеспечения, математики и систематического написания сценариев. В Python доступ к первому элементу массива осуществляется с помощью нуля, например string [0] в Python для первого символа в строке. Это помогает в использовании более широкой аудиторией с укоренившимися навыками программирования. У Python более быстрый запуск, что позволяет ему опережать Джулию и Р. Помимо улучшений интерпретатора Python (включая улучшения многоядерной и параллельной обработки), Python стало легче ускорять. Проект mypyc переводит Python с аннотациями типов на родной C, гораздо менее громоздко, чем Cython.
Преимущества Julia
Julia, впервые появившаяся в 2012 году, представляет собой высокоуровневый высокопроизводительный динамический язык программирования. Хотя это язык общего назначения и может использоваться для написания любых приложений, многие из его функций хорошо подходят для численного анализа и вычислений. JIT-компиляция и объявления типов Джулии означают, что она может на порядки превзойти «чистый» неоптимизированный Python. Python можно сделать быстрее с помощью внешних библиотек, сторонних JIT-компиляторов (PyPy) и оптимизации с помощью таких инструментов, как Cython, но Julia спроектирована так, чтобы быть быстрее сразу. Основная целевая аудитория Джулии - пользователи языков и сред для научных вычислений, таких как Matlab, R, Mathematica и Octave. Синтаксис Джулии для математических операций больше похож на способ написания математических формул за пределами компьютерного мира, что упрощает понимание непрограммистами. Flux - это библиотека машинного обучения для Джулии, в которой есть множество существующих шаблонов моделей для распространенных случаев использования. Поскольку он полностью написан на Julia, он может быть изменен по мере необходимости пользователем, и он использует встроенную JIT-компиляцию Julia для оптимизации проектов изнутри.
Преимущества R
Впервые выпущенный в 1993 году, R - это язык программирования и бесплатная программная среда для статистических вычислений и графики, поддерживаемая R Core Team и R Foundation for Statistical Computing. Язык R широко используется статистиками и специалистами по добыче данных для разработки статистического программного обеспечения и анализа данных. R доступен по лицензии с открытым исходным кодом, что означает, что любой может загрузить и изменить код. Эту свободу часто называют «свободой слова». R также доступен бесплатно. Кто угодно может получить доступ к исходному коду, изменить его и улучшить. В результате многие отличные программисты внесли улучшения и исправления в код R. По этой причине R очень стабилен и надежен. R выполняет широкий спектр функций, таких как обработка данных, статистическое моделирование и графика. Одно действительно большое преимущество R, однако это его расширяемость. Разработчики могут легко писать свое программное обеспечение и распространять его в виде дополнительных пакетов.
Язык программирования - это практически основа науки о данных, и в связи с развитием современных технологий у нас есть много доступных языков. Но вопрос в том, какой из них больше всего подходит для специалиста по данным. В настоящее время группа языков программирования, которые используют специалисты по данным, - это Python, Julia и R. Все эти языки имеют свои уникальные особенности, а также области знаний. Например, экосистема Python загружена библиотеками, инструментами и приложениями, которые делают работу по научным вычислениям и анализу данных быстрой и удобной, но Джулия стремится дать ученым и аналитикам данных не только быструю и удобную разработку, но и невероятную скорость выполнения. С другой стороны, язык R, как никакой другой, увеличивает скорость статистических вычислений.
Преимущества Python
Выпущенный в 1991 году Python - это язык программирования, который используется для веб-разработки, разработки программного обеспечения, математики и систематического написания сценариев. В Python доступ к первому элементу массива осуществляется с помощью нуля, например string [0] в Python для первого символа в строке. Это помогает в использовании более широкой аудиторией с укоренившимися навыками программирования. У Python более быстрый запуск, что позволяет ему опережать Джулию и Р. Помимо улучшений интерпретатора Python (включая улучшения многоядерной и параллельной обработки), Python стало легче ускорять. Проект mypyc переводит Python с аннотациями типов на родной C, гораздо менее громоздко, чем Cython.
Преимущества Julia
Julia, впервые появившаяся в 2012 году, представляет собой высокоуровневый высокопроизводительный динамический язык программирования. Хотя это язык общего назначения и может использоваться для написания любых приложений, многие из его функций хорошо подходят для численного анализа и вычислений. JIT-компиляция и объявления типов Джулии означают, что она может на порядки превзойти «чистый» неоптимизированный Python. Python можно сделать быстрее с помощью внешних библиотек, сторонних JIT-компиляторов (PyPy) и оптимизации с помощью таких инструментов, как Cython, но Julia спроектирована так, чтобы быть быстрее сразу. Основная целевая аудитория Джулии - пользователи языков и сред для научных вычислений, таких как Matlab, R, Mathematica и Octave. Синтаксис Джулии для математических операций больше похож на способ написания математических формул за пределами компьютерного мира, что упрощает понимание непрограммистами. Flux - это библиотека машинного обучения для Джулии, в которой есть множество существующих шаблонов моделей для распространенных случаев использования. Поскольку он полностью написан на Julia, он может быть изменен по мере необходимости пользователем, и он использует встроенную JIT-компиляцию Julia для оптимизации проектов изнутри.
Преимущества R
Впервые выпущенный в 1993 году, R - это язык программирования и бесплатная программная среда для статистических вычислений и графики, поддерживаемая R Core Team и R Foundation for Statistical Computing. Язык R широко используется статистиками и специалистами по добыче данных для разработки статистического программного обеспечения и анализа данных. R доступен по лицензии с открытым исходным кодом, что означает, что любой может загрузить и изменить код. Эту свободу часто называют «свободой слова». R также доступен бесплатно. Кто угодно может получить доступ к исходному коду, изменить его и улучшить. В результате многие отличные программисты внесли улучшения и исправления в код R. По этой причине R очень стабилен и надежен. R выполняет широкий спектр функций, таких как обработка данных, статистическое моделирование и графика. Одно действительно большое преимущество R, однако это его расширяемость. Разработчики могут легко писать свое программное обеспечение и распространять его в виде дополнительных пакетов.
6 классных библиотек Python для машинного обучения Python - неотъемлемая часть машинного обучения, а библиотеки упрощают нашу жизнь. Недавно я наткнулся на 6 замечательных библиотек, работая над своими проектами машинного обучения. Они помогли мне сэкономить много времени, и я собираюсь обсудить их в этом блоге.
https://clck.ru/WKVwE
https://clck.ru/WKVwE
Medium
6 Cool Python Libraries That I Came Across Recently
Awesome Python libraries for Machine Learning
Руководство по нейронным сетям для новичков (Часть-1) Это первая из трех статей в серии, в которой объясняются некоторые из основных теорий, которые вы должны знать при реализации нейронной сети. В следующих блогах вы узнаете, как применить изученную теорию для кодирования вашей пользовательской модели нейронной сети. Было приложено максимум усилий, чтобы сделать эту статью интерактивной и простой, чтобы ее мог понять каждый. Надеюсь, вам это понравится. Удачного обучения !! https://clck.ru/WM7a3 ColabCode: развертывание моделей машинного обучения из Google Colab Впервые в ColabCode? Узнайте, как использовать его для запуска VS Code Server, Jupyter Lab или FastAPI. Google colab - самая удобная онлайн-среда IDE для энтузиастов Python и Data Science. Выпущенный в 2017 году для широкой публики, изначально это был внутренний проект, используемый исследовательской группой Google для совместной работы над различными проектами искусственного интеллекта. https://clck.ru/WMRJK
Analytics Vidhya
Neural Networks | Beginner's Guide to Neural Networks (Part 1)
Neural networks has become a buzzword these days because of their ability to do an amazing amount of work in various domains.
17 статистических проверок гипотез на Python (шпаргалка) Краткое справочное руководство по 17 тестам статистических гипотез, которые вам нужны в
прикладном машинном обучении, с примером кода на Python. https://clck.ru/WPErn
прикладном машинном обучении, с примером кода на Python. https://clck.ru/WPErn
Mava: масштабируемая исследовательская платформа для многоагентного обучения
Платформа интегрируется с популярными средами MARL, такими как PettingZoo, SMAC, RoboCup, OpenSpiel, Flatland, а также с несколькими пользовательскими средами.
Mava включает распределенные реализации мультиагентных версий ddpg, d4pg, dqn, ppo, а также DIAL, VDN и QMIX.
ArXiV: https://arxiv.org/pdf/2107.01460.pdf
GitHub: https://github.com/instadeepai/Mava
Платформа интегрируется с популярными средами MARL, такими как PettingZoo, SMAC, RoboCup, OpenSpiel, Flatland, а также с несколькими пользовательскими средами.
Mava включает распределенные реализации мультиагентных версий ddpg, d4pg, dqn, ppo, а также DIAL, VDN и QMIX.
ArXiV: https://arxiv.org/pdf/2107.01460.pdf
GitHub: https://github.com/instadeepai/Mava
GitHub
GitHub - instadeepai/Mava: 🦁 A research-friendly codebase for fast experimentation of multi-agent reinforcement learning in JAX
🦁 A research-friendly codebase for fast experimentation of multi-agent reinforcement learning in JAX - instadeepai/Mava
Прогноз цен на автомобили - машинное обучение против глубокого обучения. В этой статье мы будем прогнозировать цены на подержанные автомобили. Мы будем создавать различные модели машинного обучения и модели глубокого обучения с разными архитектурами. В конце мы увидим, как модели машинного обучения работают по сравнению с моделями глубокого обучения.
https://clck.ru/WS6o6 Проверка гипотез стала проще для новичков в области науки о данных!. В этой статье мы будем изучать теорию, типы проверки гипотез. И мы возьмем примерные постановки задач и решим их с помощью проверки гипотез.
https://clck.ru/WS6oA
Не только для глубокого обучения: как графические процессоры ускоряют науку о данных и аналитику данных. Успех современных систем искусственного интеллекта / машинного обучения в значительной степени зависел от их способности обрабатывать огромные объемы необработанных данных параллельно с использованием оптимизированного для задач оборудования. Можем ли мы использовать возможности графического процессора и распределенных вычислений для регулярной обработки данных?
https://clck.ru/WS6pb
5 ошибок, которых я хотел бы избежать в моей карьере в области науки о данных. Каждый совершает ошибки, и это может быть хорошо, если со временем они приводят к обучению и совершенствованию. Но мы также можем сначала попытаться поучиться у других, чтобы ускорить наш личностный рост. Для начала рассмотрите эти уроки, усвоенные на собственном горьком опыте, чтобы вам не приходилось делать это.
https://clck.ru/WS6pd
https://clck.ru/WS6o6 Проверка гипотез стала проще для новичков в области науки о данных!. В этой статье мы будем изучать теорию, типы проверки гипотез. И мы возьмем примерные постановки задач и решим их с помощью проверки гипотез.
https://clck.ru/WS6oA
Не только для глубокого обучения: как графические процессоры ускоряют науку о данных и аналитику данных. Успех современных систем искусственного интеллекта / машинного обучения в значительной степени зависел от их способности обрабатывать огромные объемы необработанных данных параллельно с использованием оптимизированного для задач оборудования. Можем ли мы использовать возможности графического процессора и распределенных вычислений для регулярной обработки данных?
https://clck.ru/WS6pb
5 ошибок, которых я хотел бы избежать в моей карьере в области науки о данных. Каждый совершает ошибки, и это может быть хорошо, если со временем они приводят к обучению и совершенствованию. Но мы также можем сначала попытаться поучиться у других, чтобы ускорить наш личностный рост. Для начала рассмотрите эти уроки, усвоенные на собственном горьком опыте, чтобы вам не приходилось делать это.
https://clck.ru/WS6pd
Analytics Vidhya
Car Price Prediction - Machine Learning vs Deep Learning
In this article, we will perform car price prediction. For that we will build various ML and DL models with different architectures.
Мягкое введение в процедуру градиентного спуска Процедура градиентного спуска - метод, который имеет первостепенное значение в машинном обучении. Он также используется при обучении нейронных сетей и архитектур глубокого обучения. https://clck.ru/WUCaW Основные тенденции развития науки о данных в 2021 году https://clck.ru/WUCfF
Machine Learning Mastery
A Gentle Introduction To Gradient Descent Procedure - Machine Learning Mastery
Gradient descent procedure is a method that holds paramount importance in machine learning. It is often used for minimizing error functions in classification and regression problems. It is also used in training neural networks, and deep learning architectures.…
Создание системы рекомендаций рецептов
Использование Word2Vec, Scikit-Learn и Streamlit В предыдущем сообщении блога ( Создание API рекомендаций рецептов с использованием Scikit-Learn, N LTK, Docker, Flask и Heroku ) я писал о том, как я приступил к созданию системы рекомендаций рецептов. Подводя итог: сначала я очистил и проанализировал ингредиенты для каждого рецепта, затем я закодировал список ингредиентов каждого рецепта с помощью TF-IDF. Отсюда я применил функцию подобия, чтобы найти сходство между ингредиентами для известных рецептов и ингредиентами, указанными конечным пользователем. Наконец, мы можем получить самые рекомендуемые рецепты в соответствии с оценкой сходства. https://clck.ru/WVDCc Все о машинном обучении с открытым исходным кодом
Концепции машинного обучения с открытым исходным кодом Этот проект был создан для тех, кто интересуется машинным обучением. Он содержит объяснения общих концепций машинного обучения, таких как контролируемое обучение, неконтролируемое обучение, обучение с подкреплением, временные ряды, компьютерное зрение, НЛП и т. Д. https://clck.ru/WVDHm Определение возраста и пола с помощью глубокого обучения Основная цель этой статьи - определить возраст и пол по заданному набору данных. Мы будем использовать простые методы Python и Keras для определения возраста и пола. https://clck.ru/WVDRF
Использование Word2Vec, Scikit-Learn и Streamlit В предыдущем сообщении блога ( Создание API рекомендаций рецептов с использованием Scikit-Learn, N LTK, Docker, Flask и Heroku ) я писал о том, как я приступил к созданию системы рекомендаций рецептов. Подводя итог: сначала я очистил и проанализировал ингредиенты для каждого рецепта, затем я закодировал список ингредиентов каждого рецепта с помощью TF-IDF. Отсюда я применил функцию подобия, чтобы найти сходство между ингредиентами для известных рецептов и ингредиентами, указанными конечным пользователем. Наконец, мы можем получить самые рекомендуемые рецепты в соответствии с оценкой сходства. https://clck.ru/WVDCc Все о машинном обучении с открытым исходным кодом
Концепции машинного обучения с открытым исходным кодом Этот проект был создан для тех, кто интересуется машинным обучением. Он содержит объяснения общих концепций машинного обучения, таких как контролируемое обучение, неконтролируемое обучение, обучение с подкреплением, временные ряды, компьютерное зрение, НЛП и т. Д. https://clck.ru/WVDHm Определение возраста и пола с помощью глубокого обучения Основная цель этой статьи - определить возраст и пол по заданному набору данных. Мы будем использовать простые методы Python и Keras для определения возраста и пола. https://clck.ru/WVDRF
Medium
Building a Recipe Recommendation API using Scikit-Learn, NLTK, Docker, Flask, and Heroku
The journey to my first ‘full-stack’ data science project (part 2) — building and deployment