Big data world
2.31K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Python против R для науки о данных и машинного обучения Один вопрос, который возникает у каждого новичка в машинном обучении или науке о данных, - это выбор языка программирования. Python и R сейчас очень сильно влияют на индустрию. Хотя Python и R очень востребованы, с точки зрения человека один язык может быть более удобным, чем другой. Здесь мы кратко обсудим, как Python или R лучше подходят для конкретного случая использования и отдельного человека.

Сначала мы начнем с небольшого введения в Python и R. Затем мы обсудим некоторые сценарии и посмотрим, какой язык больше подходит. https://clck.ru/Vw8BW
Путь к обучению, чтобы стать специалистом по данным Стать профессиональным специалистом по обработке данных может быть не так просто, как «1 ... 2 ... 3 ...», но эти 10 шагов могут стать вашей самообучающейся дорожной картой, чтобы дать толчок вашему будущему в захватывающей и постоянно расширяющейся области наука о данных. https://clck.ru/VxyQq
Как изучить машинное обучение - советы и ресурсы для практического изучения машинного обучения В наши дни многие люди хотят изучать машинное обучение. Но устрашающая учебная программа, предлагаемая большинством преподавателей машинного обучения, отпугивает многих новичков.

В этом уроке я переворачиваю учебный план с ног на голову и обрисовываю, что я считаю самым быстрым и простым способом получить твердое представление о машинном обучении. https://clck.ru/VzbDp
Легкое введение в наклоны и касательные В этом уроке вы узнаете, каков наклон линии и какова касательная к кривой. https://clck.ru/VzmQw 7 библиотек с открытым исходным кодом для графов глубокого обучения В этой статье мы познакомимся с графами глубокого обучения и рассмотрим 7 перспективных библиотек с открытым исходным кодом для глубокого обучения графов, ранжированных в порядке возрастания их популярности. https://clck.ru/W2reb Реконструкция изображения лица с помощью автоэнкодеров в Керасе Полное руководство по восстановлению зашумленных изображений с помощью автоэнкодеров https://clck.ru/W33Cm
Рабочий процесс машинного обучения с использованием MLFLOW - руководство для начинающих Цель этой статьи состоит в том, чтобы познакомить читателя с mlflow и заложить основу для его использования. Что такое mlflow?
MLflow - это платформа с открытым исходным кодом для управления непрерывным жизненным циклом машинного обучения. Проще говоря, mlflow помогает отслеживать сотни моделей, контейнерных сред, наборов данных, параметров моделей и гиперпараметров и воспроизводить их при необходимости. https://clck.ru/W4QtD Интуитивно понятное и простое руководство по наборам Python - необходимо, чтобы стать профессионалом в области науки о данных.
https://clck.ru/W5i2Q
Разница между алгоритмом и искусственным интеллектом Слова «искусственный интеллект» (ИИ) и алгоритмы чаще всего используются неправильно. Часто используются как взаимозаменяемые, хотя и не должны. Это приводит к ненужной путанице. В этой статье давайте разберемся, что такое ИИ и алгоритмы, и в чем их разница. https://clck.ru/W73Ny Как отличить себя от сотен других кандидатов в области науки о данных? Несколько простых (и не очень простых) способов доказать работодателям, что ваши навыки и отношение ставят вас в более высокую категорию. https://clck.ru/W7cxn
This media is not supported in your browser
VIEW IN TELEGRAM
5 лучших книг по машинному обучению для начинающих Чтение книг важно, потому что оно дает бесконечные знания. Если вы планируете стать специалистом по анализу данных или инженером по машинному обучению, чтение книг по машинному обучению поможет вам получить знания и навыки, необходимые в этой области. https://clck.ru/W7dhJ
Выбор функций для машинного обучения Желательно уменьшить количество входных переменных как для уменьшения вычислительных затрат на моделирование, так и, в некоторых случаях, для повышения производительности модели. https://clck.ru/W8iP8
Распознавание речевых эмоций с помощью сверточных нейронных сетей Изучение человеческих эмоций всегда было увлекательным занятием для dаtа sсientists. В последнее время я работаю над экспериментальным проектом «Знание эмоций» (SER), чтобы изучить его потенциальные возможности. https://clck.ru/W9F6d Генераторы и итераторы Python за 2 минуты для новичков в области науки о данных Мы продолжаем нашу серию « Python: понимание за 2 минуты », в которой мы рассмотрим темы среднего уровня, которые также часто задают в собеседованиях по Python и Data Science. В прошлый раз мы говорили о важной теме под названием * args и ** kwargs за 2 минуты . Эта серия предназначена для начинающих специалистов по обработке данных, которые хотят сделать «следующий шаг» в Python после изучения основ. Сегодня мы продолжим обсуждение еще одной важной темой под названием «Генератор и итератор». https://clck.ru/WARmT
Объяснение искусственного интеллекта и машинного обучения Искусственный интеллект - это быстро меняющаяся область, и уследить за терминами и сокращениями может быть непросто. Эта страница с объяснениями искусственного интеллекта и машинного обучения - ваш начальный путеводитель по новейшему жаргону. https://clck.ru/WASpP
Инструменты для анализа данных: понимание мультивселенной В мультивселенной науки о данных возможности инструментов продолжают расширяться и развиваться. Хотя, безусловно, есть инженеры и ученые, которые могут закрепиться в том или ином лагере (например, лагерь R против Python или SAS против MATLAB), наблюдается растущая тенденция к распространению инструментов науки о данных. https://clck.ru/WBkNg
23 лучших общедоступных набора данных для практики машинного обучения https://clck.ru/WF9Fk Как выбрать функции потерь при обучении нейронных сетей с глубоким обучением https://clck.ru/WF9KW Глубокое понимание дискриминативных и генеративных моделей в машинном обучении https://clck.ru/WFJY6 Пошаговое руководство по классификации изображений в пользовательских наборах данных https://clck.ru/WFJg2
Поиск лучшего языка программирования для науки о данных
Язык программирования - это практически основа науки о данных, и в связи с развитием современных технологий у нас есть много доступных языков. Но вопрос в том, какой из них больше всего подходит для специалиста по данным. В настоящее время группа языков программирования, которые используют специалисты по данным, - это Python, Julia и R. Все эти языки имеют свои уникальные особенности, а также области знаний. Например, экосистема Python загружена библиотеками, инструментами и приложениями, которые делают работу по научным вычислениям и анализу данных быстрой и удобной, но Джулия стремится дать ученым и аналитикам данных не только быструю и удобную разработку, но и невероятную скорость выполнения. С другой стороны, язык R, как никакой другой, увеличивает скорость статистических вычислений.
Преимущества Python
Выпущенный в 1991 году Python - это язык программирования, который используется для веб-разработки, разработки программного обеспечения, математики и систематического написания сценариев. В Python доступ к первому элементу массива осуществляется с помощью нуля, например string [0] в Python для первого символа в строке. Это помогает в использовании более широкой аудиторией с укоренившимися навыками программирования. У Python более быстрый запуск, что позволяет ему опережать Джулию и Р. Помимо улучшений интерпретатора Python (включая улучшения многоядерной и параллельной обработки), Python стало легче ускорять. Проект mypyc переводит Python с аннотациями типов на родной C, гораздо менее громоздко, чем Cython.
Преимущества Julia
Julia, впервые появившаяся в 2012 году, представляет собой высокоуровневый высокопроизводительный динамический язык программирования. Хотя это язык общего назначения и может использоваться для написания любых приложений, многие из его функций хорошо подходят для численного анализа и вычислений. JIT-компиляция и объявления типов Джулии означают, что она может на порядки превзойти «чистый» неоптимизированный Python. Python можно сделать быстрее с помощью внешних библиотек, сторонних JIT-компиляторов (PyPy) и оптимизации с помощью таких инструментов, как Cython, но Julia спроектирована так, чтобы быть быстрее сразу. Основная целевая аудитория Джулии - пользователи языков и сред для научных вычислений, таких как Matlab, R, Mathematica и Octave. Синтаксис Джулии для математических операций больше похож на способ написания математических формул за пределами компьютерного мира, что упрощает понимание непрограммистами. Flux - это библиотека машинного обучения для Джулии, в которой есть множество существующих шаблонов моделей для распространенных случаев использования. Поскольку он полностью написан на Julia, он может быть изменен по мере необходимости пользователем, и он использует встроенную JIT-компиляцию Julia для оптимизации проектов изнутри.
Преимущества R
Впервые выпущенный в 1993 году, R - это язык программирования и бесплатная программная среда для статистических вычислений и графики, поддерживаемая R Core Team и R Foundation for Statistical Computing. Язык R широко используется статистиками и специалистами по добыче данных для разработки статистического программного обеспечения и анализа данных. R доступен по лицензии с открытым исходным кодом, что означает, что любой может загрузить и изменить код. Эту свободу часто называют «свободой слова». R также доступен бесплатно. Кто угодно может получить доступ к исходному коду, изменить его и улучшить. В результате многие отличные программисты внесли улучшения и исправления в код R. По этой причине R очень стабилен и надежен. R выполняет широкий спектр функций, таких как обработка данных, статистическое моделирование и графика. Одно действительно большое преимущество R, однако это его расширяемость. Разработчики могут легко писать свое программное обеспечение и распространять его в виде дополнительных пакетов.
6 классных библиотек Python для машинного обучения Python - неотъемлемая часть машинного обучения, а библиотеки упрощают нашу жизнь. Недавно я наткнулся на 6 замечательных библиотек, работая над своими проектами машинного обучения. Они помогли мне сэкономить много времени, и я собираюсь обсудить их в этом блоге.
https://clck.ru/WKVwE
Руководство по нейронным сетям для новичков (Часть-1) Это первая из трех статей в серии, в которой объясняются некоторые из основных теорий, которые вы должны знать при реализации нейронной сети. В следующих блогах вы узнаете, как применить изученную теорию для кодирования вашей пользовательской модели нейронной сети. Было приложено максимум усилий, чтобы сделать эту статью интерактивной и простой, чтобы ее мог понять каждый. Надеюсь, вам это понравится. Удачного обучения !! https://clck.ru/WM7a3 ColabCode: развертывание моделей машинного обучения из Google Colab Впервые в ColabCode? Узнайте, как использовать его для запуска VS Code Server, Jupyter Lab или FastAPI. Google colab - самая удобная онлайн-среда IDE для энтузиастов Python и Data Science. Выпущенный в 2017 году для широкой публики, изначально это был внутренний проект, используемый исследовательской группой Google для совместной работы над различными проектами искусственного интеллекта. https://clck.ru/WMRJK
17 статистических проверок гипотез на Python (шпаргалка) Краткое справочное руководство по 17 тестам статистических гипотез, которые вам нужны в
прикладном машинном обучении, с примером кода на Python. https://clck.ru/WPErn
Mava: масштабируемая исследовательская платформа для многоагентного обучения

Платформа интегрируется с популярными средами MARL, такими как PettingZoo, SMAC, RoboCup, OpenSpiel, Flatland, а также с несколькими пользовательскими средами.

Mava включает распределенные реализации мультиагентных версий ddpg, d4pg, dqn, ppo, а также DIAL, VDN и QMIX.
ArXiV: https://arxiv.org/pdf/2107.01460.pdf
GitHub: https://github.com/instadeepai/Mava
Прогноз цен на автомобили - машинное обучение против глубокого обучения. В этой статье мы будем прогнозировать цены на подержанные автомобили. Мы будем создавать различные модели машинного обучения и модели глубокого обучения с разными архитектурами. В конце мы увидим, как модели машинного обучения работают по сравнению с моделями глубокого обучения.
https://clck.ru/WS6o6 Проверка гипотез стала проще для новичков в области науки о данных!. В этой статье мы будем изучать теорию, типы проверки гипотез. И мы возьмем примерные постановки задач и решим их с помощью проверки гипотез.
https://clck.ru/WS6oA
Не только для глубокого обучения: как графические процессоры ускоряют науку о данных и аналитику данных. Успех современных систем искусственного интеллекта / машинного обучения в значительной степени зависел от их способности обрабатывать огромные объемы необработанных данных параллельно с использованием оптимизированного для задач оборудования. Можем ли мы использовать возможности графического процессора и распределенных вычислений для регулярной обработки данных?
https://clck.ru/WS6pb
5 ошибок, которых я хотел бы избежать в моей карьере в области науки о данных. Каждый совершает ошибки, и это может быть хорошо, если со временем они приводят к обучению и совершенствованию. Но мы также можем сначала попытаться поучиться у других, чтобы ускорить наш личностный рост. Для начала рассмотрите эти уроки, усвоенные на собственном горьком опыте, чтобы вам не приходилось делать это.
https://clck.ru/WS6pd
Мягкое введение в процедуру градиентного спуска Процедура градиентного спуска - метод, который имеет первостепенное значение в машинном обучении. Он также используется при обучении нейронных сетей и архитектур глубокого обучения. https://clck.ru/WUCaW Основные тенденции развития науки о данных в 2021 году https://clck.ru/WUCfF