🐼 Перевод советов по выбору столбцов в DataFrame с помощью iloc и filter (внутри Colab)
🐍Остальные переводы уроков по pandas по ссылке
🐍Остальные переводы уроков по pandas по ссылке
У меня две новости и обе хорошие 🥳
1) Добавил несколько кейсов и упражнений по Pandas и NumPy (можно прокачать скиллы по анализу товаров) по ссылке
2) Завершил перевод статьи "Типичные задачи Excel, продемонстрированные в pandas".
1) Добавил несколько кейсов и упражнений по Pandas и NumPy (можно прокачать скиллы по анализу товаров) по ссылке
2) Завершил перевод статьи "Типичные задачи Excel, продемонстрированные в pandas".
Продолжаем традицию еженедельных переводов и сегодня две статьи про особенности использования groupby в (🐼)
1) Объяснение функций Grouper и Agg в Pandas
2) Понимание функции transform в Pandas
Кейсы по анализу данных и переводы доступны по ссылке 🐍
1) Объяснение функций Grouper и Agg в Pandas
2) Понимание функции transform в Pandas
Кейсы по анализу данных и переводы доступны по ссылке 🐍
🎄Новогодние переводы о функциях Excel, выполненных в pandas 🐼:
👉 Типичные задачи Excel, продемонстрированные в pandas (часть 2)
👉 Excel функции Filter и Edit, продемонстрированные в Pandas
👉 Типичные задачи Excel, продемонстрированные в pandas (часть 2)
👉 Excel функции Filter и Edit, продемонстрированные в Pandas
Подготовил перевод двух интересных статей для любителей покопаться в pandas 🐼
👉 Объяснение кросс-таблицы (crosstab) в Pandas
👉 Разделение (биннинг, дискретизация, балансировка) данных с помощью qcut и cut в Pandas
👉 Объяснение кросс-таблицы (crosstab) в Pandas
👉 Разделение (биннинг, дискретизация, балансировка) данных с помощью qcut и cut в Pandas
По многочисленным просьбам подготовил переводы про визуализацию и обработку данных для ML 🐍
👉 Эффективное использование Matplotlib
👉 Руководство по кодированию категориальных значений в Python
Приятного чтения! 🐼
PS. остальные переводы и кейсы по ссылке ⚡️
👉 Эффективное использование Matplotlib
👉 Руководство по кодированию категориальных значений в Python
Приятного чтения! 🐼
PS. остальные переводы и кейсы по ссылке ⚡️
Разбираемся в прогнозировании поощрительных выплат с продаж с помощью моделирования Монте-Карло 🐼
Приятного чтения! 🐍
Приятного чтения! 🐍
Сегодня разбираемся, как работать с Altair, библиотекой декларативной статистической визуализации для Python 🐼
Завершил перевод вводной части, внутри Colab и упражнения! ✍️
Приятного чтения! 🐍
Завершил перевод вводной части, внутри Colab и упражнения! ✍️
Приятного чтения! 🐍
После matplotlib и seaborn для меня Altair стал открытием 🤯
У него другая логика работы и невероятная интерактивность на основе JavaScript 🥰
Рекомендую оценить примеры и упражнения из переведенных уроков:
👉 Введение в визуализацию данных с помощью Altair (часть 1)
👉 Визуализация данных с помощью Altair (часть 2)
👉 Визуализация данных с помощью Altair (часть 3)
Приятного чтения! 🐼
У него другая логика работы и невероятная интерактивность на основе JavaScript 🥰
Рекомендую оценить примеры и упражнения из переведенных уроков:
👉 Введение в визуализацию данных с помощью Altair (часть 1)
👉 Визуализация данных с помощью Altair (часть 2)
👉 Визуализация данных с помощью Altair (часть 3)
Приятного чтения! 🐼
При использовании pandas существует несколько методов очистки текстовых полей для подготовки к дальнейшему анализу.
В новой статье показаны примеры очистки текстовых полей в большом файле и даны советы по эффективной очистке неструктурированных текстовых полей с помощью Python и pandas 🐼
👉 Читать Эффективная очистка текста с помощью Pandas
👉 Запустить примеры в Colab, немного оптимизировал код для этой среды 😇
Приятного чтения! 🐍
В новой статье показаны примеры очистки текстовых полей в большом файле и даны советы по эффективной очистке неструктурированных текстовых полей с помощью Python и pandas 🐼
👉 Читать Эффективная очистка текста с помощью Pandas
👉 Запустить примеры в Colab, немного оптимизировал код для этой среды 😇
Приятного чтения! 🐍
По многочисленным просьбам подготовил перевод статьи про визуализацию в Plotly Express 🥳
👉 Взгляд на Plotly Express.
Приятного чтения! 🐼
👉 Взгляд на Plotly Express.
Приятного чтения! 🐼
Подготовил обзор двух полезных модулей 🐍
Pandas Profiling - это библиотека для генерации интерактивных отчетов (по ссылке пример отчета) на основе пользовательских данных: можем увидеть распределение данных, типы, возможные проблемы. Библиотека очень проста в использовании: можем создать отчет и отправить его кому угодно! 🐼
👉 Использование модуля Pandas Profiling для профилирования или в CoLab
Folium - это библиотека, которая позволяет рисовать карты, маркеры, а также отмечать собственные данные (по умолчанию в OpenStreetMap) 🗺
👉 Используем модуль folium для рисования карт или в CoLab
📚 Остальные переводы, обзоры и кейсы по анализу данных доступны по ссылке.
Pandas Profiling - это библиотека для генерации интерактивных отчетов (по ссылке пример отчета) на основе пользовательских данных: можем увидеть распределение данных, типы, возможные проблемы. Библиотека очень проста в использовании: можем создать отчет и отправить его кому угодно! 🐼
👉 Использование модуля Pandas Profiling для профилирования или в CoLab
Folium - это библиотека, которая позволяет рисовать карты, маркеры, а также отмечать собственные данные (по умолчанию в OpenStreetMap) 🗺
👉 Используем модуль folium для рисования карт или в CoLab
📚 Остальные переводы, обзоры и кейсы по анализу данных доступны по ссылке.
Подготовил обзор модуля pandera 🐍
Pandera - инструмент для проверки фреймов данных pandas, который предоставляет интуитивно понятный, гибкий и выразительный API 🐼
👉 Проверка статистических данных с помощью модуля pandera или в CoLab
Приятного чтения! 📚
Pandera - инструмент для проверки фреймов данных pandas, который предоставляет интуитивно понятный, гибкий и выразительный API 🐼
👉 Проверка статистических данных с помощью модуля pandera или в CoLab
Приятного чтения! 📚
Сегодня две новости 🕺
1️⃣ Запускаю серию статей про визуализацию. Начинаем с pyvis 🐍
Библиотека pyvis предназначена для быстрой визуализации сетевых графиков с минимальным количеством кода на Python. pyvis разработана как обертка для популярной JavaScript библиотеки visJS. Например, результат визуализации сети персонажей Игры престолов 🧝♀️
Подробнее см. Делаем сетевые графы интерактивными с помощью Python и Pyvis.
2️⃣ Решил взяться за написание открытого учебника по анализу данных на языке Python 😎 Главы буду публиковать по мере их написания тут 🐼
1️⃣ Запускаю серию статей про визуализацию. Начинаем с pyvis 🐍
Библиотека pyvis предназначена для быстрой визуализации сетевых графиков с минимальным количеством кода на Python. pyvis разработана как обертка для популярной JavaScript библиотеки visJS. Например, результат визуализации сети персонажей Игры престолов 🧝♀️
Подробнее см. Делаем сетевые графы интерактивными с помощью Python и Pyvis.
2️⃣ Решил взяться за написание открытого учебника по анализу данных на языке Python 😎 Главы буду публиковать по мере их написания тут 🐼
dfedorov.spb.ru
Введение в Pandas, NumPy, Matplotlib, Plotly, Altair для анализа данных
Python, Pandas, NumPy, Matplotlib, Plotly, Altair, Seaborn для анализа данных
1️⃣ Собрал небольшой мануал про регулярные выражения в pandas 🐼 Запустить можно в CoLab.
2️⃣ Работаю над главой учебника про pandas и упражнениями. Процесс идет. В мае опубликую 🥳 Принимаются предложения по составу учебника 📚
2️⃣ Работаю над главой учебника про pandas и упражнениями. Процесс идет. В мае опубликую 🥳 Принимаются предложения по составу учебника 📚
⚡Подготовил новый перевод кейса с упражнениями! 🐍
Разбираем проект по анализу данных: исследуем средний вес новорожденных (запустить в CoLab):
Этот пример демонстрирует важные шаги практически в любом проекте по анализу данных:
0⃣ Определение данных, которые помогут ответить на вопрос.
1⃣ Получение данных и их загрузка в Python.
2⃣ Проверка данных и устранение ошибок.
3⃣ Выбор соответствующих подмножеств из данных.
4⃣ Использование гистограмм для визуализации распределения значений.
5⃣ Использование сводной статистики для описания данных таким образом, чтобы наилучшим образом ответить на вопрос.
6⃣ Рассмотрение возможных источников ошибок и ограничений в наших выводах.
Остальные переводы доступны по ссылке 🐼
Разбираем проект по анализу данных: исследуем средний вес новорожденных (запустить в CoLab):
Этот пример демонстрирует важные шаги практически в любом проекте по анализу данных:
0⃣ Определение данных, которые помогут ответить на вопрос.
1⃣ Получение данных и их загрузка в Python.
2⃣ Проверка данных и устранение ошибок.
3⃣ Выбор соответствующих подмножеств из данных.
4⃣ Использование гистограмм для визуализации распределения значений.
5⃣ Использование сводной статистики для описания данных таким образом, чтобы наилучшим образом ответить на вопрос.
6⃣ Рассмотрение возможных источников ошибок и ограничений в наших выводах.
Остальные переводы доступны по ссылке 🐼
Google
Исследуем средний вес новорожденных.ipynb
Run, share, and edit Python notebooks
☀Несколько летних новостей 🐍
1⃣ записал небольшое видео про этапы анализа данных на языке Python, видео доступно по ссылке.
2⃣ также на днях вышло 3-е издание моего пособия по основам языка Python, бумажная версия представлена на сайте издательства.
📚 Остальные переводы, обзоры и кейсы по анализу данных по ссылке 🐼
1⃣ записал небольшое видео про этапы анализа данных на языке Python, видео доступно по ссылке.
2⃣ также на днях вышло 3-е издание моего пособия по основам языка Python, бумажная версия представлена на сайте издательства.
📚 Остальные переводы, обзоры и кейсы по анализу данных по ссылке 🐼
YouTube
Этапы анализа данных на языке Python
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
Подводим итоги. Самые популярные переводы по количеству просмотров за прошедший год 🐍
1⃣ Сводная таблица в pandas
2⃣ Обзор типов данных Pandas
3⃣ Подробное руководство по группировке и агрегированию с помощью pandas
4⃣ Разделение (биннинг, дискретизация, балансировка) данных с помощью qcut и cut в Pandas
⚡ Записал видео о причинах популярности языка Python 🐼
1⃣ Сводная таблица в pandas
2⃣ Обзор типов данных Pandas
3⃣ Подробное руководство по группировке и агрегированию с помощью pandas
4⃣ Разделение (биннинг, дискретизация, балансировка) данных с помощью qcut и cut в Pandas
⚡ Записал видео о причинах популярности языка Python 🐼
🔥 Подготовил новый перевод с кейсами: Исследуем отношение между переменными 🐼
1⃣ Мы будем визуализировать отношения с помощью диаграмм рассеяния (scatter plots), диаграмм размаха (box plots) и скрипичных диаграмм (violin plots).
2⃣ И количественно определять отношения, используя корреляцию (correlation) и простую регрессию (simple regression).
Самый важный урок этого блокнота заключается в том, что вы всегда должны визуализировать взаимосвязь между переменными, прежде чем пытаться ее количественно оценить; в противном случае вас могут ввести в заблуждение.
👉 Ссылка на html-версию
👉 Ссылка на Colab
🐍 Остальные переводы по ссылке: https://dfedorov.spb.ru/pandas/
1⃣ Мы будем визуализировать отношения с помощью диаграмм рассеяния (scatter plots), диаграмм размаха (box plots) и скрипичных диаграмм (violin plots).
2⃣ И количественно определять отношения, используя корреляцию (correlation) и простую регрессию (simple regression).
Самый важный урок этого блокнота заключается в том, что вы всегда должны визуализировать взаимосвязь между переменными, прежде чем пытаться ее количественно оценить; в противном случае вас могут ввести в заблуждение.
👉 Ссылка на html-версию
👉 Ссылка на Colab
🐍 Остальные переводы по ссылке: https://dfedorov.spb.ru/pandas/
👍3