Datalytics – Telegram

Datalytics

9.08K subscribers

218 photos

17 videos

5 files

673 links

Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение — @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr

Download Telegram

About

Blog

Apps

Platform

9.08K subscribers

Статья о том как важно для аналитика данных автоматизировать свои рутинные задачи, писать функции, которые будут использоваться из проекта в проект. В статье есть несколько примеров таких функций, например, для объединения csv-файлов или переименования колонок датафреймов.

https://towardsdatascience.com/automate-boring-tasks-with-your-own-functions-a32785437179

7 Simple Python Functions to Clean Your Data

Automating tasks with Python is easy. Once you have a script that works, turn it into a function that will help you code more efficiently!

3K viewsedited 13:15

Принес вам очередной всеобъемлющий туториал по Pandas. Для новичков самое то

https://realpython.com/pandas-python-explore-dataset/

Using pandas and Python to Explore Your Dataset – Real Python

In this step-by-step tutorial, you'll learn how to start exploring a dataset with pandas and Python. You'll learn how to access specific rows and columns to answer questions about your data. You'll also see how to handle missing values and prepare to visualize…

3.61K views08:49

Напоминаю, что у этого канала есть чатик, который периодически оживает от ваших вопросов. Так что не стесняйтесь их там задавать. Там умеют гуглить и стаковерфлоить за вас🙂, а ещё делиться экспертизой, что гораздо ценнее 👨‍🔬👩‍🔬

Также я актуализировал список ссылок про Pandas 🐼, который накопился за время существования этого канала. С тех пор как я выкладывал эту ссылку в предыдущий раз, в канале уже сильно подросло количество народу, да и саму подборку я актуализировал, например, сильно подросло количество статей на русском: http://bit.ly/2GFnA21

Всем удачи!

Python для анализа данных

Чат про применение Python для анализа данных, в особенности для различного рода автоматизации и аналитики.

Основной канал — @datalytx
В чате вакансии просьба не размещать. Канал с вакансиями — @data_hr. Для размещения вакансии пишите @ax_makarov

👍1

4.37K viewsedited 08:58

Datalytics pinned «Напоминаю, что у этого канала есть чатик, который периодически оживает от ваших вопросов. Так что не стесняйтесь их там задавать. Там умеют гуглить и стаковерфлоить за вас🙂, а ещё делиться экспертизой, что гораздо ценнее 👨‍🔬👩‍🔬 Также я актуализировал список…»

09:03

Иллюстрированная статья про функции объединения в pandas: merge, join и concat.

https://towardsdatascience.com/python-pandas-dataframe-join-merge-and-concatenate-84985c29ef78

Python Pandas DataFrame Join, Merge, and Concatenate

Code and illustration on how pandas.DataFrame join, merge, and concatenate works

3.7K views12:29

Небольшой русскоязычный туториал по pandas: освещается чтение данных из файла и базовые операции вывода, обзора данных и фильтрации

https://pythonru.com/uroki/osnovy-pandas-1-chtenie-fajlov-dataframe-otbor-dannyh

Pandas Урок — чтение файлов csv, создание dataframe и фильтрация данных

Pandas — одна из самых популярных библиотек Python для аналитики и работы с Data Science. Это как SQL для Python. Все потому, что pandas позволяет

3.07K views09:13

Статья с примером парсинга данных с веб-сайтов с применением BeautifulSoup. Освещены все основные этапы: формирование запроса и получение странички с помощью requests, поиск нужного элемента в HTML через инспектор, выделение данных из элемента через методы BeautifulSoup.

https://www.agiratech.com/web-scraping-using-python/

Agira Technologies

Beginner’s Guide To Web Scraping Using Python

Learn how to perform web scraping in Python using libraries such as BeautifulSoup, Pandas. This is a step by step tutorial to extract the web data.

3.33K views06:32

Если вы хотите смоделировать систему, чтобы больше понимать о ее поведении, то вам понадобится собрав измерения переменных (статистику) внутри системы определить их распределение, чтобы можно было генерировать входные данные для моделирования системы. В этом случае достаточно найти параметры распределения, которые лучше всего соответствуют наблюдениям. Этот процесс известен как статистический вывод. В этой статье рассматривается метод оценки максимального правдоподобия (MLE).

https://richardstartin.github.io/posts/maximum-likelihood-estimation

Richard Startin’s Blog

Maximum Likelihood Estimation

Suppose you want to model a system in order to gain insight about its behaviour. Having collected some measurements of the state variables of your system, you want to infer their distribution so you can generate input for a system simulation. With some insight…

3.34K views10:24

Пост с различными полезными сниппетами для работы с pandas: от группировки и до method chaining.

https://kadekillary.work/post/embarrassment-of-pandas/

3.05K views07:20

Статья о том как сделать Jupyter Notebook более интерактивным: добавление прогресс-баров, виджетов для ввода, оформление текста. В общем, куча полезных советов, которые сделают ваши блокноты более удобными и красивыми

https://habr.com/ru/post/485318/

Добавляем в Jupyter Notebooks красоту и интерактивность

Многие используют в своей работе Jupyter Notebooks. Но с ростом сложности проекта появляются проблемы. В блокноте появляются ячейки с красными пометками для самого себя «перед запуском укажи число...»...

3.31K views09:22

Крутая статья про кластеризацию последовательности значений с помощью метода оптимизации Дженкса. Представьте, что у вас есть последовательность чисел, которые распределены не непрерывно, а имеют какие-то разрывы, например, значения после 50 перестают появляться и начинаются вновь только с 500. Алгоритм Дженкса позволяет на основе таких разрывов сформировать кластеры. Это очень удобный метод для того, чтобы сформировать более естественные диапазоны, нежели например с использованием квартилей, так как диапазоны будут можно сказать следовать природе данных.

https://pbpython.com/natural-breaks.html

Finding Natural Breaks in Data with the Fisher-Jenks Algorithm

The Fisher-Jenks optimization algorithm can be used to find natural breaks in your data and can be a useful tool for simple clustering of 1 dimensional data.

3.67K views09:14

Библиотека для создания анимированных гифок с помощью matplotlib

https://github.com/maxhumber/gif

GitHub - maxhumber/gif: The matplotlib Animation Extension

The matplotlib Animation Extension. Contribute to maxhumber/gif development by creating an account on GitHub.

3.07K views13:45

Генетический алгоритм - это метод решения вычислительных проблем, в основу которого положена теория естественного отбора.

В статье представлены простые и понятные примеры кода с реализацией генетического алгоритма.

https://dev.to/fernandezpablo/introduction-to-genetic-algorithms-in-python-e9p

Introduction to genetic algorithms in Python

What is a genetic algorithm? A genetic algorithm is a method to solve a problem inspired i...

3.3K views09:55

Наткнулся на интересную библиотеку для прогнозирования временных рядов. С её помощью можно выбрать различные модели прогнозирования, чтобы сравнить их между собой, а также комбинировать их с помощью модели градиентного бустинга. Всего в библиотеке представлено 11 моделей для прогнозирования временных рядов, включая наиболее популярные ARIMA и Prophet

https://github.com/firmai/atspy

GitHub - firmai/atspy: AtsPy: Automated Time Series Models in Python (by @firmai)

AtsPy: Automated Time Series Models in Python (by @firmai) - firmai/atspy

3.46K views09:20

Хорошая статья про создание интерактивных дашбордов с помощью Plotly (для визуализации) и Voila (для того, чтобы сделать веб-приложение из ноутбука). На мой взгляд, это очень элегантный и простой подход, позволяющий сделать исследование и делиться выводами по нему с другими людьми без шаринга всего кода. Отдельный бонус: рассматривается два варианта деплоя приложения - в облаке с помощью сервиса binder и на выделенном сервере через tmux.

https://pbpython.com/interactive-dashboards.html

Creating Interactive Dashboards from Jupyter Notebooks

This article discusses how to build an interactive dashboard to analyze reddit content and display interactive graphs of the result using Voilà.

6.11K views09:55

Vit Cheremisinov и Iskandar Mirmakhmadov составили подборку книг, блогов и статей, рекомендуемых для погружения в область экспериментов и математической статистики. Однозначно в закладки!

Материалы по математической статистике и экспериментам 1.0

Нас часто спрашивают, что мы советуем почитать, посмотреть и изучить для большего погружения в тему математической статистики и…

3.31K views12:09

Библиотека D-Tale позволяет отображать датафрейм в удобной таблице с возможностью сортировки и фильтрации. Чем-то похоже на Qgrid, но более навороченный. Ведь D-Tale умеет не просто отображать данные в ноутбуке, но и создавать в один клик веб-сервис, в котором таблица датафрейма будет доступна для обзора по URL. Это удобно для работы с данными из различных IDE, которые не поддерживаю pretty-вывод датафреймов.

https://github.com/man-group/dtale

GitHub - man-group/dtale: Visualizer for pandas data structures

Visualizer for pandas data structures. Contribute to man-group/dtale development by creating an account on GitHub.

3.22K views09:24

Обзор пяти простых, но эффективных, методов pandas: shift, mask, value_counts, nlargest, nsmallest

https://towardsdatascience.com/5-elegant-python-pandas-functions-a4bf395ebef4

5 Elegant Python Pandas Functions

Five beautiful Pandas method for everyday data science usage

3.1K views13:47

Статья с интересными примерами использования pandas для тестирования алгоритмов сбора и обработки данных

https://habr.com/ru/post/486756/

Python для тестировщика: как маленькие скрипты c pandas помогают в тестировании больших наборов данных

Я работаю тестировщиком на проекте, суть которого состоит в сборе и хранении различных данных и формировании на их основе разных отчетов и файлов-выгрузок. При ф...

3.16K views09:03

Forwarded from DataEng

Накатал статейку про введение в Apache Airflow: http://bit.ly/37o3tiD

291 views09:58

Статья, освещающая эффективные приемы работы с коллекциями: list comprehension, dict comprehension, использованием модулей collection и itertools.

https://sourcery.ai/blog/effective-collection-handling/

Getting the most out of Python collections

A guide to comprehensions, generators and useful functions and classes

2.45K views08:08