Руководство о том как установить и запустить Jupyter Notebook на выделенном сервере. Отдельный полезнейший бонус этой статьи - как получить и настроить SSL-сертификат от Let's Encrypt для сервера Юпитера. Лично мне держать и запускать свои ноутбуки на выделенном сервере намного удобнее, чем на своем компьютере, так что советую присмотреться к руководству. https://janakiev.com/blog/jupyter-notebook-server/
njanakiev
Installing and Running Jupyter on a Server
Jupyter Notebook is a powerful tool, but how can you use it in all its glory on a server? In this tutorial you will see how to set up Jupyter notebook on a server like Digital Ocean, AWS or most other hosting provider available. Additionally, you will see…
Седьмая часть из серии статей про автоматизацию рутины с помощью Python. Chang Hsin Lee рассказывает о том как записывать датафреймы в Excel с помощью библиотеки openpyxl, а также как форматировать стили внутри ячеек, чтобы всё было красиво и не приходилось потом в Excel переделывать стили сохраненных экселек. https://changhsinlee.com/pyderpuffgirls-ep7/
Chang Hsin Lee
Replace the Home Tab in Excel with Python—PyderPuffGirls Episode 7
In this post, I will show you the how to automate Excel away using the Python package openpyxl, starting with every button on the Home Tab. No more drag and drop!
В последнее время, становится ясным, что программирование - это уже не только удел технарей, но и тех, кто занимается различными видами гуманитарных и социальных наук. Прежде всего, это связано с ростом количества данных, которые используются в исследованиях. Тут как-то так вышло, что на портале Цифровой Дискурс (@discoursedigital) вышла статья про R и Python для различных НЕпрограммистов🙃 с моим большим комментарием. В нем я рассказываю о том как начать использовать Python, освещаю популярные библиотеки и делюсь своим мнением о том как новичку начать свой путь в программировании. https://discourse.digital/blogs/r-i-python-dlja-gumanitariev-i-neprogrammistov/
Написал в свой блог статью о том как использовать API Google Drive. Многим может быть полезно для автоматизации различной рутины, связанной с отчетностью. Например, можно будет сделать скрипт, заливающий Excel-файлик и сразу конвертирующий его в формат Гугл Таблиц. Или наоборот, скачать файл Гугл Таблиц в виде эксельки. А ещё там про то как создавать папки, удалять файлы. В общем, куча полезного. В конце статьи есть ссылка на ноутбук http://datalytics.ru/all/rabotaem-s-api-google-drive-s-pomoschyu-python/
www.datalytics.ru
Работаем с API Google Drive с помощью Python
Решил написать достаточно подробную инструкцию о том как работать с API Google Drive v3 с помощью клиентской библиотеки
Если вы хотите изучить Pandas, но пока не нашли практическую задачу для тренировки навыков, то вам поможет замечательный сборник упражнений. Упражнения освещают 10 тем, среди которых группировка данных, визуализация, работа с временными рядами. Удачной прокачки навыков! https://github.com/guipsamora/pandas_exercises
GitHub
GitHub - guipsamora/pandas_exercises: Practice your pandas skills!
Practice your pandas skills! Contribute to guipsamora/pandas_exercises development by creating an account on GitHub.
Последний пост из серии статей о том как автоматизировать всяческую рутину с помощью Python. Речь пойдет про Excel (снова), но теперь о том как с помощью openpyxl вставлять рисунки, диаграммы и формулы в книгу https://changhsinlee.com/pyderpuffgirls-ep8/
Chang Hsin Lee
Making Excel Charts, Formulas, and Tables with Python—PyderPuffGirls Episode 8
In this last post of the series, I will continue on automating Excel with Python and show you how to use a few commands outside the Home Tab.
Я уже выкладывал эту статью, но вышел русский перевод, поэтому делюсь снова. Лонгрид от Нетфликс о том как они используют Jupyter Notebook в работе с данными. В Нетфликс работает куча аналитиков и уж эти то ребята знают толк в том как готовить данные: тут и nteract с его крутым визуализатором, и PaperMill для параметризации ноутбуков, и контейнеризация ноутбуков. Вдохновляющее чтиво https://habr.com/ru/post/439272/
Хабр
Jupyter Notebook в Netflix
В последнее время Jupyter Notebook стал очень популярен среди специалистов Data Science, став де-факто стандартом для быстрого прототипирования и анализа данных. В Netflix, стараемся раздвинуть...
🔥1
В моей группе на Facebook Дмитрий Осиюк (автор канала WebAnalytics) поделился рядом готовых решений для выгрузки данных из API Google Analytics. Решил собрать несколько решений в один пост, чтобы каждый мог найти что-то подходящее для своих задач.
Во-первых, посмотрите пример использования Reporting API v4 в официальной документации от Google: http://bit.ly/2ECMIVG 🇷🇺
Статья Erik Driessen о том как начать работу с Reporing API v4 с примером обхода сэмплинга и загрузки данных в pandas dataframe: http://bit.ly/2T7iUt4 🇬🇧
Библиотека PGA для вытаскивания данных через Reporting API v3. Умеет сразу конвертировать данные в dataframe: http://bit.ly/2Ti35iO
Руководство по выгрузке данных из GA с помощью библиотеки google2pandas: http://bit.ly/2SwI7Z4 🇬🇧
Скрипт Ryan Praskievicz для выгрузки несэмплированных данных из Google Analytics сразу из нескольких профилей: http://bit.ly/2SsbonC 🇬🇧
На самом деле, таких решений на гитхабе over 9000, но приблизительно все похожи по принципу, советую попробовать покопаться с разными и выбрать то, с которым будет проще работать. Успехов! 💪
Во-первых, посмотрите пример использования Reporting API v4 в официальной документации от Google: http://bit.ly/2ECMIVG 🇷🇺
Статья Erik Driessen о том как начать работу с Reporing API v4 с примером обхода сэмплинга и загрузки данных в pandas dataframe: http://bit.ly/2T7iUt4 🇬🇧
Библиотека PGA для вытаскивания данных через Reporting API v3. Умеет сразу конвертировать данные в dataframe: http://bit.ly/2Ti35iO
Руководство по выгрузке данных из GA с помощью библиотеки google2pandas: http://bit.ly/2SwI7Z4 🇬🇧
Скрипт Ryan Praskievicz для выгрузки несэмплированных данных из Google Analytics сразу из нескольких профилей: http://bit.ly/2SsbonC 🇬🇧
На самом деле, таких решений на гитхабе over 9000, но приблизительно все похожи по принципу, советую попробовать покопаться с разными и выбрать то, с которым будет проще работать. Успехов! 💪
Если вы пролистаете записи в этом канале, то увидите, что у меня тут очень много туториалов про Pandas. Вот ещё один. С картинками http://bit.ly/2IKvVnV
jalammar.github.io
A Gentle Visual Intro to Data Analysis in Python Using Pandas
If you’re planning to learn data analysis, machine learning, or data science tools in python, you’re most likely going to be using the wonderful pandas library. Pandas is an open source library for data manipulation and analysis in python.
Loading Data
One…
Loading Data
One…
This media is not supported in your browser
VIEW IN TELEGRAM
Достичь космической скорости можно только с помощью новейшего топлива - данных, собственноручно переработанных при помощи Python.
Научим работать с API и автоматизировать рутинные задачи, не углубляясь в скучную теорию и фундаментальные основы.
Уже завтра 03.03.2019 стартует вводный курс Python для Digital. Промокод на скидку 20% для подписчиков: cosmo0303. https://digitalgod.be/beginner
Научим работать с API и автоматизировать рутинные задачи, не углубляясь в скучную теорию и фундаментальные основы.
Уже завтра 03.03.2019 стартует вводный курс Python для Digital. Промокод на скидку 20% для подписчиков: cosmo0303. https://digitalgod.be/beginner
Статья про различные фишки при работе с Jupyter Notebook, которые могут сильно сэкономить время. Про шорткаты, использование мультикурсора, а также обзор популярных расширений для Jupyter. http://bit.ly/2UjPHb4
Medium
Повышаем продуктивность при работе с Jupyter Notebook
Эта статья написана на основе моего доклада на Data Science Major (https://youtu.be/pjhV3r6RbDo?t=9722) — для тех, кто не любит читать :)
Сегодня хочу поделиться с вами крутейшей библиотекой pygsheets для работы с API Гугл Таблиц. Одна из крутейших штук - это то, что с её помощью можно делать графики внутри Гугл Таблиц (смотрите документацию). Также как и большинство библиотек для Гугл Таблиц, библиотека умеет грузить данные из датафрейма (метод set_dataframe). В общем, отличная альтернатива gspread, попробуйте! https://github.com/nithinmurali/pygsheets
GitHub
GitHub - nithinmurali/pygsheets: Google Sheets Python API v4
Google Sheets Python API v4. Contribute to nithinmurali/pygsheets development by creating an account on GitHub.
Куча небольших, но полезных, туториалов. Есть и суперочевидные, вроде "как загрузить csv в dataframe", но бывают и более любопытные: "4 метода округления в pandas", "конкатенация значений колонок", "применение условия ЕСЛИ в pandas". Советую посмотреть, если хотите открыть для себя новые приёмы в работе с данными. https://datatofish.com/python-tutorials/
Написал для блога CoMagic статью о том как с помощью Python делать запросы к Data API CoMagic. В статье рассмотрены особенности параметров API, с которыми часто возникают сложности, например, как ограничивать результаты с помощью фильтров, как задавать список нужных полей https://www.comagic.ru/blog/posts/mar/kak_delat_zaprosy_k_api_comagic_s_pomoshchyu_python_i_zachem_eto_nuzhno/
В среду 13.03.2019 на митапе "Зачем маркетологу программировать на Python" Дима Родин из DigitalGod расскажет о том для решения каких задач маркетологу имеет смысл учиться программировать, а потом я покажу практический пример анализа данных Facebook Ads с помощью Python. https://digitalgod.be/blog/07032019-meetup-1-python-for-marketers
И на этом фоне вот неплохой русскоязычный гайд про панд https://shwanoff.ru/pandas/
Большой туториал про использование словарей в Питоне. Если кто, вдруг, пренебрегает этой структурой данных, то самое время исправиться и начать использовать её чаще, ведь словари - наше всё😄https://www.dataquest.io/blog/python-dictionary-tutorial/
Dataquest
Python Dictionary Tutorial: Analyze Craft Beer with Dictionaries – Dataquest
Learn to use Python dictionaries to store, sort, and access data in this in-depth tutorial analyzing craft beer data to master dictionary techniques.
Наткнулся на лекцию Ильи Щурова про Pandas в рамках курса "Программирование на языке Python для сбора и анализа данных", который проходил во ВШЭ. Также на канале можно посмотреть другие лекции из этого курса: http://bit.ly/2F0NI4U. Там много информации, начиная от основ Python и до работы с API, библиотеками numpy и matplotlib. https://www.youtube.com/watch?v=ENKfnIEXyKw
YouTube
Лекция №12: библиотека pandas
Курс «Программирование на языке Python для сбора и анализа данных», НИУ ВШЭ, 2015-16 учебный год, лектор Илья Щуров. Лекция №12: библиотека pandas. 16 января 2016.
Страница курса (конспекты лекций, домашние задания и другие материалы): http://math-info.hse.ru/s15/m
Страница курса (конспекты лекций, домашние задания и другие материалы): http://math-info.hse.ru/s15/m
Короткий и понятный гайд о том как загрузить свои данные из DataFrame в ElasticSearch https://towardsdatascience.com/exporting-pandas-data-to-elasticsearch-724aa4dd8f62
Medium
Exporting Pandas Data to Elasticsearch
How to send your dataframe rows to an elasticsearch database
Часто бывает так, что данные для анализа не хранятся в виде удобного csv-файлика или в базе данных, а представляют собой какую-нибудь мало-структурированную кашу, например, логи сервера или длинный эвент лог в формате txt с произвольной структурой. Тогда приходится прежде всего решать задачу извлечения данных в таком виде, чтобы их затем можно было загнать в датафрейм. В блоге DataQuest есть интересный туториал с примером извлечения данных с помощью регулярных выражений https://www.dataquest.io/blog/regular-expressions-data-scientists
Dataquest
Tutorial: Python Regex (Regular Expressions) for Data Scientists
In this Python regex tutorial, learn how to use regular expressions and the pandas library to manage large data sets during data analysis.