What does data mean?
194 subscribers
7 photos
2 files
84 links
Поток ссылок про аналитику
Download Telegram
Оказывается, на ютубе есть запись лекций по матанализу, которые читают на физфаке МГУ в 1 семестре.

8-11 здорово помогли разобраться с производными и дифференциалами. Наверняка и остальные классные
Forwarded from Ivan Begtin (Ivan Begtin)
Для тех кто хочет поработать с большими данными, но не знает с какими, Национальная библиотека Новой Зеландии опубликовала набор данных Papers Past [1] включающей 235GB сканов газет Новой Зеландии с 1839 по 1899 годы и CSV файл с метаданными описывающими эти газеты. Всё вместе после распаковки 1.6TB данных

Ссылки:
[1] https://natlib.govt.nz/about-us/open-data/papers-past-metadata/papers-past-newspaper-open-data-pilot/dataset-papers-past-newspaper-open-data-pilot

#opendata #nz #papers #culture
I can't resist sharing the basic principles of OOP
This repo contains a few peculiar things I've learned about pandas that have made my life easier and my code faster. This post isn't a friendly tutorial for beginners, but a friendly introduction to pandas weirdness.
Forwarded from Дашбордец
Несмотря на наличие большого числа инструментов для профилирования данных, многие до сих пор делают это руками.
Я уже давно привыкла использовать Power BI вместо того же SasDQ.
Что может?
1) Быстрое профилирование по 3м направлениям с помощью column distribution, column quality, column profile в режиме Power Query.
3) Функция Table.Profile: даёт возможность вывести результаты профилирования сразу в отдельную таблицу и построить отчет.
3) Exception Reporting -полноценный отчет об ошибках, который позволяет понять, что не так с вашим датасетом.
Линк по Exception Reporting и как это правильно использовать:
https://radacad.com/exception-reporting-in-power-bi-catch-the-error-rows-in-power-query

P. S. Подробно про работу средств профилирования: https://docs.microsoft.com/ru-ru/power-query/data-profiling-tools