👨🏼‍💻Перекладываю 📊 в 🌲🇫🇮
694 subscribers
226 photos
7 videos
52 links
DA + DE = AE? @ little🇫🇮startup,
Ex Product Data Analyst @ SkyEng,
Ex Data Engineer @ Starship (delivery robots),
Ex Data Analyst @ EPAM,
Я НЕ РАЗМЕЩАЮ РЕКЛАМУ,
Личка открыта https://t.me/jarikor ,
(надо нормальное название каналу придумать)
Download Telegram
Часто просят делиться исходным кодом. Ловите.
После каждой правки — файл синхронизируется.
Поэтому сейчас он не полный, и будет дополняться.

Файл с учебным кодом:
https://www.dropbox.com/s/nax9xq1dxen655v/Pandas%20Study.ipynb?dl=0

Файл-архив с данными:
https://www.dropbox.com/s/fgvisz27knco9jh/acs2015_census_tract_data.csv.gz?dl=0
👨🏼‍💻Перекладываю 📊 в 🌲🇫🇮 pinned «Часто просят делиться исходным кодом. Ловите. После каждой правки — файл синхронизируется. Поэтому сейчас он не полный, и будет дополняться. Файл с учебным кодом: https://www.dropbox.com/s/nax9xq1dxen655v/Pandas%20Study.ipynb?dl=0 Файл-архив с данными: …»
Смотрите, какая жуть по 2015 году.
Сколько штатов, в которых есть провинции… ну дальше описание на экране.

УЖАС просто.

Вот такие вот данные можно из открытых данных получить без проблем с простейшим кодом…
Слава открытым данным.

Вчера у меня была заруба с иммигрантами из России, которые, по причине своей малограмотности, оказались лютыми расистами и к тому же вообще не владеющими математикой и здравым смыслом.

В итоге, в порыве обсуждения того, что россияне + восточная европа = в сумме превышают количество понаехов из арабских\африканских стран, я решил добыть официальную стату и поработать с ней.

Короч, обратил срач себе на пользу.

Итак, что я сегодня собрал:
Пошагово, что делал и как и зачем
В итоге вычислений и работы с данными получилась вот такая табличка:
Так. Жпег испохабил оттенки.
Посоветовали сделать логарифмический хит-мап.
Сказали, тут даже всплеск из россиян не испортит окрас остальных ячеек.
Айн момент.
Итак, с перерывами на ужин и уборку, за час-полтора, решение было найдено (нагуглено и перепробовано. Какие ужасные хитмапы в начале получались, и как стало красиво)
Ну! Ахуенно же теперь!🔥

Надо строку "Other" убрать из датафрейма. От неё пользы в анализе никакой, только сбивает выборку.

Код и таблица с данными в разных форматах https://www.dropbox.com/sh/79c857xt31w193f/AAA6_qXJJBjUNmuhrFIeKACFa?dl=0

Источник открытых данных:
stat.fi

Конкретно — http://pxnet2.stat.fi/PXWeb/sq/221c3c89-df00-494b-9fa3-acd2b422dbe3
Тезис, с которого начался спор.