настенька и графики
27.1K subscribers
2.63K photos
84 videos
15 files
3.18K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
Я тут нашла вот такую штуку, где наглядно показали, откуда берутся лишние кило за весь год)) Так как наша кухня явно отличается, да и праздники немножко другие, то вот моя адаптированная картинка с оливьешкой, мандаринками и прочим 🦊
Неужели больше не будет так трудно найти нужные данные? Google сделал сервис для поиска по датасетам, чтобы любое свое решение можно было принимать на основании данных 🐼

https://blog.google/products/search/discovering-millions-datasets-web/

https://datasetsearch.research.google.com/search?query=puppies&docid=WNnozSorXNAUSynvAAAAAA%3D%3D
Какая красота!!! Можно забить любой город и получить такую классную карту. Аж напечатать захотелось anvaka.github.io/city-roads/
7
На 2 курсе (а это было уже даже давно) мне сказали, что пайчарты использовать нельзя. Вот просто нельзя и все. Причины была в том, что вот барчарты гораздо нагляднее и понятнее, а пайчарты плохо “читаются” и вообще не воспринимаются. Но мне это как-то особо не помогло и пайчартами я пользовалась все равно, ну кругляшок разноцветный, ну красиво же! Потом я уже влюбилась в датавиз и выбор пайчарт vs барчарт стал очень важным для меня.

Каждый раз, когда у меня заходит такого рода обсуждения, я люблю показывать вот такую штуку от Financial Times, где нужно угадать, какая доля пайчарта больше или меньше, а потом сделать все то же самое с барчартом. Естественно, выходит, что с барчатами все куда быстрее, а большая часть людей не может дать правильный ответ с пайчартами (если вы можете, то это явно не первый ваш график и с визуальной грамотностью все точно ок).

📍Проблема нашего мира в том, что многие люди ооооочень любят пайчарты, прямо очень. Особенно взрослые дяди и тети с отчетами по 500 страниц. Так можно ли ими вообще что-то визулизировать? Да, и еще раз да. Только осторожно, да в принципе любой график можно испортить при неправильном использовании и нагромождении лишнего. Прикол в том, что люди действительно неплохо понимают доли на круговых диаграммах. Соотношение “видится” проще, потому что, по факту, это как пиццу разрезать. Мы легко понимаем, где ее четверть, где половина и сколько это в пиццо-кусочках. Поэтому я придерживаюсь стратегии использованиям пайчартов, когда у вас не больше 5 сегментов для сравнения. А лучше меньше. Данные по полу, ответы по типу да/нет и подобные вещи я всегда рисую пайчартом. Все, что больше - барчартом. Но и он становится бессилен, если категорий слишком много или вы решили добавить цвет и сделать его stacked (опять же, если цветов много). Очень интересно знать ваше мнение на этот счет, поэтому если не лень, напишите в лс, как вы относитесь к пирожко-чартам.

Забавный факт: в ggplot2 нет функции для рисования пайчартов. Я рисовала его в R один раз и у меня ушло на это 3 часа! Пайчарт рисуется путем развертывания барчарта, где на подгонку всяких лейблов у меня ушла просто куча времени. Так что я даже не знаю, то ли это супер интересная стратегия, как заранее не дать людям сделать плохо или же юзеры ggplot2 точно против пирожков :3

А шутку для главной картинки стырила тут
1
тут можно сделать абстрактную красивую картинку с потоковыми линиями 🦄 http://mfviz.com/flowFields/
сделала цветную сетевую штуку
лучшие валентинки - это сеточки друзей ❤️
❗️Негласные правила визуализации❗️

Must-read статья про то, как сделать график, который не осудит датавиз сообщество. Небольшой рекап их рекапа от меня:

🥮Пайчарты:
- Используйте разумное количество секторов (больше 5 долей обычно уже нечитаемо)
- Объединяйте второстепенные категории в вариант “другое”, если показать нужно все и сразу
- Упорядочивайте доли по размеру от самого большого до самого маленького по часовой стрелке (так “читать” будет легче)
- Если вы делаете вариант “другое”, то он должен быть в конце последовательности (даже если по порядку он должен быть не в конце)
- Самый большой кусочек лучше располагать в нижней части круга
- Делать пайчарт разноцветным необязательно - цвета нужны только для обозначения категорий, если это требуется
Добавлю, что категории обязательно должны суммироваться в 100% и быть частью общего целого. И если размеры долей почти равнозначны, то пайчарт будет нечитабелен.

📍Барчарты:
- Начинайте ось с нуля
(Я бы здесь и про цвета добавила, делать столбики разным цветом, если они все разные, не стоит. Если цвет не несет смысла за собой, то лишняя радуга не нужна)

Скаттерплот:
- Независимую переменную стоит располагать на горизонтальной оси, а зависимую - на вертикальной

📆Линейный график:
- Время всегда на горизонтальной оси и идет слева направо (от старого к новому)
- Выбранные временные интервалы и отметки на шкале должны соответствовать друг другу

🌈Цвета:
- Ограничьте общее количество цветов (цвет должен помогать ориентироваться в графике, а не просто создавать красивую картинку)
- Разница в цвете должна отражать разницу в данных
- Думайте о людях с дальтонизмом (из-за плохо подобранной палитры они могут не увидеть цветовые различия)

https://datajournalism.com/read/longreads/the-unspoken-rules-of-visualisation-and-when-to-break-them
14
Не знаю, много ли среди вас фронтендщиков, но эта штука мне показалась очень прикольной. Тут по ссылочке более 200 анимаций, сделанных только при помощи SVG, CSS и HTML. Никакого JavaScript, друзья!

https://andrew.wang-hoyer.com/experiments/svg-animations/


ЗЫ вы уже наверняка видели кучу датавиза про коронавирус и его распространение. Мне с этого всего очень грустно, поэтому разрешите мне ничего про это не постить.
просто и понятно про ML, еще и с картинками 🐳
https://vas3k.com/blog/machine_learning/