Чартомойка
14.9K subscribers
750 photos
29 videos
4 files
624 links
О графиках: плохих, хороших и других. От восхищения до ненависти — один chart.
Заметили подозрительный график, присылайте — @bogachev11
Download Telegram
🍾🍾🍾 Поздравляем коллег из Агентства Инфографика, чей проект «Почему утонул Курск» взял серебро престижной премии в мире инфографики Malofiej. Это настоящий успех и признание высокого качества. И в этом году единственный представитель из России среди призеров.

Напомню, что на премии Moscow Dataviz Awards этот проект взял золото )

Ссылка на сам проект: https://kursk.infografika.agency

Подробности о победителях Малофея можно почитать здесь: https://www.malofiejgraphics.com/awards/el-pais-and-errea-comunicacion-receive-the-best-of-show-awards/2021/06
Forwarded from Reveal the Data
Результаты первого спринта
На первые две недели сделали фокус на табличные вычисления, порядок операций и создание первого дашборда. Какой получился дашборд расскажу в следующий раз, чтобы сразу показать и версию после замечаний.

А пока поделюсь статьей, которую подготовили с Русланом по быстрым табличным вычислениям. Это было домашкой — собрать все виды вычислений и придумать для них бизнесовые примеры. Получилась короткая «шпаргалка» с яркими визуальными образами, чтобы быстро сориентироваться что и зачем существует. А ещё есть книга на Паблике с примерами использования вычислений.

Stay tuned, готовим следующую «серию». =)

#залетайвbi
1👍1
На сайте https://tazeros.com/russian_covid_stereotypes обнаружилось любопытное исследование о том, собираются ли россияне прививаться (дату актуальности увы не указали).
Был проанализирован миллион постов в соцсетях и мессенджерах, результаты иллюстрировал красивенький тримап

https://telegra.ph/Osmyslennyj-vybor-cvetov-v-trimehpe-Ili-ne-trimehpe-06-25

#разборыграфиков
Наконец написал несколько слов о распространенной ошибке при отображении избыточных смертей (excess deaths) – сидело в голове и черновиках долгие месяцы. Очень часто вертикальную ось на графике обрезают, чтобы получше было видно собственно данные. Это один из извечных холиваров визуализации данных. В целом, я занимаю по этому вопросу умеренную позицию и считаю, что иногда фокус на отображаемых значениях оправдан, и вертикальную ось можно обрезать. Но не в данном случае. Тут мы имеем дело с любопытным случаем, когда отсечение нуля серьезно искажает визуальный сигнал ключевой переменной. Дело в том, что на графиках избыточных смертей главная отображаемая переменная – соотношение площади между линией избыточных смертей и бэйслайном (красная штриховка на графике) и площади под бейслайном (зеленая штриховка). Это соотношение дает нам p-score – % превышения числа смертей над обычным уровнем. Обрезая вертикальную ось, мы визуально занижаем знаменатель, преувеличивая избыточные смерти.
👍1
Есть тут еще и чуть менее очевидная проблема с размером населения отображаемых стран. Чем больше население, тем меньше случайные отклонения в понедельных или помесячных смертях, а значит, плотнее ложатся на графике макаронины линий за предыдущие годы. Если обрезать вертикальную ось, то можно очень сильно приблизиться к бэйслайну. Напротив, в небольших населениях данные скачут, и как ни обрезай площадь под бэйслайном остается больше. В итоге при обрезании вертикальной оси сигнал о превышении смертности искажается больше для больших населений. Чуть подробнее с картинками в треде, ссылка в первом комментарии.

Илья Кашницкий объясняет, почему не надо обрезать ось Y в графике про избыточные смерти.
Весь тред тут: https://twitter.com/ikashnitsky/status/1409472089304690694
Симпатичный ход от авторов инфографики про индекс счастья. Картограмма сопровождается снизу стрип-плотом, где роль кружочков выполняют флаги стран.

Позволяет легко понять распределение стран по показателю, расположение одних стран относительно других и относительно общей картины.

Все картинки тут.

#датавизприемы
Еще один пример остроумной и наглядной визуализации данных (отсюда).

Процент вакцинированных по странам и континентам показан с помощью beeswarm plot'а. На русский это можно перевести как «пчелиный рой».

В отличие от обычного графика, преследующего ту же цель — показать распределение — типа штрихкод или стрип-плот (ленточная диаграмма), пример которой мы видели в предыдущем посте, этот тип визуализации позволяет разнести попадающие в один диапазон значения так, чтобы они не накладывались друг на друга, отлично сохраняя при этом картину распределения.

Его можно построить в rawgraphs.io, Tableau, Flourish, Python, R и других инструментах. Во Flourish правда нельзя изменять размер кружочков. UPD. Вроде бы можно, но через режим Survey.
Forwarded from LEFT JOIN
Подборки каналов
Никак не доберусь до составления собственного списка, поэтому по просьбе ребят из @it_resume делюсь подборкой авторских телеграмм-каналов для аналитиков. В подборке 20 каналов: про анализ данных, программирование, data engineering, data science и так далее. На большинство каналов подписан лично, поэтому согласен и могу рекомендовать 🙂
Детали в посте на хабре.
Хорошее объяснение, почему не надо использовать радарные диаграммы (пауки).
1. Кажется, что порядок лучей (и форма фигуры) имеют значение, но нет.
2. Кажется, что площадь кодирует сумму параметров, но нет.
3. Кажется, что параметры непрерывные, но нет — дискретные.

Авторы статьи советуют использовать "звездчатую" диаграмму. Согласен, что она лишена этих недостатков. Но она все же не очень компактная и менее наглядная, чем другие альтернативы.

В своей книге (https://t.me/chartomojka/623) и постере (https://t.me/chartomojka/600) я показываю более компактные и наглядные способы мультикатегориального сравнения.

https://flourish.studio/2020/10/21/create-online-radar-spider-charts/
Про графики в полярной системе координат от Rosamund Pearce из Financial Times. Пользоваться они ими не советуют, тк в таком формате график часто становится немножко (или множко) misleading.
Forwarded from Reveal the Data
На неделе в одном личном чатике всплыла интересная картинка — график из Тинькофф Инвестиций. Смотря на него, кажется, что прибыль Теслы (черные бары) не изменилась в течение 6 кварталов, но на самом деле это не так. Если «пощелкать» по столбикам видно, что прибыль выросла в 70 раз ❗️ с 16 млн в Q1 2020 до 1142 млн в Q2 2021.

Пошёл проверять у себя. На Андроиде график выглядит лучше (второй скрин). Видна разница между 20 и 21 годом, но внутри 20-ого все столбики тоже одинаковые. На третьем скрине как график должен выглядеть на самом деле на Андроиде (5 кварталов).

Приложение нарушает один из главных принципов визуализации — визуализация не должна искажать данные и врать. Видимо из-за технических особенностей небольшие столбики «округляются», что приводит к серьёзной ошибке. Будьте внимательны, проверяйте свои графики!

Ошибку принёс Максим Годзи, спасибо ему за пример и внимательность! Максим — крутой аналитик, посмотрите его интервью у Карпова или почитайте про его технологию Retentioneering.

#наблюдение
Приглашаю на мини-курс для сотрудников НКО про визуализацию данных от Теплицы социальных технологий. Опытным будет не очень интересно, начинающим — полезно.
Forwarded from ТЕПЛИЦА
Всем общественным проектам нужно рассказывать о своей работе 💯

Как это делать?– Нужно составлять графики!

Именно графики позволяют донести важную информацию доступно, быстро и наглядно.

А кто же научит правильно составлять графики?

🔥 Конечно, Александр Богачев, специалист по визуализации данных и инфографике, дата-журналист и автор книги «Графики, которые убеждают всех».

📌 На онлайн-курсе Теплицы 24-30 августа Александр поделиться тем, как грамотно создавать визуализацию под разные задачи, подбирать цветовую гамму и писать к графикам тексты.

Записывайтесь! Программа и регистрация 👉 https://te-st.ru/events/clear-graphs/
Попросили оценить эту иллюстрацию, особенно сетуя на использование псевдотрехмерных иллюстраций.

Но мне кажется проблема куда больше в другом. Высота секторов этой круговой диаграммы разная, без какой либо логики в этом. При этом совершенно внезапно, площадь сектора за текущего нацлидера самая большая 😉 Сами углы сделаны просто на глазок, это даже не нужно проверять инструментами. 48% выглядит как 50, да и 46% выглядит как 50) 16% выглядит четко как 25%.

Само псевдо-3Д-то бог бы с ним, но то, что должно соответствовать данным им не соответствует, а за счет разной высоты секторов и площади соответственно создается уже совсем некрасивая манипуляция.

Получился классический пример как придать веса нужному сектору и создать правильное впечатление.

P. S. Плюс данные не собираются в 100% (35% + 16 % + 48% = 99%), нужно быть аккуратнее с округлениями.

#разборыграфиков
👍2
Так и есть. Визуализация данных как вишенка на торте и все лавры ей. Но за ней стоит огромная работа.

Картинка Сергея Громова.
Forwarded from Reveal the Data
Весной познакомился с Григорием, он программист и сейчас делает пет-проджекты в области визуализации. Недавно он закончил MVP небольшого инструмента для обработки изображений в стиле «нарисовано от руки» и дал потестить. Получилось прикольно, хочу поддержать и поделиться.

Для меня это больше игрушка, но кому-то может быть полезно для создания стильных презентаций или иконок в одном стиле. Лучше всего работает с небольшими графиками, с большими дашбордами тормозит. Загнал в инструмент пару своих работ с Паблика, получилось классно. Вообще я немного завидую программистам — бац и сделал сервис. =)

Сам тул построен на базе библиотеки RoughJS, но сверху сделан интерфейс и парсилка векторных SVG/PDF и растровых картинок. Если будут баги или идеи, можно писать автору напрямую или на Product Hunt.
#ссылка