То, о чем так долго говорили, наконец произошло. У Tableau появился полноценный браузерный режим для создания визуализаций.
(Раньше можно было исправлять сделанные в десктопе, теперь можно с нуля создавать прямо в окне браузера)
(Раньше можно было исправлять сделанные в десктопе, теперь можно с нуля создавать прямо в окне браузера)
Очень хороший обзор стандарта визуализации данных IBCS от Романа Бунина. Стандарт рассказывал о том, как правильно (и неправильно) делать графики и диграммы для отчетов, презентаций и дэшбордов.
https://revealthedata.com/blog/all/obzor-standarta-ibcs/
https://revealthedata.com/blog/all/obzor-standarta-ibcs/
🍾🍾🍾 Поздравляем коллег из Агентства Инфографика, чей проект «Почему утонул Курск» взял серебро престижной премии в мире инфографики Malofiej. Это настоящий успех и признание высокого качества. И в этом году единственный представитель из России среди призеров.
Напомню, что на премии Moscow Dataviz Awards этот проект взял золото )
Ссылка на сам проект: https://kursk.infografika.agency
Подробности о победителях Малофея можно почитать здесь: https://www.malofiejgraphics.com/awards/el-pais-and-errea-comunicacion-receive-the-best-of-show-awards/2021/06
Напомню, что на премии Moscow Dataviz Awards этот проект взял золото )
Ссылка на сам проект: https://kursk.infografika.agency
Подробности о победителях Малофея можно почитать здесь: https://www.malofiejgraphics.com/awards/el-pais-and-errea-comunicacion-receive-the-best-of-show-awards/2021/06
Forwarded from Reveal the Data
Результаты первого спринта
На первые две недели сделали фокус на табличные вычисления, порядок операций и создание первого дашборда. Какой получился дашборд расскажу в следующий раз, чтобы сразу показать и версию после замечаний.
А пока поделюсь статьей, которую подготовили с Русланом по быстрым табличным вычислениям. Это было домашкой — собрать все виды вычислений и придумать для них бизнесовые примеры. Получилась короткая «шпаргалка» с яркими визуальными образами, чтобы быстро сориентироваться что и зачем существует. А ещё есть книга на Паблике с примерами использования вычислений.
Stay tuned, готовим следующую «серию». =)
#залетайвbi
На первые две недели сделали фокус на табличные вычисления, порядок операций и создание первого дашборда. Какой получился дашборд расскажу в следующий раз, чтобы сразу показать и версию после замечаний.
А пока поделюсь статьей, которую подготовили с Русланом по быстрым табличным вычислениям. Это было домашкой — собрать все виды вычислений и придумать для них бизнесовые примеры. Получилась короткая «шпаргалка» с яркими визуальными образами, чтобы быстро сориентироваться что и зачем существует. А ещё есть книга на Паблике с примерами использования вычислений.
Stay tuned, готовим следующую «серию». =)
#залетайвbi
❤1👍1
На сайте https://tazeros.com/russian_covid_stereotypes обнаружилось любопытное исследование о том, собираются ли россияне прививаться (дату актуальности увы не указали).
Был проанализирован миллион постов в соцсетях и мессенджерах, результаты иллюстрировал красивенький тримап
https://telegra.ph/Osmyslennyj-vybor-cvetov-v-trimehpe-Ili-ne-trimehpe-06-25
#разборыграфиков
Был проанализирован миллион постов в соцсетях и мессенджерах, результаты иллюстрировал красивенький тримап
https://telegra.ph/Osmyslennyj-vybor-cvetov-v-trimehpe-Ili-ne-trimehpe-06-25
#разборыграфиков
Tazeros Global Systems
Наконец написал несколько слов о распространенной ошибке при отображении избыточных смертей (excess deaths) – сидело в голове и черновиках долгие месяцы. Очень часто вертикальную ось на графике обрезают, чтобы получше было видно собственно данные. Это один из извечных холиваров визуализации данных. В целом, я занимаю по этому вопросу умеренную позицию и считаю, что иногда фокус на отображаемых значениях оправдан, и вертикальную ось можно обрезать. Но не в данном случае. Тут мы имеем дело с любопытным случаем, когда отсечение нуля серьезно искажает визуальный сигнал ключевой переменной. Дело в том, что на графиках избыточных смертей главная отображаемая переменная – соотношение площади между линией избыточных смертей и бэйслайном (красная штриховка на графике) и площади под бейслайном (зеленая штриховка). Это соотношение дает нам p-score – % превышения числа смертей над обычным уровнем. Обрезая вертикальную ось, мы визуально занижаем знаменатель, преувеличивая избыточные смерти.
👍1
Есть тут еще и чуть менее очевидная проблема с размером населения отображаемых стран. Чем больше население, тем меньше случайные отклонения в понедельных или помесячных смертях, а значит, плотнее ложатся на графике макаронины линий за предыдущие годы. Если обрезать вертикальную ось, то можно очень сильно приблизиться к бэйслайну. Напротив, в небольших населениях данные скачут, и как ни обрезай площадь под бэйслайном остается больше. В итоге при обрезании вертикальной оси сигнал о превышении смертности искажается больше для больших населений. Чуть подробнее с картинками в треде, ссылка в первом комментарии.
Илья Кашницкий объясняет, почему не надо обрезать ось Y в графике про избыточные смерти.
Весь тред тут: https://twitter.com/ikashnitsky/status/1409472089304690694
Илья Кашницкий объясняет, почему не надо обрезать ось Y в графике про избыточные смерти.
Весь тред тут: https://twitter.com/ikashnitsky/status/1409472089304690694
Twitter
Ilya Kashnitsky
The other consideration is slightly more nuanced and is related to the issue with EuroMoMo z-scores. 4/ twitter.com/ikashnitsky/st…
Симпатичный ход от авторов инфографики про индекс счастья. Картограмма сопровождается снизу стрип-плотом, где роль кружочков выполняют флаги стран.
Позволяет легко понять распределение стран по показателю, расположение одних стран относительно других и относительно общей картины.
Все картинки тут.
#датавизприемы
Позволяет легко понять распределение стран по показателю, расположение одних стран относительно других и относительно общей картины.
Все картинки тут.
#датавизприемы
Вспомнил, что о похожем приеме писал Артем Иволгин в 18 году:
https://t.me/gizhru/138
https://t.me/gizhru/138
Telegram
Графики и жизнь
Но стоит добавить к ней специальную хреновину (каждый шарик — регион, размер пропорционален населению), и становится видно:
📊 Как распределены ЛЮДИ по показателю, а в этом же вроде была задача иллюстрации.
📊 Как распределены РЕГИОНЫ по показателю. Я не умею…
📊 Как распределены ЛЮДИ по показателю, а в этом же вроде была задача иллюстрации.
📊 Как распределены РЕГИОНЫ по показателю. Я не умею…
Еще один пример остроумной и наглядной визуализации данных (отсюда).
Процент вакцинированных по странам и континентам показан с помощью beeswarm plot'а. На русский это можно перевести как «пчелиный рой».
В отличие от обычного графика, преследующего ту же цель — показать распределение — типа штрихкод или стрип-плот (ленточная диаграмма), пример которой мы видели в предыдущем посте, этот тип визуализации позволяет разнести попадающие в один диапазон значения так, чтобы они не накладывались друг на друга, отлично сохраняя при этом картину распределения.
Его можно построить в rawgraphs.io, Tableau, Flourish, Python, R и других инструментах. Во Flourish правда нельзя изменять размер кружочков. UPD. Вроде бы можно, но через режим Survey.
Процент вакцинированных по странам и континентам показан с помощью beeswarm plot'а. На русский это можно перевести как «пчелиный рой».
В отличие от обычного графика, преследующего ту же цель — показать распределение — типа штрихкод или стрип-плот (ленточная диаграмма), пример которой мы видели в предыдущем посте, этот тип визуализации позволяет разнести попадающие в один диапазон значения так, чтобы они не накладывались друг на друга, отлично сохраняя при этом картину распределения.
Его можно построить в rawgraphs.io, Tableau, Flourish, Python, R и других инструментах. Во Flourish правда нельзя изменять размер кружочков. UPD. Вроде бы можно, но через режим Survey.
Forwarded from LEFT JOIN
Подборки каналов
Никак не доберусь до составления собственного списка, поэтому по просьбе ребят из @it_resume делюсь подборкой авторских телеграмм-каналов для аналитиков. В подборке 20 каналов: про анализ данных, программирование, data engineering, data science и так далее. На большинство каналов подписан лично, поэтому согласен и могу рекомендовать 🙂
Детали в посте на хабре.
Никак не доберусь до составления собственного списка, поэтому по просьбе ребят из @it_resume делюсь подборкой авторских телеграмм-каналов для аналитиков. В подборке 20 каналов: про анализ данных, программирование, data engineering, data science и так далее. На большинство каналов подписан лично, поэтому согласен и могу рекомендовать 🙂
Детали в посте на хабре.
Хабр
Большая подборка телеграмм-каналов для аналитиков
Работа аналитика требует постоянного пополнения своих знаний - новые инструменты, обновления и методы создаются, как горячие пирожочки. Но перерабатывать такие объемы информации просто нереально, а...
Хорошее объяснение, почему не надо использовать радарные диаграммы (пауки).
1. Кажется, что порядок лучей (и форма фигуры) имеют значение, но нет.
2. Кажется, что площадь кодирует сумму параметров, но нет.
3. Кажется, что параметры непрерывные, но нет — дискретные.
Авторы статьи советуют использовать "звездчатую" диаграмму. Согласен, что она лишена этих недостатков. Но она все же не очень компактная и менее наглядная, чем другие альтернативы.
В своей книге (https://t.me/chartomojka/623) и постере (https://t.me/chartomojka/600) я показываю более компактные и наглядные способы мультикатегориального сравнения.
https://flourish.studio/2020/10/21/create-online-radar-spider-charts/
1. Кажется, что порядок лучей (и форма фигуры) имеют значение, но нет.
2. Кажется, что площадь кодирует сумму параметров, но нет.
3. Кажется, что параметры непрерывные, но нет — дискретные.
Авторы статьи советуют использовать "звездчатую" диаграмму. Согласен, что она лишена этих недостатков. Но она все же не очень компактная и менее наглядная, чем другие альтернативы.
В своей книге (https://t.me/chartomojka/623) и постере (https://t.me/chartomojka/600) я показываю более компактные и наглядные способы мультикатегориального сравнения.
https://flourish.studio/2020/10/21/create-online-radar-spider-charts/
Forwarded from настенька и графики
Про графики в полярной системе координат от Rosamund Pearce из Financial Times. Пользоваться они ими не советуют, тк в таком формате график часто становится немножко (или множко) misleading.
Forwarded from LEFT JOIN
Кстати, для тех, кто здесь впервые: инициатива называется Гайд по BI. В рамках нее мы уже построили и рассказали про дашборды в инструментах:
— Redash
— Excel
— Looker
— Yandex DataLens
— Tableau
— QlikSense
— PowerBI
— SAP Analytics Cloud
— Google DataStudio
— Redash
— Excel
— Looker
— Yandex DataLens
— Tableau
— QlikSense
— PowerBI
— SAP Analytics Cloud
— Google DataStudio
LEFT JOIN
Гайд по современным BI-системам
В новой серии постов постараемся подробно изучить различные BI-системы на популярной группе датасетов SuperStore Sales. В основе данных — продажи и прибыль сетевого ритейлера в долларах. В следующем посте обсудим постановку реальной задачи, которая могла бы…
Forwarded from Reveal the Data
На неделе в одном личном чатике всплыла интересная картинка — график из Тинькофф Инвестиций. Смотря на него, кажется, что прибыль Теслы (черные бары) не изменилась в течение 6 кварталов, но на самом деле это не так. Если «пощелкать» по столбикам видно, что прибыль выросла в 70 раз ❗️ с 16 млн в Q1 2020 до 1142 млн в Q2 2021.
Пошёл проверять у себя. На Андроиде график выглядит лучше (второй скрин). Видна разница между 20 и 21 годом, но внутри 20-ого все столбики тоже одинаковые. На третьем скрине как график должен выглядеть на самом деле на Андроиде (5 кварталов).
Приложение нарушает один из главных принципов визуализации — визуализация не должна искажать данные и врать. Видимо из-за технических особенностей небольшие столбики «округляются», что приводит к серьёзной ошибке. Будьте внимательны, проверяйте свои графики!
Ошибку принёс Максим Годзи, спасибо ему за пример и внимательность! Максим — крутой аналитик, посмотрите его интервью у Карпова или почитайте про его технологию Retentioneering.
#наблюдение
Пошёл проверять у себя. На Андроиде график выглядит лучше (второй скрин). Видна разница между 20 и 21 годом, но внутри 20-ого все столбики тоже одинаковые. На третьем скрине как график должен выглядеть на самом деле на Андроиде (5 кварталов).
Приложение нарушает один из главных принципов визуализации — визуализация не должна искажать данные и врать. Видимо из-за технических особенностей небольшие столбики «округляются», что приводит к серьёзной ошибке. Будьте внимательны, проверяйте свои графики!
Ошибку принёс Максим Годзи, спасибо ему за пример и внимательность! Максим — крутой аналитик, посмотрите его интервью у Карпова или почитайте про его технологию Retentioneering.
#наблюдение
Приглашаю на мини-курс для сотрудников НКО про визуализацию данных от Теплицы социальных технологий. Опытным будет не очень интересно, начинающим — полезно.
Forwarded from ТЕПЛИЦА
Всем общественным проектам нужно рассказывать о своей работе 💯
Как это делать?– Нужно составлять графики!
Именно графики позволяют донести важную информацию доступно, быстро и наглядно.
А кто же научит правильно составлять графики?
🔥 Конечно, Александр Богачев, специалист по визуализации данных и инфографике, дата-журналист и автор книги «Графики, которые убеждают всех».
📌 На онлайн-курсе Теплицы 24-30 августа Александр поделиться тем, как грамотно создавать визуализацию под разные задачи, подбирать цветовую гамму и писать к графикам тексты.
Записывайтесь! Программа и регистрация 👉 https://te-st.ru/events/clear-graphs/
Как это делать?– Нужно составлять графики!
Именно графики позволяют донести важную информацию доступно, быстро и наглядно.
А кто же научит правильно составлять графики?
🔥 Конечно, Александр Богачев, специалист по визуализации данных и инфографике, дата-журналист и автор книги «Графики, которые убеждают всех».
📌 На онлайн-курсе Теплицы 24-30 августа Александр поделиться тем, как грамотно создавать визуализацию под разные задачи, подбирать цветовую гамму и писать к графикам тексты.
Записывайтесь! Программа и регистрация 👉 https://te-st.ru/events/clear-graphs/
Попросили оценить эту иллюстрацию, особенно сетуя на использование псевдотрехмерных иллюстраций.
Но мне кажется проблема куда больше в другом. Высота секторов этой круговой диаграммы разная, без какой либо логики в этом. При этом совершенно внезапно, площадь сектора за текущего нацлидера самая большая 😉 Сами углы сделаны просто на глазок, это даже не нужно проверять инструментами. 48% выглядит как 50, да и 46% выглядит как 50) 16% выглядит четко как 25%.
Само псевдо-3Д-то бог бы с ним, но то, что должно соответствовать данным им не соответствует, а за счет разной высоты секторов и площади соответственно создается уже совсем некрасивая манипуляция.
Получился классический пример как придать веса нужному сектору и создать правильное впечатление.
P. S. Плюс данные не собираются в 100% (35% + 16 % + 48% = 99%), нужно быть аккуратнее с округлениями.
#разборыграфиков
Но мне кажется проблема куда больше в другом. Высота секторов этой круговой диаграммы разная, без какой либо логики в этом. При этом совершенно внезапно, площадь сектора за текущего нацлидера самая большая 😉 Сами углы сделаны просто на глазок, это даже не нужно проверять инструментами. 48% выглядит как 50, да и 46% выглядит как 50) 16% выглядит четко как 25%.
Само псевдо-3Д-то бог бы с ним, но то, что должно соответствовать данным им не соответствует, а за счет разной высоты секторов и площади соответственно создается уже совсем некрасивая манипуляция.
Получился классический пример как придать веса нужному сектору и создать правильное впечатление.
P. S. Плюс данные не собираются в 100% (35% + 16 % + 48% = 99%), нужно быть аккуратнее с округлениями.
#разборыграфиков
👍2