Чартомойка
14.9K subscribers
736 photos
26 videos
4 files
621 links
О графиках: плохих, хороших и других. От восхищения до ненависти — один chart.
Заметили подозрительный график, присылайте — @bogachev11
Download Telegram
Хочется верить, что причина таких криво и косо выглядящих графиков не в том, что их делали на глаз, а в:
1) Оптических искажениях. То, что по краям выглядит меньше, а то, что в центре - крупнее (из-за формы задника сцены)
2) В трехмерных столбиках (цилиндрах), показанных в перспективе. Маленькие столбики за счет этого выглядят визуально гораздо крупнее, потому что их верхнюю грань лучше видно.

Собственно, все это наглядный пример того, почему не стоит пользоваться этой псевдотрехмерностью.

Ну, а обрезка столбиков — это однозначное зло, обсуждали уже не раз.
Очень интересный доклад по Дата-журналистике прямо сейчас
https://youtu.be/H3nlz22fsVE
Часто спрашивают меня, где научиться анализу данных и как развиваться в дата-сайентизме. Ну вот где, например.
На русском материалов внятных мало по этой теме, а тут ребята предлагают научиться с нуля машин лернинг. Все состоит из практики и реальных кейсов, где решаются конкретные боевые задачи, а не "чесание академичной теории". Курс ведёт руководитель отдела аналитики Mail.Ru Group (Юла) Петр Ермаков.

Начинается 16 апреля и длится 2,5 месяца, стоимость 49 тыс. руб. (вместо 79 тыс.) действует до 16 марта!
Учитывая уровень зарплат дата-сайентистов, инвестиция видится весьма стоящей.

Подробности тут: https://goo.gl/VGWUqY
Картинку сообразил по просьбам трудящихся
Надя Андрианова любезно поправила некоторые неточности, закравшиеся в плиточную карту. И перевела в более (пока еще) употребимые форматы.

Ai: https://www.dropbox.com/s/imexlcgtchxcbpf/RU.ai?dl=0
Pdf: https://www.dropbox.com/s/gbihuo96hjyyq3i/RU.pdf?dl=0

Пользуйтесь на здоровье. Спасибо, Надя!
Суд решил заблокировать Telegram. В ближайшее время это должно произойти.

Ссылки для обхода блокировок:
http://opentg.us
http://fuckrkn.us
http://telegram.veesecurity.com

Ссылки в один клик:
http://12345.opentg.us
http://12345.fuckrkn.us

Пользоваться этими ссылками элементарно.
Запускаете в браузере на компьютере или телефоне, нажимаете кнопку, у вас прописываются прокси, спокойно пользуетесь.
Ещё один способ обхода бот @socks5_bot. Нажимаете на него и следуете инструкциям. Проще некуда )
Игорь Яновский написал хорошую статью об альтернативах Tableau для веб: http://czrt.by/notes/chto-esli-ne-tableau/

От себя добавлю, что Tableau также и в моем представлении прежде всего инструмент для визуального анализа, бизнес и прочей аналитики, внутренней коммуникации и прототипирования.
Вот и Варламов туда же. Да не показывает этот график, что народ начал массово валить. Считать стали по-другому в 12 году. Причем сослался на инфографику, где это объясняется, снисходительно поругал, но факты предпочел не заметить
Forwarded from Elena Abasheva
Друзья, есть идея увидеть и визуализировать общую картину по специалистам датавиза: что делают, как работают и чем вдохновляются инфограферы.

Для этого сделала небольшую форму-опрос: https://goo.gl/forms/dGohWbUTnAsnuqNo1
По итогам можно будет узнать про предпочитаемые инструменты, что создают и для кого, возможно про доходы тоже. Если есть предложения по добавлению вопросов - welcome!

Результаты анонимного опроса будут открыты всем, кто захочет их посмотреть и их можно будет визуализировать. Если желающих будет достаточно, надеюсь уговорить @dorozhnij и @bogachev11 запустить новый тур ОРУ по визуализации результатов опроса.

Идея вдохновлена отчетами ОРейли (https://goo.gl/W3y7VX).
Буду признательна за поддержку и ваши анонимные ответы. Форма открыта предварительно до 4 мая: https://goo.gl/forms/dGohWbUTnAsnuqNo1
Если будут предложения по вопросам, рада увидеть здесь или в личке.
Спасибо!
Кто хочет прокачаться в R практически бесплатно от лучших учителей?

Есть прекрасная Летняя школа, и на Летней школе есть мастерская АнДан — анализа данных в гуманитарных и социальных науках. На самом деле, она подходит всем, кто занимается или хочет заниматься анализом данных, и даже тем, кому это надо только в рамках учебной деятельности. АнДан пишет код только на R. Это совсем не страшно, есть стартовая программа, которая учит писать на R с нуля, есть программы продвинутая, лингвистическая и визуализационная, на которых нужно уже немного знать язык,
(Кстати, на на визуализации буду и я немного преподавать)
А если вы опасаетесь за свой уровень R или вовсе хотите поднять его с нуля, то курсов на Степике и немного усидчивости с гайдами и StackOverflow должно хватить, чтобы пройти на программу.

Всё это будет происходить с 22 июля по 6 августа на базе "Волга" под Дубной (добираться — это с вас) на берегу прекрасной одноимённой реки. Летняя школа — мероприятие условно-бесплатное, то есть участники наравне с организаторами платят добровольные оргвзносы, начинающиеся от 400 рублей в день (определяется самим участником). Живут на ЛШ в палатках (она с вас), работают в уютных домиках (это берут организаторы) на ваших личных ноутбуках (это тоже на вас).

Важный нюанс. На каждую программу есть отборочные задания, которые надо сделать до 20 мая.

Почитать подробности и оставить заявку можно тут: letnyayashkola.org/andan/
Forwarded from czaroot
Первым в анонсированной серии Элайджа Микс рассматривает вопрос «что говорят диаграммы». Автор выделяет четыре канала передачи информации: эксплицитный, который использует непосредственое отображение данных, выбранную форму визуализации, наряду с имплицитным, систематическим и описательным.

Так, диаграммы явным образом демонстрируют сами данные через выбранную дизайнером форму визуализации. Здесь важны чёткость и точность — качества значимые и для быстрой визуализации данных. Именно из-за своего соответствия этим качествам такие методы визуализации как столбчатые, линейные и диаграммы рассеяния пользуются большой популярностью.

Но через свою форму и методы отображения данных диаграммы несут и скрытый смысл. Будучи частью процесса передачи сообщения, они служат достижению целей коммуникации. Для этого используются приёмы риторики, стилизация графических форм и другие методы. Так, формулировка названия диаграммы задаст необходимые рамки, тщательно подобранная цветовая палитра может создать подходящее настроение, умелая стилизация вызовет желаемые ассоциации, визуальная метафора обеспечит движение мыслей в нужном направлении. Отмечается, что имплицитный канал визуализации данных может оказывать на читателя даже большее влияние, чем явное сообщение.

Отдельно автор отмечает популярность мнения, что подобная подача субъективна, она искажает данные и является манипуляцией. В ответ на это Элайджа подчёркивает, что любая диаграмма субъективна и не может обеспечить беспристрастный взгляд на данные, поскольку данные не имеют естественной формы.

По своей природе, диаграммы также рассказывают о систематическом качестве отображаемых данных (поскольку сами данные хранят сведения о системах, которые эти данные создали и провели необходимые измерения). Об этом свойстве визуализации данных важно помнить, чтобы в своей работе ненароком не выдать чего лишнего.

Наконец, диаграммы передают информацию, которая их описывает. Такое описание может быть внутренним (оси, метки, аннотации) и внешним (подпись к диаграмме, ремарка спикера, описание в тексте). В отличии от имлицитного канала, пассивного и действующего на подсознательном уровне, описательный передаёт информацию явным образом. Также сообщения описательного канала напрямую связаны с данными, в то время как имплицитные более тематические и непосредственно на данные никак не указывают.

В заключении Элайджа сформулировал некоторые правила для улучшения того, что диаграммы сообщают.
Эксплицитность: данные должны быть представлены чисто и недвусмысленно, чтобы читатель мог получить необходимые ответы.
Имплицитность: особенности набора данных следует отразить в визуализации. Оформление диаграмм должно быть осознанным, оправданным, соответствовать теме. Выбор цвета, графических элементов, формулировка заголовка — всё должно быть тщательно выверено и обосновано. Не стоит оставлять значения, назначенные (в программах) по умолчанию.
Систематичность: необходимо позаботиться о защите от нежелательного разоблачения лежащей в основе визуализации системы. Если визуализация данных должна помочь получше понять систему, стоит постараться отобразить саму систему, а не ключевые значения и срезы (то есть побольше сетевых диаграмм и поменьше барчартов).
Описательность: там где это возможно следует добавлять аннотации, которые предпочтительнее интерактива. Подписи и элементы осей использовать для передачи дополнительной информации.

Статья доступна по ссылке: https://medium.com/@Elijah_Meeks/what-charts-say-6e31cbba2047
Это материал с нового прекрасного канала о визуализации данных от Игоря Яновского — @czaroot

Всем советую, подписывайтесь