Нашла на медиуме набор постов от Taylor Brownlow
про SQL Hacks из 4х частей:
1. Common Table Expressions - про создание временных табличек внутри запроса (CTE)
2. All about those dates - все про операции с датами
3. The other JOINs - классические и не очень джойны
4. Window Functions - оконные функции (не зря ждала, хороший материал)
5. What can UDFs do for you? - про пользовательские функции в SQL
Она же автор поста про то, что дэшборды умирают, а будущее за ноутбуками🙈
про SQL Hacks из 4х частей:
1. Common Table Expressions - про создание временных табличек внутри запроса (CTE)
2. All about those dates - все про операции с датами
3. The other JOINs - классические и не очень джойны
4. Window Functions - оконные функции (не зря ждала, хороший материал)
5. What can UDFs do for you? - про пользовательские функции в SQL
Она же автор поста про то, что дэшборды умирают, а будущее за ноутбуками🙈
Интереcный график зарплат менеджеров, чья работа связаны с данными. Хочется их только чуть-чуть отодвинуть друг от друга🙈 Кстати, это снова R!
Сразу вспомнила проект Ромы Бунина и Николая Валиотти про зарплаты аналитиков. Там очень красивые боксплоты про зарплаты💫
Сразу вспомнила проект Ромы Бунина и Николая Валиотти про зарплаты аналитиков. Там очень красивые боксплоты про зарплаты💫
Про графики в полярной системе координат от Rosamund Pearce из Financial Times. Пользоваться они ими не советуют, тк в таком формате график часто становится немножко (или множко) misleading.
This media is not supported in your browser
VIEW IN TELEGRAM
А вот гифка из их поста в качестве примера, где такая система работает хорошо⚡️
Не знаю, когда только успевает, но Cedric Scherer снова сделал крутоту и написал пост про визуализацию распределений моим новым любимым графиком "облачка с дождиком" 🌧
Они одновременно показывают распределение (в более классическом представлении через график плотности) и сырые данные, а Cedric туда еще и боксплот добавил с пометками о размере выборки. По мне, так это прямо находка для всяких научных статей, где важно показывать распределение с разных сторон💫
Они одновременно показывают распределение (в более классическом представлении через график плотности) и сырые данные, а Cedric туда еще и боксплот добавил с пометками о размере выборки. По мне, так это прямо находка для всяких научных статей, где важно показывать распределение с разных сторон💫
Как самостоятельно сделать цветовую палитру через HSL модель и пару вычислений. Этот тьюториал еще хорошо помогает понять, как вообще работает HSL модель (H - отвечает за тон, S - за насыщенность, L - за светлоту/интенсивность).
1. Выбираете основной цвет и находите его HSL (у меня 336, 39, 49)
2. Берете значение для L и делаете набор значений от 0 до 100. У меня это вышло {9, 19, 29, 39, 49, 59, 69, 79, 89, 99}.
3. Подставляете эти значения вместо L и получаете множество оттенков выбранного цвета.
4. Чтобы выбрать другой сочетающейся цвет, то к значению H можно добавить {30, 120, 150, 180, 210, 240, 330}. В примере написано прибавлять, но у меня разброс H идет до 360, поэтому я вычитала.
Не думаю, что буду часто такое делать, всегда полагаюсь на https://coolors.co, но попробовать было интересно. Синий и бирюзовый мне понравились, а зеленый мне как-то не зашёл🙈
Нашла тут: https://www.instagram.com/p/CPsT9Y3Drla/
1. Выбираете основной цвет и находите его HSL (у меня 336, 39, 49)
2. Берете значение для L и делаете набор значений от 0 до 100. У меня это вышло {9, 19, 29, 39, 49, 59, 69, 79, 89, 99}.
3. Подставляете эти значения вместо L и получаете множество оттенков выбранного цвета.
4. Чтобы выбрать другой сочетающейся цвет, то к значению H можно добавить {30, 120, 150, 180, 210, 240, 330}. В примере написано прибавлять, но у меня разброс H идет до 360, поэтому я вычитала.
Не думаю, что буду часто такое делать, всегда полагаюсь на https://coolors.co, но попробовать было интересно. Синий и бирюзовый мне понравились, а зеленый мне как-то не зашёл🙈
Нашла тут: https://www.instagram.com/p/CPsT9Y3Drla/
Лего карта мира! Out of stock, к сожалению, но ах, как срочно хочется
апдейт, подсказали, что есть в России, но беру картинку с Фраем обратно...
что-то не учла курс, как-то 249$ звучали не так страшно))
что-то не учла курс, как-то 249$ звучали не так страшно))
grafify - пакет на R для ANOVA, post-hoc анализа и графиков на все это. В нем ограниченный набор возможных графиков с предвыбранным дизайном (не идеальным, но достаточно неплохим), поэтому рисовать их будет быстрее, чем в ggplot2. Ну и прикольно, что все в одном пакете 🙈
Нашла тут мини-статейку про принципы визуализации при эксплораторном анализе данных. Она больше всего подходит к графикам в статьях или каких-то исследовательких репортах, вот короткий пересказ с некоторыми моими комментами:
1. Давайте данные для сравнения и показывайте его наглядно. Когда вы приходите к какому-то результату, самые первые вопросы, которые приходят на ум – “В сравнении с чем / Относительно чего?”. Часто в исследованиях для этого есть контрольная группа, но какие-то другие данные схожего контекста тоже могут быть полезны. Визуализировать можно через боксплот.
2. Показывайте, как вы к этому пришли и почему такой результат валиден. Вот, например, пост, про улучшение регрессионных таблиц и в целом про варианты их визуализации.
3. Показывайте многомерные данные. Зачастую отношения межде переменными не линейные, поэтому помним про correlation!= causation и не забываем показывать данные с разных сторон. Это же полезно для анализа парадокса Симпсона (Как я с ним намучалась разок! Аналитикам читать прямо очень важно) - он про то, что в группах по отдельности может быть одна связь (например, и там и там положительная), а при объединении этих групп она может стать другой (отрицательной. В этом плане виз очень поможет и можно сделать много разных маленьких графиков. С картинками также тут.
4. Не бойтесь добавлять что-то новое в визуализацию. Если вы не знаете, как что-то нарисовать в одном инструменте – попробуйте в другом, и даже просто картинки могут быть полезны. Прямо как Alberto Cairo можно все править/менять в разных местах.
5. Подписывайте шкалы, источники, значения данных, чтобы было понятно, что это за график. Дублировать информацию не надо (наример, если значения баров подписаны напрямую, шкалу можно убрать), но убедитесь, что график понятен. Про decluttering диаграмм здесь и здесь.
6. Не добавляйте лишнее. Если вы сделали оч красивый график, но он никак не помогает восприятию исследования, лучше не надо его вставлять. Виз должен облегчать понимание, а если будет много всего, то сложнее будет понять, что действительно важно.
И хорошие ссылки в конце (выбрала пару основных, как мне кажется):
- Fundamentals of Data Visualization Claus O. Wilke
- Exploratory Data Analysis in R Roger D. Peng
- Beautiful Evidence Edward Tufte
1. Давайте данные для сравнения и показывайте его наглядно. Когда вы приходите к какому-то результату, самые первые вопросы, которые приходят на ум – “В сравнении с чем / Относительно чего?”. Часто в исследованиях для этого есть контрольная группа, но какие-то другие данные схожего контекста тоже могут быть полезны. Визуализировать можно через боксплот.
2. Показывайте, как вы к этому пришли и почему такой результат валиден. Вот, например, пост, про улучшение регрессионных таблиц и в целом про варианты их визуализации.
3. Показывайте многомерные данные. Зачастую отношения межде переменными не линейные, поэтому помним про correlation!= causation и не забываем показывать данные с разных сторон. Это же полезно для анализа парадокса Симпсона (Как я с ним намучалась разок! Аналитикам читать прямо очень важно) - он про то, что в группах по отдельности может быть одна связь (например, и там и там положительная), а при объединении этих групп она может стать другой (отрицательной. В этом плане виз очень поможет и можно сделать много разных маленьких графиков. С картинками также тут.
4. Не бойтесь добавлять что-то новое в визуализацию. Если вы не знаете, как что-то нарисовать в одном инструменте – попробуйте в другом, и даже просто картинки могут быть полезны. Прямо как Alberto Cairo можно все править/менять в разных местах.
5. Подписывайте шкалы, источники, значения данных, чтобы было понятно, что это за график. Дублировать информацию не надо (наример, если значения баров подписаны напрямую, шкалу можно убрать), но убедитесь, что график понятен. Про decluttering диаграмм здесь и здесь.
6. Не добавляйте лишнее. Если вы сделали оч красивый график, но он никак не помогает восприятию исследования, лучше не надо его вставлять. Виз должен облегчать понимание, а если будет много всего, то сложнее будет понять, что действительно важно.
И хорошие ссылки в конце (выбрала пару основных, как мне кажется):
- Fundamentals of Data Visualization Claus O. Wilke
- Exploratory Data Analysis in R Roger D. Peng
- Beautiful Evidence Edward Tufte
Medium
The 6 Principles of Effective Data Visualization
Key principles for creating useful and informative graphics
Jon Schwabish из PolicyViz с недавнего времени записывает короткие видео про датавиз. Здесь он, например, обсуждает карты от Financial times, отмечает хорошее и плохое и предлагает свои решения (например, добавить к двум картам скаттерплот), а тут показывает, как сделать хитмап в экселе 💫
YouTube
Vaccine Inequality from the Financial Times
Original source: https://www.ft.com/content/7b0db882-a369-4e32-a86a-eb7fda2a0da0
This data visualization critique is intended to help viewers improve how they visualize their data. The creator(s) of this visualization may have constraints on time or tools…
This data visualization critique is intended to help viewers improve how they visualize their data. The creator(s) of this visualization may have constraints on time or tools…
Со мной поделились классным сайтом Nicolas Rapp, который делает визы для Fortune💫
Мне оч понравилась вот эта вещь про рост городов, но у него в целом есть много чего посмотреть – и карты, и сети, и другие не самые стандартные графики. Все прямо приятно выглядит!
Мне оч понравилась вот эта вещь про рост городов, но у него в целом есть много чего посмотреть – и карты, и сети, и другие не самые стандартные графики. Все прямо приятно выглядит!
Интересная статья про тестирование дэшбордов от Silvia Romanelli с пластилиновыми человечками💫
"Directly observing users interacting with the dashboard and hearing them thinking aloud, allows you to not only see whether they manage or not to perform a task, but also why"
Больше фокус на прототипы и дальнейшие интервью и опросы, но упомянула еще кард-сортинг. Мне прямо очень нравится этот метод и хочется его куда-нибудь применить🙈
"Directly observing users interacting with the dashboard and hearing them thinking aloud, allows you to not only see whether they manage or not to perform a task, but also why"
Больше фокус на прототипы и дальнейшие интервью и опросы, но упомянула еще кард-сортинг. Мне прямо очень нравится этот метод и хочется его куда-нибудь применить🙈
Как изменилось потребление продуктов питания с 1970 по 2019 год по данным министерства сельского хозяйства США в графиках от Nathat Yau.