RTD: Ссылки и репосты
532 subscribers
2.23K photos
128 videos
44 files
2.98K links
Канал-записаная книжка для канала @revealthedata. Все ссылки, которые привлекли моё внимание.
Download Telegram
Forwarded from Tableau's Viz of the Day
Featured on: 02-Oct-2024

Title: Customer Support Dashboard

Description: Customer support insights, unlocked. Get a complete view of customer support KPIs in this #VizOfTheDay by Tobiloba Babajide. Inspired by Gbóláhàn Adébáyò, explore tickets progress, types, and customer actions. 

Author: Tobiloba Babajide

Link to dashboard: https://public.tableau.com/app/profile/tobiloba.babajide/viz/CustomerSupportDashboard_17274500677220/Overview

Credits: Tableau Viz of the Day
-----------------------------------
Какой тип кнопок управления выбрать в зависимости от задачи и того, что эти кнопки делают. Хорошо подойдет для выбора формата фильтров и параметров в дэшах 🕹️
Forwarded from Weekly Charts
🟩🔲🔳 funkyheatmap: Визуализация датафреймов со смешанными типами данных

В R завезли новый пакет funkyheatmap, позволяющий создавать визуализацию, похожую на тепловые карты (heatmap). Их можно настраивать, добавляя аннотации к столбцам и строкам, что позволяет использовать несколько палитр или геомов (геометрических объектов), группировать строки и столбцы в категории. Мне кажется, для разведочного анализа данных самое то! Как вам?

#R #ВизуализацияДанных #heatmap
Forwarded from data.csv (Алексей Смагин)
шутки, которая одинаково уместна будет в пабликах про секс и про анализ данных не существу…
Аналитика зарплат по ЕС
Как запутать графиком или кейсы, когда неправильно подобран способ кодирования данных для визуализации (aka visual channel)

1. Если метрика растет, то он точно не дрлжна быть перевернута, как будто падает. А ведь такой график один раз даже сделали.

2. Есть четкая цветовая ассоциация, темный цвет – много, светлый – мало. Но вот работает она только на светлом фоне, поэтому если вдруг у вас есть темная тема, то там эта ассоциация начинает ломаться.

3. Нельзя использовать способы кодирования числовых данных для кодирования категориальных. Например, не нужно кодировать категории длиной, яркостью цвета или положением на шкале. Подробнее про типы каналов писала тут и приложила картинку.

4. Разные типы графиков порождают разные задачи. Барчарты хочется сравнивать, а в линейных графиках сразу создатеся ощущение динамики и желание проследить тренд. Поэтому линейные графики только для динамики, подробнее писала тут.
Forwarded from Data-comics
Статья статья!

Написала ее в самолете, потому что было скучно лететь! Вообще, меня эти мысли про два схожих направления дата-сторителлинга давно обуревали. Так что тут я как раз эти мысли собрала воедино и как-то выразила.

Описала различия в:
- Инструментах
- Темах
- Аудитории
- Визуализациях
- Эстетике
- Лидерах мнений

Получилось, по-моему занятно, но у меня не было опоры на какие-то маститые источники, так что рада буду вашему мнению по этому поводу!

https://habr.com/p/848556/

Сейчас про дата-сторителлинг я пишу в основном в канале @ChattingCharts.
Сходил тут впервые на иностранный подкаст, очень неплохо поговорили

https://open.spotify.com/episode/5uaxx5gliXx14eu7GEjYyW?si=2xjXbBwuRpKtBzjHgU1I2w
Не надо так))

Удобный и быстрый источник для дэшика – залог его хорошей производительности.

1. Агрегируйте данные по максимуму
2. Не добавляйте колонки, которые вы не будете использовать
3. Tableau лучше работает длинными таблицы, чем широкими, поэтому науучитесь работать с длинным форматов
4. Материализуйте вычисления на уровне источника данных – меньше вычислений в дэше, тем лучше

Еще советы по улучшению перфоманса таблошных дэшей
Waffle chart приготовленных яиц в кафешке ❤️
Forwarded from Datanomika (Александр Полоротов)
Сижу в самолете.

Вокруг все вынуждены использовать план эвакуации или журнал в качестве веера.

Сегодня не будет ничего про данные.

Хочется отвлечься, поэтому скроллю заметки в архиве пока не встретилась та самая. От которой плач ребенка на соседнем кресле превратился в белый шум.

Перечитываю и прямо сейчас, пока в небе, докручиваю ее, чтобы поделиться.

Просто потому что хочется и укусила муха или Стэтхем (проверка на возраст), поделиться чем-то очевидным.

Любовь к делу, процессу важнее денег, деньги подтверждение ценности/пользы.

Когда любишь Дело, то есть энергия совершать огромное количество созидательных действий.

Накопительный результат от созидательных действий приносит кому-то пользу, что рано или поздно конвертируется в деньги.

Так голодным трудно умереть, да и когда дело любимое, то и материальные блага не особо беспокоят. Пока общественное давление не выдавит из состояния потока или жизненные обстоятельства.

Когда Виталя предложил запустить Datanomix.pro в 2019 году на его деньги (хватало на 3 или 6 месяцев), то мы особо твердых финансовых, долгосрочных целей не ставили перед компанией.

Достаточно было сформулировать стремление стать номер #1 в своей нише -
тогда, это делать аналитические системы на Qlik и обучать Qlik в Казахстане, только Enterprise, Gov сегменты.

Во главе пару принципов:

1. Берем только те проекты, которые интересно делать.
Приносить реальную пользу клиенту, а не дашборды ради дашбордов всем подряд.

2. Не работать с мудаками. До сих пор не всегда получается, потому что каждый человек норм, пока не доказал обратного.

3. Фокус на Enterprise, Gov-сектор.

Этих вводных было достаточно, чтобы прыгнуть с головой и в первый год сделать пару сотен живых встреч на двоих (доля онлайна была крайне мала) с потенциальными клиентами, партнёрами, друзьями, знакомыми, которые превратились в 20 контрактов и сделать компанию прибыльной с первого года.

А самое главное, сформировать к концу года крутейшую команду:
Михаил Сирик, Анатолий Сирик, Пазылбекова Асель.
Forwarded from Chatting Charts
This media is not supported in your browser
VIEW IN TELEGRAM
Переверстка!

А вот и еще одна переверстка пошла!
У Германа есть интересный проект про родовые связи фамилии Стрельниковых!

Так что вот вам короткое видео, как сделать из набора диаграмм в Excel вполне достойный отчет по этой теме.

А тут полное видео! (24 минуты)

- Главное изменение - структура
- Правила тип диаграмм
- Заголовки и форматирование диаграмм

Тут еще структуру я бы выровняла - а то донат уехал немного выше, чем нужно. 🌝

На видео нет про карточки, но карточки там тоже не простые, сделаны на основе диаграммы, так что данные в них (в двух левых) могут обновляться.

Так что шлите свои отчеты и презентации - мне пригодятся примеры для прожарки 🔥😈🔥
Круто, если в редактируемом формате.
Но и картинками можете!
Не удержался друзья )))
Forwarded from Дата-сторителлинг (Андрей Дорожный)
📈Яндекс.Геоаналитика
Яндекс зарелизил свой сервис по геоаналитике. Данных у него очень много, так что могут себе позволить)

Сервис пока бесплатный, из полезного вижу аналитику по атомобильному и пешеходному трафику, демографию и доходы по довольно крупным гексам. В выборке есть почти все крупные города РФ.

Что-то подобное делал т-иньков год назад.

https://yandex.ru/geoanalytics/platform
Forwarded from Data Bar (Alexander Varlamov)
Автомобили в фильмах и парсинг 2млн страниц

Профилю на Kaggle почти 5 лет. Обычно беру датасеты оттуда, но сам ничего не публикую. Надо менять ситуацию, тем более что накопилось много всего (датасеты, ноутбуки), что будет полезно кагглерам.

Выложил первый датасет 'Cars, Trucks, Bikes, Buses in Movies (1900-2024)'. Там больше 1,75 миллионов записей и 21 поле.

Есть такой сайт imcdb.org (Internet Movie Cars Database). Там собирают кадры с транспортными средствами из фильмов, определяют марки, модели и т.д. 20 лет существует. По сути это самая большая база данных машин, снявшихся в фильмах. Здесь в википедии про IMCDb.

Написал парсер, который проходится по всем страницам сайта, их около 2х миллионов, и собирает данные в .csv. Парсер работал 1 неделю в 4 потока. В итоге собралось несколько .csv, которые потом объединил юнионом. Из неприятного - при парсинге не учел, что разные люди вводят данные, и они могут быть в разных форматах. Например, время в кадре автомобиля записывают как 00:02:35, 0:25:35, 25:35, 0-25-35, 25-35 и в других форматах. Пришлось еще искать несоответствия и допиливать датасет скриптами. Получилось вполне ок.

Выложил данные на Kaggle, описал датасет и поля. Можно скачивать и пользоваться. Надо только понимать, что все вводилось вручную, есть модерация и удаление дубликатов, но все равно есть вероятность несоответствий.

В данных есть ссылки на кадры из фильмов с конкретным транспортным средством (там кроме машин 🚙 еще мотоциклы 🏍, грузовики 🚛, бульдозеры 🚜, лесовозы 🚚 и еще много чего). Есть названия транспортных средств, года выпуска, типы (кабриолет, седан, хетчбек и т.п.). Каждое транспортное средство связано с фильмом и кадром где оно появлялось. IMDb id и ссылки на сайт imdb.com (база фильмов самая известная, наверное) позволяют джойнить с датасетами фильмов, включая имена актеров, режиссеров и т.д. То есть, можно ответить на вопросы типа:

- 'Какие топ марки машин есть в фильмах Тарантино?',
- 'Сколько раз встречается Газ-24 в фильмах Рязанова?',
- 'Какой процент румынских машин в румынских фильмах?',
- "Самое популярное авто в ужастиках?",
- "В каком фильме встречаются Феррари F-40 и 'Запорожец' ЗАЗ-966?"

Автомобиль в фильмах часто играет одну из главных ролей. Это:
- '982 De Lorean DMC 12'
- говорящая машина Рыцаря Дорог '1979 Chevrolet Chevette',
- '1965 Lamborghini 350 GT' в истории о Тонино Ламборгини, и
- '1971 Lincoln Continental Mark III Barris Kustoms [89-65A]' из 'The Car', и
- '1959 Cadillac Ambulance Miller-Meteor Sentinel 'Ecto-1'' охотников за приведениями,
- '2007 Chevrolet Camaro Replica 'Bumblebee' из 'Трансформеров'
и много других - это целая вселенная. И почему бы не соединить вселенную машин-актеров и вселенную людей актеров? Получается круто. Для обучения намного интереснее синтетических датасетов без эмоциональной окраски.

Много экзотики можно накопать из любимых фильмов.

- '1957 ATZ TDT-60' из "Девчат" (Название на английском 'The Girls' заставляет улыбнуться)
- 'KhAZ SPT-104' из 'Иронии судьбы'
- '1940 Chevrolet G-7107 Cargo [G-506]' из 'Семнадцати мгновений весны'.

Итого: дофига инсайтов прикольных можно вытащить. Примеры визуализаций в комменты покидаю.