настенька и графики
24.1K subscribers
2.38K photos
75 videos
15 files
3.08K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
Нашла в треде про визуализацию текстов классные примеры. Про долю мужчин и женщин в разных индустриях (сделано в R, кстати), диалоги из романа "Машина Времени" и проект, который я, кажется, не постила тут, но часто показываю в теме про текстовые и сетевые визуализации – анализ кросс-упоминаний в Библии.
Анализ паттернов доставки еды в Хельсинки в приложении Wolt. На картинке сеть связей ресторанов и точек доставки. У них модель доставки такая, что чем дальше ресторан, тем дороже, поэтому доставок на длинные дистанции не очень много. А так как это сеточка, то все сетевые характеристики тоже применяются. Например, в среднем пользователь заказывает из 8 разных ресторанов, а есть некоторые рестораны, которые доставляют буквально для 1 человека💫
Forwarded from Чартомойка
Очень важная статья, пожалуй, о главных секретах визуализации данных. Именно благодаря этим приемам обычно удается добиться того, чтобы график из простого представления данных превращался во что-то более осмысленное. Во что-то, что упрощает понимание, делает эти данные более наглядными.
Читать и перечитывать.

https://blog.datawrapper.de/10-ways-to-use-fewer-colors-in-your-data-visualizations/
Обложка для музыкального альбома группы Atomic Unit. Я про такую не слышала, но и не это меня заинтересовало))

Автор обложки Nicholas Rougeux и у каждой песни свой пейзаж, сделанный на основе нот и настроения, отраженного в композиции. У него вообще классные работы в области дата-арта, есть свой авторский стиль, но они все равно достаточно непохожие. Его сайт💫
Paul van der Laken себе эти музыкальные штуки повесил дома вместе с парой других работ (в том числе своей). Прямо топ, тоже хочу теперь что-то такое домой. Смотреть и любоваться каждый день!
Forwarded from Denis Sexy IT 🤖
Наткнулся на крутой проект:
Dollar Street – сайт где можно посмотреть как живут разные семьи в разных странах с определенным уровнем дохода, причем сравнивать можно по многим параметрам – от домов и машин, до косметики, зубных щеток, зубов, состояния ванных комнат и тп.

Очень наглядный проект который делают уже 15 лет, за время проекта сделали 30 000 фотографий и опросили 264 семьи со всего мира.

Например, можно вбить свой доход и посмотреть, как жилось бы в другой стране (условно, без учета покупательной способности). Или вбить ~200 долларов и заглянуть в другую реальность.

Ссылка на русскоязычную версию:
https://www.gapminder.org
Если вам вдруг нужна была готовая Табло книжка про preattentive attributes и магию датавиза, то вот она! От zen-мастера Ken Flerlage
У него еще есть серия пайчартового арта. Магия больше в подготовке данных, чем в Tableau, но выглядит прикольно, прямо как пупырки от стресса
Основные форматы файлов в сфере анализа данных и как их читать на Python.
Написала огромную штуку про улучшение перфоманса дашбордов в Tableau. Хотела мини-чеклист, но что-то не получилось.

Писала вообще для себя на основании материала "Designing Efficient Production Dashboards" , потому что я в этой теме ну так себе и хотелось какие-то понятные решения, что делать и что не делать.

Хочу супер обратить внимание на две штуки, которые помогут:
- видео Ромы Бунина “Под капотом Tableau”, чтобы понимать, как работает Tableau
- https://tableau-speedtest.site/ от Виталия Ковалёва для проверки скорости работы книги (хорошо замерять до и после применения всяких штук по оптимизации)
Если бы эта картинка попалась мне сильно раньше, ML может уложился бы в моей голове попроще. Читшит для scikit-learn – ML библиотеки на Python, но отлично раскладывает основные типы задач машинного обучения в принципе. Схемка интерактивная, так что сразу можно углябляться в методы.

Если нужно предсказать категорию:
- Классификация – есть размеченные данные, например спам/не спам и нужно классифицировать остальные (например, Наивный Байес)
- Кластеризация – данные на резмечены и нужно выделить группы по их схожести (например, K-means)

Если нужно предсказать числовое значение:
- Регрессия (например, линейная регрессия)

Если задача – снизить размерность данных, то поможет, например, PCA (метод главных компонент).

ps я давно не писала, потому что мне точно так же страшно, как и всем
За год ничего лучше irisов того года я пока не придумала💜

Сегодня предлагаю вам ещё посмотреть таймлайн про Women in Computing. Это пример создания таймлайна от knight lab от Northwestern University. Я как-то давно пользовалась этим сервисом и там супер удобно – можно вставлять фото, видео, аудио и накладывать это на таймлайн, рассказывая историю. И у них много других схожих продуктов для создания историй вокруг данных и не только.
Вы уже, наверное, слышали, но Tableau приостанавливает работу с корпоративными клиентами. Tableau Public работает и думаю, что тут проблем не будет. Российские BI-системы тоже есть (бурно обсуждают в чате, если рассматриваете переход туда), самый очевидный выбор сейчас - DataLens.

📍Еще есть проверенные opensource BI-системы:
- Redash - https://redash.io/ - дэши
- Superset - https://superset.apache.org/ - дэши
- Metabase - https://www.metabase.com/ - дэши
они прямо очень похожи между собой по структуре и методу создания

📍Дэшборды на R можно делать при помощи shiny:
- 1, 2, 3
- flexdashboard (тьюториал)
Шайни - просто пакет-надстройка для создания веб приложений, поэтому внутри все те же пакеты для датавиза (ggplot, plotly)

📍Дэшборды на Python при помощи dash и plotly
- 1, 2

Подборка российских аналогов разных сервисов (без дэшей, вдруг что-то понадобится)