Небольшой обзор парсеров: https://habr.com/ru/post/340038/
Хабр
10 инструментов, позволяющих парсить информацию с веб-сайтов, включая цены конкурентов + правовая оценка для России
Инструменты web scraping (парсинг) разработаны для извлечения, сбора любой открытой информации с веб-сайтов. Эти ресурсы нужны тогда, когда необходимо быстро получить и сохранить в структурированном...
И с легкой руки после обсуждения в датавиз-чате, не удержался и сделал отечественную версию
Financial times запустило свой сервис для создания графиков: fastcharts.io. Очень симпатичный и простой. Мне понравился. Можно скачать и растр и вектор, все бесплатно.
График легко можно сделать даже с телефона!
График легко можно сделать даже с телефона!
QLIK Sense — мощный и дорогой инструмент визуализации данных.
Несмотря на видимую простоту интерфейса, обучение работе с ним требуется большинству пользователей.
Почти все материалы по "клику" — на английском и слабо структурированы, либо продаются за значимые деньги центрами интеграции. Материалы на русском языке чаще всего не рассчитаны на новичков, рассказывая, в основном, технические аспекты для опытных разработчиков. И тем интереснее анонс моих друзей из DATAYOGA, которые запускают бесплатный онлайн-марафон по обучению Qlik Sense совместно с вендором.
Марафон Qlik – это бесплатный онлайн-курс, который проходит в формате ежедневных рассылок. Старт Марафона – 21 марта 2019 года.
На протяжении 21 дня вам будут приходить письма с подготовленными материалами, в которых будут и теоретическое объяснение тем и последовательные практические задания вместе с видео, книжками и полезными ссылками. Вы пройдёте путь от первого знакомства с инструментом Qlik до глубокого понимания процесса работы с визуализацией данных.
Больше информации по ссылке: https://datayoga.ru/qlik21
Несмотря на видимую простоту интерфейса, обучение работе с ним требуется большинству пользователей.
Почти все материалы по "клику" — на английском и слабо структурированы, либо продаются за значимые деньги центрами интеграции. Материалы на русском языке чаще всего не рассчитаны на новичков, рассказывая, в основном, технические аспекты для опытных разработчиков. И тем интереснее анонс моих друзей из DATAYOGA, которые запускают бесплатный онлайн-марафон по обучению Qlik Sense совместно с вендором.
Марафон Qlik – это бесплатный онлайн-курс, который проходит в формате ежедневных рассылок. Старт Марафона – 21 марта 2019 года.
На протяжении 21 дня вам будут приходить письма с подготовленными материалами, в которых будут и теоретическое объяснение тем и последовательные практические задания вместе с видео, книжками и полезными ссылками. Вы пройдёте путь от первого знакомства с инструментом Qlik до глубокого понимания процесса работы с визуализацией данных.
Больше информации по ссылке: https://datayoga.ru/qlik21
datayoga.ru
Кликофон Qlik Sense
Qlik Sense | 21 день
Посвящается новостям из Казахстана ⬇️⬇️⬇️
Интерактивная версия тут: http://visualthink.ru/2019/03/20/ussr_leaders_presidents/
И. Коллеги-визуализаторы, присоединяйтесь, тема богатая, там еще копать и копать, это только первый подход.
Интерактивная версия тут: http://visualthink.ru/2019/03/20/ussr_leaders_presidents/
И. Коллеги-визуализаторы, присоединяйтесь, тема богатая, там еще копать и копать, это только первый подход.
Начал публиковать третью главу книги.
Именно ваши данные убеждают в конечном итоге, а не график или оформление. Именно в данных содержится смысл. Какое бы прекрасное оформление вы не сделали, если за графиком ничего не стоит, это не произведет впечатления. Это все равно как цветастый текст, полный воды, написанный для увеличения количества знаков, в котором мало смысла и много шаблонных фраз.
Если вы работаете в компании, то данные у вас наверняка есть, и их даже слишком много. Как правило, это бесконечные таблицы из многих тысяч строк. Возникает очевидный вопрос. Как из этих тысяч строк выбрать подходящие для презентации данные?
Читать дальше: http://visualthink.ru/book/all/tretya-glava-formuliruem-soobschenie/
#книга
Именно ваши данные убеждают в конечном итоге, а не график или оформление. Именно в данных содержится смысл. Какое бы прекрасное оформление вы не сделали, если за графиком ничего не стоит, это не произведет впечатления. Это все равно как цветастый текст, полный воды, написанный для увеличения количества знаков, в котором мало смысла и много шаблонных фраз.
Если вы работаете в компании, то данные у вас наверняка есть, и их даже слишком много. Как правило, это бесконечные таблицы из многих тысяч строк. Возникает очевидный вопрос. Как из этих тысяч строк выбрать подходящие для презентации данные?
Читать дальше: http://visualthink.ru/book/all/tretya-glava-formuliruem-soobschenie/
#книга
visualthink.ru
Третья глава. Формулируем сообщение
Именно ваши данные убеждают в конечном итоге, а не график или оформление
🔥1
К данным, к тому как они собраны, как они организованы и подготовлены, предъявляются определенные требования. В конечном итоге, визуализация данных — это уже следующий за их подготовкой и анализом этапом. И если на подготовительном этапе возникли были ошибки, то их представление, как бы грамотно сделано не было, будет не многого стоить.
Данные должны быть по возможности:
— максимально свежими
— целостными, полными, консистентными
— сравнимыми (собранными по одной методологии на сопоставимых выборках)
— из вызывающих доверие источников
Читать дальше: http://visualthink.ru/book/all/kachestvo-dannyh/
#книга
Данные должны быть по возможности:
— максимально свежими
— целостными, полными, консистентными
— сравнимыми (собранными по одной методологии на сопоставимых выборках)
— из вызывающих доверие источников
Читать дальше: http://visualthink.ru/book/all/kachestvo-dannyh/
#книга
visualthink.ru
Качество данных
К данным, к тому как они собраны, как они организованы и подготовлены, предъявляются определенные требования
Любые количественные значения, которыми наполнены ваши таблицы — это не просто циферки. Они возникают не из воздуха. За каждым значением стоит какой-то процесс или явление в реальном мире. И эти цифры что-то означают. Они собираются по какому-то принципу, следуя какой-то методологии, с какими-то интервалами, с какой-то погрешностью. И каждая из них описывает какой-то маленький аспект огромной многообразной реальности. Важно понимать, насколько достоверно и в каком качестве данные соотносятся с реальностью, какой контекст за ними стоит.
Читать дальше: http://visualthink.ru/book/all/pogruzhenie-v-temu-i-kontekst/
#книга
Читать дальше: http://visualthink.ru/book/all/pogruzhenie-v-temu-i-kontekst/
#книга
visualthink.ru
Погружение в тему и контекст
Любые количественные значения, которыми наполнены ваши таблицы — это не просто циферки
Товарищи! 25 апреля в Москве будет конференция по инфографике. Там буду выступать и я (удаленно, правда, по скайпу). Состав спикеров очень достойный, было бы здорово, если бы все интересующиеся могли это послушать. К сожалению, конференция не из дешевых, насколько я понимаю, самый дешевый вариант попасть на неё — 9000 рублей. Так что напрягайте своих работодателей ))
А вот анонс, который написали про мое выступление (я только сейчас его в фейсбуке заметил).
Александр Богачев — эксперт по визуализации данных, интерактивной инфографике и дата-сторителлингу, экс-руководитель отдела дата-спецпроектов РБК, экс-редактор и ведущий дизайнер студии инфографики РИА Новости.
Сегодня он активно развивает проект Data Storytellers в сфере мультимедийной инфографики, работает с инструментом Tableau, параллельно ведет телеграм-канал «Чартомойка» и пишет книгу о грамотной и эффективной визуализации данных.
Наиболее известные работы:
⭐️ Спецпроект о космодроме «Восточный»: проект команды РИА НОВОСТИ, в котором Александр выступал в роли главного редактора. В 2016 году получил международную премию «Malofiej» в категории «Инфографика в онлайн-изданиях».
Ссылка на проект: https://ria.ru/20160425/1054997772.html
⭐️ Спецпроект команды РИА НОВОСТИ «Последний континент на земле» об истории открытия Антарктиды, где Александр был главным редактором. В 2016 году проект получил премию престижного международного конкурса HOW International Design Awards в номинации «Инфографика».
Ссылка на проект: https://ria.ru/20160212/1373322426.html
⭐️ Интерактивная инфографика о выборах в Госдуму в 2016 году
Ссылка на проект: https://ria.ru/20160918/1476912507.html
⭐️ Масштабный проект 2018 года для павильона «Космос» ВДНХ в Москве: огромные панно о планетах, которые не просто украшают павильон, а являются центрами притяжения и источниками информации, поданной в доступном для разных аудиторий виде.
На Visual Conf Александр Богачев выступит с темой «Эмоциональные данные. Как устроен и зачем нужен дата-сторителлинг».
На примере реальных кейсов он расскажет, как создавать визуализацию, которая превращается в элемент нарратива вместо вспомогательной справочной информации. Также спикер ответит на вопросы:
✅ Как превращать огромные массивы данных и информации в увлекательные истории;
✅ Как делать данные убедительным рассказчиком;
✅ Как добавить драматургии и эмоций и сохранить объективность и корректность.
Купить билет на Visual Conf: https://visual-conf.ru/
25 апреля, DIGITAL OCTOBER
А вот анонс, который написали про мое выступление (я только сейчас его в фейсбуке заметил).
Александр Богачев — эксперт по визуализации данных, интерактивной инфографике и дата-сторителлингу, экс-руководитель отдела дата-спецпроектов РБК, экс-редактор и ведущий дизайнер студии инфографики РИА Новости.
Сегодня он активно развивает проект Data Storytellers в сфере мультимедийной инфографики, работает с инструментом Tableau, параллельно ведет телеграм-канал «Чартомойка» и пишет книгу о грамотной и эффективной визуализации данных.
Наиболее известные работы:
⭐️ Спецпроект о космодроме «Восточный»: проект команды РИА НОВОСТИ, в котором Александр выступал в роли главного редактора. В 2016 году получил международную премию «Malofiej» в категории «Инфографика в онлайн-изданиях».
Ссылка на проект: https://ria.ru/20160425/1054997772.html
⭐️ Спецпроект команды РИА НОВОСТИ «Последний континент на земле» об истории открытия Антарктиды, где Александр был главным редактором. В 2016 году проект получил премию престижного международного конкурса HOW International Design Awards в номинации «Инфографика».
Ссылка на проект: https://ria.ru/20160212/1373322426.html
⭐️ Интерактивная инфографика о выборах в Госдуму в 2016 году
Ссылка на проект: https://ria.ru/20160918/1476912507.html
⭐️ Масштабный проект 2018 года для павильона «Космос» ВДНХ в Москве: огромные панно о планетах, которые не просто украшают павильон, а являются центрами притяжения и источниками информации, поданной в доступном для разных аудиторий виде.
На Visual Conf Александр Богачев выступит с темой «Эмоциональные данные. Как устроен и зачем нужен дата-сторителлинг».
На примере реальных кейсов он расскажет, как создавать визуализацию, которая превращается в элемент нарратива вместо вспомогательной справочной информации. Также спикер ответит на вопросы:
✅ Как превращать огромные массивы данных и информации в увлекательные истории;
✅ Как делать данные убедительным рассказчиком;
✅ Как добавить драматургии и эмоций и сохранить объективность и корректность.
Купить билет на Visual Conf: https://visual-conf.ru/
25 апреля, DIGITAL OCTOBER
Для того, чтобы уверенно чувствовать себя с данными, желательно ознакомиться хотя бы с азами статистики или воскресить в памяти институтский курс статистики, если он у вас был. (Выборки, среднее, медиана, вот это всё). Это нужно для того, чтобы избежать бессмысленных вычислений и бессмысленных визуализаций данных.
Читать дальше:
http://visualthink.ru/book/all/osnovy-statistiki/
#книга
Читать дальше:
http://visualthink.ru/book/all/osnovy-statistiki/
#книга
visualthink.ru
Об основах статистики
Это население субъектов РФ. Естественно, темнее всего Москва, Московская область, Санкт-Петербург и Краснодарский
Женя Софронов добавил в datawrapper.de возможность делать плиточную карту России. Это та самая карта, которая победила в конкурсе, ее автор Иван Дианов. Отличная новость! Хотя без аббревиатур регионов пользоваться ей будет сложновато.
Мне правда последнее время больше нравится карта, где Москва и СПб находятся внутри России. Делюсь ai-файлом со всеми желающими: https://cloud.mail.ru/public/5tbh/Fb3So7Rwy
Кстати, с плиточной картой и другими визуализациями активно экспериментирует Денис Запорожан. Любоваться на то, что он делает можно тут: https://t.me/DenisZdesign
Мне правда последнее время больше нравится карта, где Москва и СПб находятся внутри России. Делюсь ai-файлом со всеми желающими: https://cloud.mail.ru/public/5tbh/Fb3So7Rwy
Кстати, с плиточной картой и другими визуализациями активно экспериментирует Денис Запорожан. Любоваться на то, что он делает можно тут: https://t.me/DenisZdesign
К сожалению, не существует какого-то общепринятого алгоритма статистического и визуального анализа. Очевидно, что если пытаться перебирать все возможные виды переменных, срезов, фильтров, и их сочетаний друг с другом, то число комбинаций при достаточно большом датасете будет стремиться к бесконечности. Создание и анализ всех этих визуальных форм будет занимать слишком много времени. Поэтому проверяют обычно сначала важное, а потом ищут интересное.
Читать дальше: http://visualthink.ru/book/all/byt-analitikom-zadavat-voprosy/
#книга
Читать дальше: http://visualthink.ru/book/all/byt-analitikom-zadavat-voprosy/
#книга
visualthink.ru
Быть аналитиком. Задавать вопросы
Люди учатся на аналитиков данных несколько лет, однако все знания, которые они получают...
Чаще всего, чтобы найти что-то действительно важное и значимое в датасете, вам придется создавать сводные таблицы или новые данные внутри набора.
Читать дальше: http://visualthink.ru/book/all/process-analiza-sozdanie-novyh-dannyh-i-novyh-grupp/
#книга
Читать дальше: http://visualthink.ru/book/all/process-analiza-sozdanie-novyh-dannyh-i-novyh-grupp/
#книга
visualthink.ru
Процесс анализа. Создание новых данных и новых групп
Чаще всего, чтобы найти что-то действительно важное и значимое в датасете, вам придется создавать сводные таблицы
Вспомним теперь о том, что визуализация данных — инструмент в нашей коммуникации. Чтобы наша коммуникация состоялась, нам нужно сообщение. И чем это сообщение сильнее, тем выше вероятность того, что наша коммуникация будет эффективной.
Для того, чтобы сформулировать наше сообщение, нам и нужен процесс анализа данных. Сообщение нужно формулировать после анализа или в процессе, но никак не до, пытаясь подогнать данные и графики под готовые заранее мысли или шаблоны.
Читать дальше: http://visualthink.ru/book/all/formuliruem-soobschenie/
#книга
Для того, чтобы сформулировать наше сообщение, нам и нужен процесс анализа данных. Сообщение нужно формулировать после анализа или в процессе, но никак не до, пытаясь подогнать данные и графики под готовые заранее мысли или шаблоны.
Читать дальше: http://visualthink.ru/book/all/formuliruem-soobschenie/
#книга
visualthink.ru
Формулируем сообщение
Вспомним теперь о том, что визуализация данных — инструмент в нашей коммуникации