Ссылка, которая без ложной скромности называется "классные публичные датасеты". Но это и правда так — действительно классные, и в огромном количестве
https://github.com/awesomedata/awesome-public-datasets
https://github.com/awesomedata/awesome-public-datasets
GitHub
GitHub - awesomedata/awesome-public-datasets: A topic-centric list of HQ open datasets.
A topic-centric list of HQ open datasets. Contribute to awesomedata/awesome-public-datasets development by creating an account on GitHub.
Общий счет побед и поражений за 1158 лет (с 860 до 2018 г.) оказался в нашу пользу. Вышло огромное исследование по военным кампаниям России
https://www.runivers.ru/gal/today.php?ID=595724
https://www.runivers.ru/gal/today.php?ID=595724
История о том, как собрать несколько сотен дата-журналистов для работы над совместным проектом. Сначала пробиваешь твиттер по тематическим хештегам, затем очищаешь информацию (например, кто-то указал дата-журналистику, а сам ею не занимается), наконец, сортируешь по странам и интересам. Все просто, но если это работает и виртуальные коллективы действительно оказываются работающими, то почему бы и нет
https://onlinejournalismblog.com/2018/11/27/how-periodista-de-datos-aggregated-over-300-journalists-in-spain-and-latin-america-to-help-data-journalism-collaboration/
https://onlinejournalismblog.com/2018/11/27/how-periodista-de-datos-aggregated-over-300-journalists-in-spain-and-latin-america-to-help-data-journalism-collaboration/
Online Journalism Blog
How Periodista de Datos aggregated over 300 journalists in Spain and Latin America to help data journalism collaboration
In July an aggregator of data journalists from Spain and Latin America was launched under the name Periodista de Datos. Four months later, Maria Crosas Batista interviewed Félix Arias, project lead…
Транспортная статистика Москвы по версии Here. Заставка огонь
https://urbanmobilityindex.here.com/city/moscow
https://urbanmobilityindex.here.com/city/moscow
Here
Moscow Urban Mobility Index City Data - HERE
Find out how well Moscow ranks in terms of mobility management, ev charging stations, bike sharing and affordability from the HERE Urban Mobility Index.
Точно подсчитать количество мужчин 16-60, которых касается ограничение въезда на Украину, не получится — в таблицах Росстата приведены градации по 5 лет, в том числе 15-19 и 60-64, то есть лишние хвосты, приходящиеся на 15 и 61-64 года, нужно оценивать приближенно. Плюс учитываем поправку на количество женщин по возрастным категориям — как известно, до 35 лет у нас мужчин больше, а дальше наоборот. В общем, примерно прикинул — получилось, что забанили где-то 42 млн мужчин
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/#
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/#
Кури больше — проживешь дольше?
Презентация выступления товарища из Университета Майами на недавней конференции по журналистике данных в Бразилии. Поднимается вопрос, как избежать парадокса Симпсона — когда объединение наборов данных с понятными закономерностями приводит к ложным выводам. Пример — график, где отмечена продолжительность жизни в разных странах и количество выкуриваемых жителями сигарет. Из него можно сделать ошибочное заключение, что потребление табака продлевает жизнь. На самом же деле люди живут дольше в странах в большим ВВП — и курят там тоже больше
https://drive.google.com/file/d/1PrDaDBkuJ2BPq91jLivfZJ3bJh96_9L3/view
Презентация выступления товарища из Университета Майами на недавней конференции по журналистике данных в Бразилии. Поднимается вопрос, как избежать парадокса Симпсона — когда объединение наборов данных с понятными закономерностями приводит к ложным выводам. Пример — график, где отмечена продолжительность жизни в разных странах и количество выкуриваемых жителями сигарет. Из него можно сделать ошибочное заключение, что потребление табака продлевает жизнь. На самом же деле люди живут дольше в странах в большим ВВП — и курят там тоже больше
https://drive.google.com/file/d/1PrDaDBkuJ2BPq91jLivfZJ3bJh96_9L3/view
Готовится к выходу книга дизайнера Ар-Джей Эндрюса с игровым названием Info We Trust. Там будет его собственный опыт визуализации данных. Порядка 300 новых диаграмм, чартов и карт Ар-Джей нарисовал специально для книги. Изучение классики тоже полезно, говорит автор, но пусть она останется в других книгах
https://infowetrust.com/illustrations/
https://infowetrust.com/illustrations/
INFO WE TRUST
Hand Drawn
Info We Trust is packed with hundreds of illustrations I drew just for this book. One count puts it shy of 300 new charts, diagrams, maps, and depictions. There are full-page data stories, tiny dit…
Смех смехом, но, подшучивая над военными, сами-то помним что-нибудь из того же Канта, Юма или Фомы Аквинского? На наше счастье в сети имеется немало кратких изложений философских учений, что позволяет если не разобраться в вопросе как следует, то по крайней мере не сойти за полного неуча. Вот, например
http://eurasialand.ru/txt/gusev/menu.htm
http://eurasialand.ru/txt/gusev/menu.htm
На фоне падения криптовалют появляются все новые рецепты спасения и развития самой технологии блокчейн. На сей раз речь идет о криптокартах, грозящих чуть ли не вытеснить GPS
https://www.theatlantic.com/technology/archive/2018/11/can-blockchain-maps-replace-gps/576985/
https://www.theatlantic.com/technology/archive/2018/11/can-blockchain-maps-replace-gps/576985/
The Atlantic
A Map That Tracks Everything
Blockchain-based mapping hopes to replace GPS. Can it be trusted?
Чудесная иллюстрация на тему различной интерпретации одних и тех же данных
(гифка из фб Psychological Dynamics)
(гифка из фб Psychological Dynamics)
Наглядная тепловая карта смертности по возрастам и полам в странах мира, разработанная Йонасом Шоли. Страна просто выбирается в выпадающем меню, можно сравнивать страны попарно. Хорошо видно, что за последние десятилетия во многих странах младенческая и детская смертность сильно снизилась
https://jschoeley.shinyapps.io/hmdexp/
https://jschoeley.shinyapps.io/hmdexp/
Поучаствовал в проекте Состава "Нос к носу". Поговорили о многом, в том числе о Телеграме и журналистике данных
https://www.sostav.ru/publication/nos-k-nosu-yurij-vasilev-vs-aleksandr-malyutin-34758.html
https://www.sostav.ru/publication/nos-k-nosu-yurij-vasilev-vs-aleksandr-malyutin-34758.html
www.sostav.ru
Юрий Васильев vs Александр Малютин
В этом выпуске «Нос к носу #media» специальный корреспондент деловой газеты ВЗГЛЯД Юрий Васильев беседует с главным редактором агентства городских новостей «Москва» Александром Малютиным.
Стартовал медийный дата-проект в Венгрии — Atlo. Технологически ничего сносящего крышу в нём вроде бы нет, но, как отмечают наблюдатели, ценность в том, что это независимый проект в стране, где СМИ контролируются олигархами. Среди материалов проекта, как можно догадаться — расследование, как используюся яхты и бизнес-джеты премьер-министра Орбана
https://english.atlatszo.hu/2018/12/06/atlatszo-launches-data-visualization-project-atlo/
https://english.atlatszo.hu/2018/12/06/atlatszo-launches-data-visualization-project-atlo/
English
Atlatszo launches data visualization project Atlo
Atlatszo launched its data visualization site, Atlo, which is a platform where we are going to publish content that is not necessarily connected to our anti-corruption, investigative work. We have already published a few examples of these, for example, our…
Data Journalism Awards объявил сбор заявок на конкурс 2019 года. Прислать работы надо до 7 апреля. Жюри жаждет уже не просто визуализации баз и массивов, а дополненной реальности и всякого прочего машинного обучения
https://datajournalismawards.org/submit-project/
https://datajournalismawards.org/submit-project/
Сегодня пройдёт 14-я большая пресс-конференция Владимира Путина. Вот некоторые данные по предыдущим конференциям.
Первая состоялась в 2001, а затем они проходили каждый год, кроме 2005 и 2009-2011. Самой короткой по времени -- 1 час 35 минут — была первая п/к, самой продолжительной — 4 часа 40 минут — п/к 2008. На первой п/к было аккредитовано около 500 журналистов, в 2017 -- 1 640, и это пока рекорд. На первой п/к Путин ответил на вопросы 20, а в 2008 — 80 корреспондентов, и это пока рекорд. В 2017 смогли задать вопрос 55 журналистов
Первая состоялась в 2001, а затем они проходили каждый год, кроме 2005 и 2009-2011. Самой короткой по времени -- 1 час 35 минут — была первая п/к, самой продолжительной — 4 часа 40 минут — п/к 2008. На первой п/к было аккредитовано около 500 журналистов, в 2017 -- 1 640, и это пока рекорд. На первой п/к Путин ответил на вопросы 20, а в 2008 — 80 корреспондентов, и это пока рекорд. В 2017 смогли задать вопрос 55 журналистов
По ссылке исторический прецедент — Известия судятся с Правдой. Причем взыскать с Правды хотят долг в размере 400 рублей и пени по этому долгу в размере 219 600 рублей. Время удивительных историй в базе данных по арбитражным делам
http://kad.arbitr.ru/PdfDocument/3b152066-c607-44e8-86ea-d28a1b0bd98a/ea00165e-2285-4475-92b9-8d41199ecd29/A40-263436-2018_20181113_Opredelenie.pdf
http://kad.arbitr.ru/PdfDocument/3b152066-c607-44e8-86ea-d28a1b0bd98a/ea00165e-2285-4475-92b9-8d41199ecd29/A40-263436-2018_20181113_Opredelenie.pdf
Данные анализа радио: Jingle Bells потеряла популярность. Рок-версия занимает 10-е место, обычная — 19-е.
https://towardsdatascience.com/i-analyzed-122-hours-of-holiday-radio-874b5c2cd3ae
https://towardsdatascience.com/i-analyzed-122-hours-of-holiday-radio-874b5c2cd3ae
В свежем исследовании McKinsey & Company о перспективах мировой индустрии моды на 2019 год, есть любопытная цифра, которая, как нам кажется, определяет глобальную тенденцию не только в мире моды: количество упоминаний слова "феминистский" на страницах сайтов и в письмах рассылок компаний-ритейлеров выросло за два последних года в 6,3 раза. Настоящий бум. Впору специализированные СМИ открывать
https://www.mckinsey.com/industries/retail/our-insights/the-state-of-fashion-2019-a-year-of-awakening
https://www.mckinsey.com/industries/retail/our-insights/the-state-of-fashion-2019-a-year-of-awakening
McKinsey & Company
The State of Fashion 2025: Challenges at every turn
The global fashion industry faces economic uncertainty, a dynamic market, and consumer behavior shifts. Finding pockets of growth means navigating a complex maze.
Лица, придуманные компьютером, уже практически не отличить от натуральных. Возможны проблемы
https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842
https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842