Журналистика данных
4.38K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Ссылка, которая без ложной скромности называется "классные публичные датасеты". Но это и правда так — действительно классные, и в огромном количестве
https://github.com/awesomedata/awesome-public-datasets
Общий счет побед и поражений за 1158 лет (с 860 до 2018 г.) оказался в нашу пользу. Вышло огромное исследование по военным кампаниям России
https://www.runivers.ru/gal/today.php?ID=595724
История о том, как собрать несколько сотен дата-журналистов для работы над совместным проектом. Сначала пробиваешь твиттер по тематическим хештегам, затем очищаешь информацию (например, кто-то указал дата-журналистику, а сам ею не занимается), наконец, сортируешь по странам и интересам. Все просто, но если это работает и виртуальные коллективы действительно оказываются работающими, то почему бы и нет
https://onlinejournalismblog.com/2018/11/27/how-periodista-de-datos-aggregated-over-300-journalists-in-spain-and-latin-america-to-help-data-journalism-collaboration/
Точно подсчитать количество мужчин 16-60, которых касается ограничение въезда на Украину, не получится — в таблицах Росстата приведены градации по 5 лет, в том числе 15-19 и 60-64, то есть лишние хвосты, приходящиеся на 15 и 61-64 года, нужно оценивать приближенно. Плюс учитываем поправку на количество женщин по возрастным категориям — как известно, до 35 лет у нас мужчин больше, а дальше наоборот. В общем, примерно прикинул — получилось, что забанили где-то 42 млн мужчин
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/#
Кури больше — проживешь дольше?

Презентация выступления товарища из Университета Майами на недавней конференции по журналистике данных в Бразилии. Поднимается вопрос, как избежать парадокса Симпсона — когда объединение наборов данных с понятными закономерностями приводит к ложным выводам. Пример — график, где отмечена продолжительность жизни в разных странах и количество выкуриваемых жителями сигарет. Из него можно сделать ошибочное заключение, что потребление табака продлевает жизнь. На самом же деле люди живут дольше в странах в большим ВВП — и курят там тоже больше

https://drive.google.com/file/d/1PrDaDBkuJ2BPq91jLivfZJ3bJh96_9L3/view
Готовится к выходу книга дизайнера Ар-Джей Эндрюса с игровым названием Info We Trust. Там будет его собственный опыт визуализации данных. Порядка 300 новых диаграмм, чартов и карт Ар-Джей нарисовал специально для книги. Изучение классики тоже полезно, говорит автор, но пусть она останется в других книгах
https://infowetrust.com/illustrations/
Смех смехом, но, подшучивая над военными, сами-то помним что-нибудь из того же Канта, Юма или Фомы Аквинского? На наше счастье в сети имеется немало кратких изложений философских учений, что позволяет если не разобраться в вопросе как следует, то по крайней мере не сойти за полного неуча. Вот, например
http://eurasialand.ru/txt/gusev/menu.htm
На фоне падения криптовалют появляются все новые рецепты спасения и развития самой технологии блокчейн. На сей раз речь идет о криптокартах, грозящих чуть ли не вытеснить GPS
https://www.theatlantic.com/technology/archive/2018/11/can-blockchain-maps-replace-gps/576985/
Чудесная иллюстрация на тему различной интерпретации одних и тех же данных
(гифка из фб Psychological Dynamics)
Наглядная тепловая карта смертности по возрастам и полам в странах мира, разработанная Йонасом Шоли. Страна просто выбирается в выпадающем меню, можно сравнивать страны попарно. Хорошо видно, что за последние десятилетия во многих странах младенческая и детская смертность сильно снизилась
https://jschoeley.shinyapps.io/hmdexp/
Стартовал медийный дата-проект в Венгрии — Atlo. Технологически ничего сносящего крышу в нём вроде бы нет, но, как отмечают наблюдатели, ценность в том, что это независимый проект в стране, где СМИ контролируются олигархами. Среди материалов проекта, как можно догадаться — расследование, как используюся яхты и бизнес-джеты премьер-министра Орбана
https://english.atlatszo.hu/2018/12/06/atlatszo-launches-data-visualization-project-atlo/
Data Journalism Awards объявил сбор заявок на конкурс 2019 года. Прислать работы надо до 7 апреля. Жюри жаждет уже не просто визуализации баз и массивов, а дополненной реальности и всякого прочего машинного обучения
https://datajournalismawards.org/submit-project/
Сегодня пройдёт 14-я большая пресс-конференция Владимира Путина. Вот некоторые данные по предыдущим конференциям.

Первая состоялась в 2001, а затем они проходили каждый год, кроме 2005 и 2009-2011. Самой короткой по времени -- 1 час 35 минут — была первая п/к, самой продолжительной — 4 часа 40 минут — п/к 2008. На первой п/к было аккредитовано около 500 журналистов, в 2017 -- 1 640, и это пока рекорд. На первой п/к Путин ответил на вопросы 20, а в 2008 — 80 корреспондентов, и это пока рекорд. В 2017 смогли задать вопрос 55 журналистов
По ссылке исторический прецедент — Известия судятся с Правдой. Причем взыскать с Правды хотят долг в размере 400 рублей и пени по этому долгу в размере 219 600 рублей. Время удивительных историй в базе данных по арбитражным делам
http://kad.arbitr.ru/PdfDocument/3b152066-c607-44e8-86ea-d28a1b0bd98a/ea00165e-2285-4475-92b9-8d41199ecd29/A40-263436-2018_20181113_Opredelenie.pdf
Данные анализа радио: Jingle Bells потеряла популярность. Рок-версия занимает 10-е место, обычная — 19-е.
https://towardsdatascience.com/i-analyzed-122-hours-of-holiday-radio-874b5c2cd3ae
В свежем исследовании McKinsey & Company о перспективах мировой индустрии моды на 2019 год, есть любопытная цифра, которая, как нам кажется, определяет глобальную тенденцию не только в мире моды: количество упоминаний слова "феминистский" на страницах сайтов и в письмах рассылок компаний-ритейлеров выросло за два последних года в 6,3 раза. Настоящий бум. Впору специализированные СМИ открывать
https://www.mckinsey.com/industries/retail/our-insights/the-state-of-fashion-2019-a-year-of-awakening
Лица, придуманные компьютером, уже практически не отличить от натуральных. Возможны проблемы
https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842