Журналистика данных
4.38K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Терпеть не могу термин "большие данные". Во-первых, из-за неясности термина. Большие это сколько -- миллион чисел, сто миллионов, миллиард? Во-вторых, а что, собственно, меняется от того, миллион их или миллиард?

Сложность операций, в сущности, такая же -- хоть складывай эти числа и дели на N, чтобы арифметическое среднее найти, хоть перемножай и корень N-й степени извлекай. Лишь бы для вычислений хватило ресурсов компа, но это уже свойство компа, а не данных

Совсем другое дело как раз маленькие данные. Вот представьте, вам для решения об одобрении лекарства нужно провести испытание на обезьянах. И по-хорошему, надо бы изучить вопрос на самых разных особях: мужских, женских, детенышах, взрослых, старых, толстых, худых, рожавших, больных и так далее. Если делать полный перебор по всем факторам -- это потребуются тысячи подопытных дорогих животных, которых вам никто не даст. И вот тут уже искусство -- как принять решение, располагая, скажем, десятком обезьян.

Тут вы, упрощенно говоря, берете одну особь женскую, старую и толстую, а другую мужскую, молодую и худую, и по разнице реакции на лекарство начинаете смекать, что обусловлено полом, что возрастом, а что комплекцией. Изощрённая статистика малых данных + грамотная биология. Вот это дело, я понимаю
Инфографика от бразильцев : к 2100 году Индия обгонит по населению Китай, а Нигерия — США. Подробности в материале (на португальском языке)
https://www1.folha.uol.com.br/mundo/2018/07/crescimento-populacional-fara-mundo-mudar-de-cara-ate-2100.shtml
Рассказ о дата-журналистике в The Economist от начальника этого направления Алекса Селби-Бутройда. В конце замечательный бонус в виде инфографики по космическим запускам в странах мира
https://medium.economist.com/data-journalism-at-the-economist-gets-a-home-of-its-own-in-print-92e194c7f67e
Смотрю пошёл поток сообщений в СМИ и тг-каналах, перевирающий вроде бы совершенно ясный релиз Авиалесоохраны. Давайте, что ли, ещё раз чётко проговорим, чтобы не искажать данные:

Общая площадь лесных пожаров — около 3 млн га
Из них НЕ тушат (потому что нецелесообразно) — около 2,88 млн га
Тушат — около 0,11 млн га

И дальнейшая разбивка в релизе касается только тех пожаров, которые тушат (больше всего в Иркутской обл., потом в Красноярском крае и т д), а не вообще всех — как это прошло уже в целом ряде СМИ и телег

https://aviales.ru/popup.aspx?news=5495
Forwarded from Толкователь
Зона покрытия сотовой связью 3G в России на февраль 2019 г. Все операторы.
Страна огромной пустоши
GIF-мейкер от Google — обещают улучшение восприятия простой сравнительной инфографики. Идеология: умным и непростым должен быть текст, а вот графика должна быть буквально разжевана
https://www.blog.google/outreach-initiatives/google-news-initiative/using-data-gif-maker-compare-data-and-tell-stories/
Во-первых, это просто красиво — 293 спутника летают на низких орбитах и снимают Землю, и мы видим в масштабе времени, как они летают и что снимают. А во-вторых — надо понимать, что статичные картинки инфографики, какие бы они ни были креативные, это уже вчерашний день. Сейчас подавай тонны данных с анимацией, интерактивом, ну и конечно же креативом, его никто не отменял
https://nbremer.github.io/planet-globe/
Идеальная инфографика: минимум изобразительных средств, максимум смысла и наглядности
https://t.me/viveconesto/1216
Forwarded from data.csv (Alexey Smagin)
This media is not supported in your browser
VIEW IN TELEGRAM
В дата-журналистике есть жанр, когда читателю предлагают достроить графики самостоятельно. Так, например, делали NYTimes (https://www.nytimes.com/interactive/2017/01/15/us/politics/you-draw-obama-legacy.html) или РБК (https://www.rbc.ru/politics/07/05/2018/5ae45e8a9a7947cdea03a501)

Теперь это можете делать и вы, даже если в вашей команде нет кодера. На Medium пишут про инструмент TheyDrawIt!, который позволяет такие интерактивные графики создавать.

Пока в ассортименте только линейный график (как в примерах), но авторы задумываются и над тем, чтобы добавить и более интересные визуализации.

https://medium.com/multiple-views-visualization-research-explained/theydrawit-an-authoring-tool-for-belief-driven-visualization-b3267a001480
Хьюстон интересуется, какие у нас проблемы. Местный университет проводит опрос дата-журналистов, чтобы понять, куда идёт отрасль
https://houstoncommunication.co1.qualtrics.com/jfe/form/SV_5BwkmgzxudnQXDT
Forwarded from Журналистика
Журналисты и авторы со всего мира могут подать заявку на участие в ежегодном конкурсе The New Media Writing Prize (NMWP), который организован Медиашколой Борнмутского университета.

Принимаются работы в жанре интерактивного сторителлинга, созданные для чтения на компьютерах или мобильных устройствах. Это могут быть рассказы, романы, документальные произведения или стихотворения, использующие интерактивный подход и сочетающие текст, изображения, видео или анимацию.

Предусмотрены денежные призы. Главный победитель конкурса получит £1 тыс.

Заявку можно подать до 22 ноября (и до 13 декабря — для студенческой категории) — http://newmediawritingprize.co.uk/enter/

Рекомендуется ознакомиться с работами победителей прошлогоднего конкурса.
Любопытный кейс для тех, кто интересуется данными о продвижении телег. Главный спецкор по регионам Юрий Васильев переименовал свой Burrowing Owl в "Русский сыч", при этом концепция контента, насколько можно судить, не поменяется. Интересно, как изменится продвижение
https://t.me/burrowingowl
Отделу анализа данных агентства "Москва" по ходу добычи ценной информации попался документик, который непонятно куда в новостях приспособить, но сам по себе забавный: как Анатолий Сердюков и Галина Пузикова в шахматном порядке дарят друг другу одну и ту же квартиру
Настя Ивлеева вышла замуж за Элджея, а пробили данный факт не по базе ЗАГС, а по ЕГРЮЛ — эффективный, оказалось, способ
https://www.mskagency.ru/materials/2924595
В кроссворде The New York Times накануне объявления результатов выборов президента США пункт 39 по горизонтали назывался "Главная тема в завтрашней газете" и ответить на него можно было как Clinton [Elected] (избран Клинтон), так и BobDole [Elected] (избран Боб Доул) — для этого газетчики подобрали 7 пар допустимых разных вариантов ответа на каждую букву в словах "Клинтон" и "БобДоул"
https://www.xwordinfo.com/Crossword?date=11/5/1996
С особой теплотой вспоминаю выборы в Госдуму в декабре 2011 года, потому что тогда мне удалось тряхнуть своей математико-статистической стариной и неплохо развлечься.

Дело было в Известиях: в день выборов мы запустили на сайте табло, которое в реальном времени показывало, сколько людей уже проголосовало, с точностью до человека -- последние циферки менялись как сотые доли секунд на таймере. Читатели поражались: у вас что, моментальные данные со всех избирательных участков? Ну, конечно, нет.

Это работала математическая модель, основанная на исторических данных о том, с какой интенсивностью идет голосование по стране в разное время суток, и прогнозах явки на текущие выборы. Вот эти расчётные циферки и мелькали на табло. Потом подходили промежуточные данные из ЦИК о реальной явке, и это позволяло уточнять модель прямо на ходу.

В итоге ошибка была совсем невелика -- не больше, чем у всяких сервисов, показывающих онлайн население Земли -- это ведь тоже математические модели
Хорошая работа ZEIT. Журналисты проанализировали все речи депутатов бундестага после 1949 года. Теперь можно увидеть, какие темы когда были важны, в зависимости от чего они становились важными или наоборот. Например, субсидии на строительство жилья переставали обсуждать, когда стагнировал рынок аренды. Очень внятная визуализация
https://www.zeit.de/politik/deutschland/2019-09/bundestag-jubilaeum-70-jahre-parlament-reden-woerter-sprache-wandel
Шпионская история, которая помимо прочего показывает, что при помощи несложного поиска по базам можно вычислить то ли предателя, то ли того, кто пытается себя за него выдать. Но это уже не наше дело — нам достаточно того, что простые объявления о сделках с недвижимостью позволяют украшать тексты яркими подробностями
https://www.kommersant.ru/doc/4087921