Журналистика данных
5.17K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Терпеть не могу термин "большие данные". Во-первых, из-за неясности термина. Большие это сколько -- миллион чисел, сто миллионов, миллиард? Во-вторых, а что, собственно, меняется от того, миллион их или миллиард?

Сложность операций, в сущности, такая же -- хоть складывай эти числа и дели на N, чтобы арифметическое среднее найти, хоть перемножай и корень N-й степени извлекай. Лишь бы для вычислений хватило ресурсов компа, но это уже свойство компа, а не данных

Совсем другое дело как раз маленькие данные. Вот представьте, вам для решения об одобрении лекарства нужно провести испытание на обезьянах. И по-хорошему, надо бы изучить вопрос на самых разных особях: мужских, женских, детенышах, взрослых, старых, толстых, худых, рожавших, больных и так далее. Если делать полный перебор по всем факторам -- это потребуются тысячи подопытных дорогих животных, которых вам никто не даст. И вот тут уже искусство -- как принять решение, располагая, скажем, десятком обезьян.

Тут вы, упрощенно говоря, берете одну особь женскую, старую и толстую, а другую мужскую, молодую и худую, и по разнице реакции на лекарство начинаете смекать, что обусловлено полом, что возрастом, а что комплекцией. Изощрённая статистика малых данных + грамотная биология. Вот это дело, я понимаю
Инфографика от бразильцев : к 2100 году Индия обгонит по населению Китай, а Нигерия — США. Подробности в материале (на португальском языке)
https://www1.folha.uol.com.br/mundo/2018/07/crescimento-populacional-fara-mundo-mudar-de-cara-ate-2100.shtml
Рассказ о дата-журналистике в The Economist от начальника этого направления Алекса Селби-Бутройда. В конце замечательный бонус в виде инфографики по космическим запускам в странах мира
https://medium.economist.com/data-journalism-at-the-economist-gets-a-home-of-its-own-in-print-92e194c7f67e
Смотрю пошёл поток сообщений в СМИ и тг-каналах, перевирающий вроде бы совершенно ясный релиз Авиалесоохраны. Давайте, что ли, ещё раз чётко проговорим, чтобы не искажать данные:

Общая площадь лесных пожаров — около 3 млн га
Из них НЕ тушат (потому что нецелесообразно) — около 2,88 млн га
Тушат — около 0,11 млн га

И дальнейшая разбивка в релизе касается только тех пожаров, которые тушат (больше всего в Иркутской обл., потом в Красноярском крае и т д), а не вообще всех — как это прошло уже в целом ряде СМИ и телег

https://aviales.ru/popup.aspx?news=5495
Forwarded from Толкователь
Зона покрытия сотовой связью 3G в России на февраль 2019 г. Все операторы.
Страна огромной пустоши
GIF-мейкер от Google — обещают улучшение восприятия простой сравнительной инфографики. Идеология: умным и непростым должен быть текст, а вот графика должна быть буквально разжевана
https://www.blog.google/outreach-initiatives/google-news-initiative/using-data-gif-maker-compare-data-and-tell-stories/
Во-первых, это просто красиво — 293 спутника летают на низких орбитах и снимают Землю, и мы видим в масштабе времени, как они летают и что снимают. А во-вторых — надо понимать, что статичные картинки инфографики, какие бы они ни были креативные, это уже вчерашний день. Сейчас подавай тонны данных с анимацией, интерактивом, ну и конечно же креативом, его никто не отменял
https://nbremer.github.io/planet-globe/
Идеальная инфографика: минимум изобразительных средств, максимум смысла и наглядности
https://t.me/viveconesto/1216
Forwarded from data.csv (Alexey Smagin)
This media is not supported in your browser
VIEW IN TELEGRAM
В дата-журналистике есть жанр, когда читателю предлагают достроить графики самостоятельно. Так, например, делали NYTimes (https://www.nytimes.com/interactive/2017/01/15/us/politics/you-draw-obama-legacy.html) или РБК (https://www.rbc.ru/politics/07/05/2018/5ae45e8a9a7947cdea03a501)

Теперь это можете делать и вы, даже если в вашей команде нет кодера. На Medium пишут про инструмент TheyDrawIt!, который позволяет такие интерактивные графики создавать.

Пока в ассортименте только линейный график (как в примерах), но авторы задумываются и над тем, чтобы добавить и более интересные визуализации.

https://medium.com/multiple-views-visualization-research-explained/theydrawit-an-authoring-tool-for-belief-driven-visualization-b3267a001480
Хьюстон интересуется, какие у нас проблемы. Местный университет проводит опрос дата-журналистов, чтобы понять, куда идёт отрасль
https://houstoncommunication.co1.qualtrics.com/jfe/form/SV_5BwkmgzxudnQXDT
Forwarded from Журналистика
Журналисты и авторы со всего мира могут подать заявку на участие в ежегодном конкурсе The New Media Writing Prize (NMWP), который организован Медиашколой Борнмутского университета.

Принимаются работы в жанре интерактивного сторителлинга, созданные для чтения на компьютерах или мобильных устройствах. Это могут быть рассказы, романы, документальные произведения или стихотворения, использующие интерактивный подход и сочетающие текст, изображения, видео или анимацию.

Предусмотрены денежные призы. Главный победитель конкурса получит £1 тыс.

Заявку можно подать до 22 ноября (и до 13 декабря — для студенческой категории) — http://newmediawritingprize.co.uk/enter/

Рекомендуется ознакомиться с работами победителей прошлогоднего конкурса.
Любопытный кейс для тех, кто интересуется данными о продвижении телег. Главный спецкор по регионам Юрий Васильев переименовал свой Burrowing Owl в "Русский сыч", при этом концепция контента, насколько можно судить, не поменяется. Интересно, как изменится продвижение
https://t.me/burrowingowl
Отделу анализа данных агентства "Москва" по ходу добычи ценной информации попался документик, который непонятно куда в новостях приспособить, но сам по себе забавный: как Анатолий Сердюков и Галина Пузикова в шахматном порядке дарят друг другу одну и ту же квартиру
Настя Ивлеева вышла замуж за Элджея, а пробили данный факт не по базе ЗАГС, а по ЕГРЮЛ — эффективный, оказалось, способ
https://www.mskagency.ru/materials/2924595
В кроссворде The New York Times накануне объявления результатов выборов президента США пункт 39 по горизонтали назывался "Главная тема в завтрашней газете" и ответить на него можно было как Clinton [Elected] (избран Клинтон), так и BobDole [Elected] (избран Боб Доул) — для этого газетчики подобрали 7 пар допустимых разных вариантов ответа на каждую букву в словах "Клинтон" и "БобДоул"
https://www.xwordinfo.com/Crossword?date=11/5/1996
С особой теплотой вспоминаю выборы в Госдуму в декабре 2011 года, потому что тогда мне удалось тряхнуть своей математико-статистической стариной и неплохо развлечься.

Дело было в Известиях: в день выборов мы запустили на сайте табло, которое в реальном времени показывало, сколько людей уже проголосовало, с точностью до человека -- последние циферки менялись как сотые доли секунд на таймере. Читатели поражались: у вас что, моментальные данные со всех избирательных участков? Ну, конечно, нет.

Это работала математическая модель, основанная на исторических данных о том, с какой интенсивностью идет голосование по стране в разное время суток, и прогнозах явки на текущие выборы. Вот эти расчётные циферки и мелькали на табло. Потом подходили промежуточные данные из ЦИК о реальной явке, и это позволяло уточнять модель прямо на ходу.

В итоге ошибка была совсем невелика -- не больше, чем у всяких сервисов, показывающих онлайн население Земли -- это ведь тоже математические модели