Журналистика данных
4.38K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Эволюция периодической системы элементов в исполнении журнала Science. Важная наглядная деталь — показано, как со временем меняется не только количество открытых элементов, но и, так сказать макет самой таблицы
https://vis.sciencemag.org/periodic-table/
Интереснейшая история, но в то же время и пример, как сильно иногда не хватает анимированной графики. Читатель вынужден слишком напрягать воображение, имея в распоряжении только аэрофотосъемку
https://www.bbc.com/russian/features-47169351
Резюмируя по хайпу имени посадки на лицо. В отличие от 9 яиц, он был искусственным. Птицефабрике "Вараксино" -- название помнит ли кто? -- от январской истории ничего не было нужно, она ее не придумывала и сама удивилась. Пыталась ли она объегорить покупателей, не умеющих быстро делить на девять и умножать на десять, или нет -- необходимости в хайпе не было по-любому.

Другое дело Reebok, который осознанно заказал эпатажную пиар-кампанию. Тот факт, что sex sells, известен сто лет в обед. Скорее всего пиарщики Reebok читали и отчет McKinsey & Co о трендах моды на 2019 год -- в таких компаниях такие отчеты всегда читают. А там сказано: количество упоминаний феминизма на сайтах и в рассылках ритейлеров выросло за два года в 6 раз. Бума фемовской темы просто невозможно не видеть.

Сомнений, что в Reebok хотели на этом прокатиться, таким образом, не возникает. Однако эффект резко превзошел ожидания заказчиков, вышел из-под их контроля и судя по всему даже напугал. Хотели взорвать атомную пиар-бомбу, а бабахнула водородная. О том, чтобы использовать взрыв для блага компании, никто даже не пытается говорить.

Ошибка в недооценке такого фактора, как удар по некоему социальному стереотипу, который как на перекличке комментируют все его адепты и хейтеры. Они ведь только и ждут повода в очередной раз его подтвердить или опровергнуть. Именно они обеспечивают взрывное распространение темы. Дальше, как в цепной реакции, к обсуждению подключаются диванные эксперты и шутники. Суждения "штатных" адептов и хейтеров часто доведены до абсурда и звучат гротескно -- ну как не поглумиться?

Все это замечательно, но чопорные корпоративные уставы не приемлют звучащей в ходе хайпа лексики. Когда вековой бренд легко оказывается в одном ряду с такими понятиями, как расизм, фашизм и сексизм, c пожеланиями убиться об стену, "сдохни, мразь!" и прочими лучами диареи. Тут-то корпоративщики пугаются, врубают заднюю и неловко оправдываются. А, может, не надо? Донт би соу сириус. Уже назавтра вы увидите хейтера и адепта за одним столиком в кафе, со смехом обсуждающих "как мы годно похайпили". Хайпы надо изучать и использовать, а не бояться их.
Статистика для настоящих буквоедов. Частоты употребления букв в зависимости от языка и положения в слове. Кажется, методика может пригодиться для изучения больших текстов самой разной природы
http://www.prooffreader.com/2014/07/comparison-of-letter-positions-in-eight.html
413747.jpg
183.7 KB
Данные по посещаемости наиболее популярных выставок в Москве. Серов совсем и не чемпион
Первое выступление Владимира Путина с посланием Федеральному собранию в 2000 году было самым кратким — 5 тыс. 146 слов, 48 минут. А в 2018 году самым объемным — 11 тыс. 428 слов, 1 час 55 минут

Наиболее часто используемыми в посланиях словами были: государство (2000 год, 97 раз), экономика (2003 год, 61 раз), справедливость (2005 год, 17 раз), кризис (2008 год, 17 раз), демократия (2008 год, 26 раз), Россия (2018 год, 107 раз), безопасность (2018 год, 11 раз)

(по подсчётам ТАСС)
Пример недоработанной дата-заметки. Даже обидно, потому что замысел хороший -- посмотреть, откуда больше всего переезжают в Москву.

Точные данные тут вообще не собрать, как справедливо отмечает автор, но можно сделать оценку, исходя из данных в профайлах "ВКонтакте" -- сравнить место рождения человека с местом нынешнего проживания. Тут тоже много чего не учитывается -- например, совершенно непонятно, а когда человек переехал, и вообще не врёт ли он, но в принципе можно допустить, что все города-доноры в этом смысле равны. Далее инфа собирается -- и из нее почти ничего не следует.

Разве кто-то сомневался, что из Питера переехало в Москву в несколько раз больше людей, чем из Краснодара? Конечно, нет -- просто потому, что в Питере живет в 7 раз больше людей, чем в Краснодаре.

Иначе говоря, нужен удельный показатель -- количество переехавших на 100 000 населения города-донора. И тут оказывается, что из Краснодара люди едут в Москву на 30% интенсивнее, чем из Питера. Интересные данные, которые хотелось бы объяснить. Равно как и узнать, а из какого города едут интенсивнее всего.

Увы, такого анализа в заметке нет
https://strelkamag.com/ru/article/stolichnyi-dreif-iz-kakikh-gorodov-priezzhayut-zhit-v-moskvu
Визуализация борьбы за топ-15 самых дорогих мировых брендов. Завораживающий ролик длится пять с хвостом минут, но, кому нравится всякая корпоративная цифирь, тот не заметит, как они пролетят
https://www.youtube.com/watch?v=BQovQUga0VE
До окончания приёма заявок на шестой по счёту конкурс Data Journalism Awards осталось немногим более месяца. Тем временем организаторы решили вспомнить минувшие пять лет -- основные тенденции и самые яркие проекты. Вполне полезная ретроспектива
https://datajournalismawards.org/2019/02/07/5-years-of-winning-data-journalism/
Вот пишут, как стать идеальным дата-журналистом. Прежде всего, нужно быть идеальным обычным журналистом. Кроме того, нужно быть сильным лидером и менеджером. А еще нужно быть крутым дизайнером и разработчиком. Наконец, совершенно необходимо быть математиком, географом, социологом, урбанистом, лицензированным медработником, пожарным и мошенником. Чувство юмора тоже в кассу
https://journocode.com/2019/02/22/how-to-become-the-perfect-data-journalist/
Есть такой парень -- Лесли Робертс. Он визуализирует тексты. Ничего особенно хитрого: "Если я вижу букву А, то рисую красный квадратик, ну и так далее". Тем не менее он участвовал в куче выставок, в том числе организовал в Бруклине несколько сольных. И ведь искусствоведы в его картинах находят некий смысл
https://leslierobertsart.com/section/425019-Paintings-2016-18.html
В коллекцию полезных ссылок по тематике. То ли электронный журнал, то ли коллективный блог, короче говоря, полезный сайт
https://towardsdatascience.com/
Яндекс запустил поиск по патентам. В базе 2,5 млн документов с 1924 года. Настоящее месторождение тем для маленьких смешных заметок. Просто находите какой-нибудь "биоэнергомодулятор" и раскрываете тему
https://yandex.ru/patents
Забавное следствие из практики блокировки сайтов с компроматом. В судебном решении ведь содержится мотивировка, соответственно, приводятся сами отрывки компромата. Плохие сайты потом блокируются, но в базе арбитражных дел полный текст решения заботливо сохраняется (см. ссылку). По идее, суд должен бы и эту страничку заблокировать, но тогда уже и по этому делу придется писать мотивировку и еще раз повторить весь компромат. И так до бесконечности
http://kad.arbitr.ru/PdfDocument/801476bc-d104-4811-9433-20bd768f85e7/ff1e96b3-8003-44f5-8a45-0de01c403068/A56-121229-2018_20181116_Reshenie.pdf
Каталог экспонатов государственных музеев. Например, я с его помощью установил, что в наших музеях нет ни одного электрического стула (макеты и поделки не в счёт)
https://goskatalog.ru
Симпатичная мультяшная визуализация на тему, чем занимаются мужчины и женщины в течение суток. Непонятно только, к какому направлению отнесено занятие сексом — personal care или household care
https://flowingdata.com/2019/03/06/women-men-timeuse/
Для желающих разбираться в факторах, определяющих стоимость жилья и его аренды, ну и вообще в урбанистике — блог профессора из Амстердама. В последней по времени заметке — анализ влияния Airbnb на краткосрочную аренду
https://www.urbaneconomics.nl/articles/
Книгу Альберто Кейро "Как врут диаграммы" можно уже предзаказать. С текстом я пока не знаком, но автор специалист грамотный. Да и отзывы по ссылке внушают
http://www.thefunctionalart.com/2019/02/new-book-and-new-public-lecture.html?m=1
Forwarded from Журналистика
Коротко о том, какими инструментами для автоматической работы с большим количеством данных используют в редакциях мировых СМИ, чтобы разгрузить журналистов от рутины.

Bloomberg: система Cyborg — мгновенное выявление изменений в доходах компаний и представление данных в нужном контексте.

Tamedia: бот Tobi — выпуск 40 тысяч новостей о результатах ноябрьских выборов 2018 года в Швейцарии за 5 минут.

Washington Post: программа Heliograf — ежедневный охват новостей спорта, бизнеса и политики, начиная с 2014 года.

Associated Press: программа для автоматизации обработки ежеквартальных отчетов о прибылях около 3 тысяч компаний.

Reuters: Lynx Insight — выявление тенденций и рекомендация тем для журналистов.

Источник: Yahoo News, AFP.
Сегодня 3.14 -- день числа "пи". По ссылке -- база данных рекордсменов-запоминателей. В первой десятке каждый знает более чем по 20 тыс. цифр. Зачем это им нужно, не знаю -- подозреваю, что это Аспергер такой
@digitalfan

http://pi-world-ranking-list.com/index.php?page=lists&category=pi&sort=digits