Журналистика данных
4.38K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Пример недоработанной дата-заметки. Даже обидно, потому что замысел хороший -- посмотреть, откуда больше всего переезжают в Москву.

Точные данные тут вообще не собрать, как справедливо отмечает автор, но можно сделать оценку, исходя из данных в профайлах "ВКонтакте" -- сравнить место рождения человека с местом нынешнего проживания. Тут тоже много чего не учитывается -- например, совершенно непонятно, а когда человек переехал, и вообще не врёт ли он, но в принципе можно допустить, что все города-доноры в этом смысле равны. Далее инфа собирается -- и из нее почти ничего не следует.

Разве кто-то сомневался, что из Питера переехало в Москву в несколько раз больше людей, чем из Краснодара? Конечно, нет -- просто потому, что в Питере живет в 7 раз больше людей, чем в Краснодаре.

Иначе говоря, нужен удельный показатель -- количество переехавших на 100 000 населения города-донора. И тут оказывается, что из Краснодара люди едут в Москву на 30% интенсивнее, чем из Питера. Интересные данные, которые хотелось бы объяснить. Равно как и узнать, а из какого города едут интенсивнее всего.

Увы, такого анализа в заметке нет
https://strelkamag.com/ru/article/stolichnyi-dreif-iz-kakikh-gorodov-priezzhayut-zhit-v-moskvu
Визуализация борьбы за топ-15 самых дорогих мировых брендов. Завораживающий ролик длится пять с хвостом минут, но, кому нравится всякая корпоративная цифирь, тот не заметит, как они пролетят
https://www.youtube.com/watch?v=BQovQUga0VE
До окончания приёма заявок на шестой по счёту конкурс Data Journalism Awards осталось немногим более месяца. Тем временем организаторы решили вспомнить минувшие пять лет -- основные тенденции и самые яркие проекты. Вполне полезная ретроспектива
https://datajournalismawards.org/2019/02/07/5-years-of-winning-data-journalism/
Вот пишут, как стать идеальным дата-журналистом. Прежде всего, нужно быть идеальным обычным журналистом. Кроме того, нужно быть сильным лидером и менеджером. А еще нужно быть крутым дизайнером и разработчиком. Наконец, совершенно необходимо быть математиком, географом, социологом, урбанистом, лицензированным медработником, пожарным и мошенником. Чувство юмора тоже в кассу
https://journocode.com/2019/02/22/how-to-become-the-perfect-data-journalist/
Есть такой парень -- Лесли Робертс. Он визуализирует тексты. Ничего особенно хитрого: "Если я вижу букву А, то рисую красный квадратик, ну и так далее". Тем не менее он участвовал в куче выставок, в том числе организовал в Бруклине несколько сольных. И ведь искусствоведы в его картинах находят некий смысл
https://leslierobertsart.com/section/425019-Paintings-2016-18.html
В коллекцию полезных ссылок по тематике. То ли электронный журнал, то ли коллективный блог, короче говоря, полезный сайт
https://towardsdatascience.com/
Яндекс запустил поиск по патентам. В базе 2,5 млн документов с 1924 года. Настоящее месторождение тем для маленьких смешных заметок. Просто находите какой-нибудь "биоэнергомодулятор" и раскрываете тему
https://yandex.ru/patents
Забавное следствие из практики блокировки сайтов с компроматом. В судебном решении ведь содержится мотивировка, соответственно, приводятся сами отрывки компромата. Плохие сайты потом блокируются, но в базе арбитражных дел полный текст решения заботливо сохраняется (см. ссылку). По идее, суд должен бы и эту страничку заблокировать, но тогда уже и по этому делу придется писать мотивировку и еще раз повторить весь компромат. И так до бесконечности
http://kad.arbitr.ru/PdfDocument/801476bc-d104-4811-9433-20bd768f85e7/ff1e96b3-8003-44f5-8a45-0de01c403068/A56-121229-2018_20181116_Reshenie.pdf
Каталог экспонатов государственных музеев. Например, я с его помощью установил, что в наших музеях нет ни одного электрического стула (макеты и поделки не в счёт)
https://goskatalog.ru
Симпатичная мультяшная визуализация на тему, чем занимаются мужчины и женщины в течение суток. Непонятно только, к какому направлению отнесено занятие сексом — personal care или household care
https://flowingdata.com/2019/03/06/women-men-timeuse/
Для желающих разбираться в факторах, определяющих стоимость жилья и его аренды, ну и вообще в урбанистике — блог профессора из Амстердама. В последней по времени заметке — анализ влияния Airbnb на краткосрочную аренду
https://www.urbaneconomics.nl/articles/
Книгу Альберто Кейро "Как врут диаграммы" можно уже предзаказать. С текстом я пока не знаком, но автор специалист грамотный. Да и отзывы по ссылке внушают
http://www.thefunctionalart.com/2019/02/new-book-and-new-public-lecture.html?m=1
Forwarded from Журналистика
Коротко о том, какими инструментами для автоматической работы с большим количеством данных используют в редакциях мировых СМИ, чтобы разгрузить журналистов от рутины.

Bloomberg: система Cyborg — мгновенное выявление изменений в доходах компаний и представление данных в нужном контексте.

Tamedia: бот Tobi — выпуск 40 тысяч новостей о результатах ноябрьских выборов 2018 года в Швейцарии за 5 минут.

Washington Post: программа Heliograf — ежедневный охват новостей спорта, бизнеса и политики, начиная с 2014 года.

Associated Press: программа для автоматизации обработки ежеквартальных отчетов о прибылях около 3 тысяч компаний.

Reuters: Lynx Insight — выявление тенденций и рекомендация тем для журналистов.

Источник: Yahoo News, AFP.
Сегодня 3.14 -- день числа "пи". По ссылке -- база данных рекордсменов-запоминателей. В первой десятке каждый знает более чем по 20 тыс. цифр. Зачем это им нужно, не знаю -- подозреваю, что это Аспергер такой
@digitalfan

http://pi-world-ranking-list.com/index.php?page=lists&category=pi&sort=digits
Фича для озвучивания данных. Зачем это нужно -- слушать, к примеру, как звучит график производства мёда в США, толком непонятно, но вдруг кому-то такое понравится либо удастся извлечь пользу. Пока польза очевидна только для ситуаций, когда сами данные изначально "звучащие" -- например, это могут быть данные о стрельбе или сигналах транспортных средств
https://twotone.io/
Forwarded from Журналистика
Сервис TGStat серьезно переработал функцию поиска по публикациям в Telegram — https://tgstat.ru/search

Поиск можно осуществлять, например, исключая репосты и минус-слова. Выдача теперь содержит графики упоминаний искомых запросов, охвата упоминаний и каналы, в которых они встречаются. И, главное, функция остается бесплатной.

Полный список изменений: https://t.me/tg_analytics/226
Визуализация данных о корзине потребления британских хипстеров. И кто, как вы думаете, сделал этот красочный лонгрид? Не СМИ и не консалтеры, а сам британский Госкомстат, если так можно выразиться. Причем помимо интересных данных, реализован любопытный визуальный эффект с подсветкой основной фотки при вращении колёсика мыши. Вот так чиновники становятся конкурентами дата-журналистам
@digitalfan
https://www.ons.gov.uk/visualisations/dvc399/shorthand/index.html
Мощный портал данных о беженцах
https://data2.unhcr.org/en/situations

И чтобы два раза не вставать еще один — о мигрантах
https://missingmigrants.iom.int/
Визуализация данных о нефтяных запасах стран мира. Для интересующихся есть также краткое объяснение, что счастье не только в запасах, но и в стоимости их извлечения
https://www.visualcapitalist.com/map-countries-most-oil-reserves/