Журналистика данных
4.36K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Международную награду по журналистике данных сейчас можно получить за то, что о существовании интересных и доступных данных ты просто знаешь. Вот, например.

Отраслевого «Оскара» — премию Data Journalism Award — в номинации «использование данных в горячих новостях (до 36 часов от события)» получил в 2017 американский филиал Аль Джазиры за докрут новости о крушении поезда Amtrak в США в 2015 году. Состав вошел в крутой поворот на скорости 106 миль в час при разрешенных 50 и, понятно, сошел в рельсов.

Что удалось узнать Аль Джазире дополнительно к тому, что выяснили остальные СМИ? То, что за два месяца перед аварией поезда на этом повороте 45 раз превышали 50 миль в час и только один раз чуть-чуть превысили 55. И что? Машинисты знают, что в ограничения заложен запас, ну и некоторые позволяют себе слегка нарушать. Ничего нового и особенного в этом нет. Но фишка в том, как была добыта информация.

На сайте Amtrak сохраняется оперативная информация о движении поездов — вот ее-то Аль Джазира скачала, проанализировала и нарисовала. Понятно, что, когда знаешь, где лежат дровишки, все это можно сделать и быстрее. Да и сенсации по ходу обработки данных не выяснилось. Однако пока даже такая работа редкость — ее заслуженно премируют

http://america.aljazeera.com/multimedia/2015/5/map-derailed-amtrak-sped-through-northeast-corridor.html
👍1
Снова заработал сайт Международных наград по журналистике данных. Конкуренция в этом году, судя по всему, будет жестокая. Победителей всего 12, а поступило уже 573 проекта и прием заявок продлится еще полтора месяца.

Сама премия по размеру странноватая — $1801 плюс статуэтка, но дело, конечно, не в сумме. Пулитцер ведь тоже всего $10 тыс., но слава при этом на весь честной мир.
https://www.datajournalismawards.org/
👍1
Возможно, вам встречались в прессе явно неправдоподобные сравнения смертности и ее причин в России и других странах. Одна из причин — существенная разница в терминологии и методиках классификации заболеваний. Например, можно прочитать, что в России чаще, чем в США умирают от инфаркта, зато в США — чаще от самых острых форм инфаркта — а разве так может быть?

Тем, кто хочет разобраться в этом, рекомендую статью "Необходим консенсус" в номере 4 (19) "Московской медицины" за 2017 год. Статья огромная и требующая усилий для прочтения, но полезная. По ссылке можно скачать номер журнала в pdf и найти в нем статью.
http://mosgorzdrav.ru/ru-RU/journal/default/card/45.html
👍1
Сюжет для любителей конспирологии и компьютерной безопасности. Помните пост Артемия Лебедева про Телеграм — якобы вся подчеркнутая независимость мессенджера и его разбирательства со спецслужбами нужны для того, чтобы люди писали в Телеграме все, что думают, а на самом деле мессенджер совершенно прозрачен для спецслужб? Теперь нечто подобное начинают говорить про биткойн.

Обратите внимание на маленькую заметку в свежем New Scientist. Там утверждается, что исследователи из Катарского Университета, отслеживая операции с биткойном, сумели связать данные 125 пользователей "скрытой" сети, где ведется нехорошая деятельность вроде торговли оружием и наркотиками, с их аккаунтами в легальной части Сети.

Тут недалеко до озарения в духе знаменитого дизайнера. А что если биткойн, про который везде кричат, что он позволяет скрывать нехорошие операции и уход от налогов, именно для того и создан, чтобы выявлять черных торговцев и должников? Ведь они любят биткойн, остается сопоставить аккаунты... В общем, можно писать увлекательный рассказ для любителей, повторимся, конспирологии.

https://www.newscientist.com/article/mg23731644-400-dark-web-users-are-easy-to-unmask-through-their-bitcoin-use/
👍1
В мире прекрасного. Массачусетский технологический институт открыл все свои лекции, в том числе по медийке и писательскому мастерству. Читать не перечитать
https://ocw.mit.edu/courses/comparative-media-studies-writing/
Душераздирающее зрелище — журнал "Изобретатель и рационализатор". В будущем году ему исполнится 90 лет, а уже два года он не выходит на бумаге. Но редакция упорно верстает номера в формате pdf, в том числе обложку, рассчитывая, что бумажный носитель еще вернется.

Когда-то тираж журнала превышал 400 тыс. экз., а сейчас здесь публикуют платные статьи за 990 руб. Слышите гогот толпы? Это веселятся ведущие телеграм-каналов с числом подписчиков от 3000 — они за пять строчек берут больше. Так прошла земная слава издания, которое первым легально опубликовало отрывки из "Гадких лебедей" Стругацких

http://i-r.ru/
а умер Стивен Хокинг не в каком-то там Кембридже на востоке Англии — он умер на краю диска галактики Млечный Путь, примерно в 27 000 световых лет от галактического центра
Восемь лет назад открылся деловой сайт Маркер (уже закрыт), где одной из стартовых фишек была карта Мирового океана, который бороздили яхты десятка олигархов. Местоположение яхт отслеживалось практически в реальном времени, нарисовано было красиво и выглядело инновационно и где-то даже сенсационно.

Посыпались вопросы читателей: а как вы это сделали? Неужели берёте информацию прямо со спутников? Или у вас агенты на каждой яхте — капитан там, кок или старпом? Мы, помнится, очень веселились, когда всё это читали.

Смешно было не то, что читатель не может угадать технологию. Удивляло, как люди не понимают, что на такие чудовищные затраты никто ради одного материала не пойдет. Но еще больше обескураживало, что люди не видят, что ноу-хау указано на той же картинке, под картой: источник данных — сайт Marine Traffic. Мы просто выкачивали оттуда нужные данные и визуализировали их по-своему.

С тех пор прошло, как уже сказано, восемь лет, а сайт Marine Traffic широкой популярности у наших медиа не завоевал — в отличие, допустим, от Flight Radar 24. Мне кажется, это упущение. На данных Marine Traffic можно делать вещи.

http://www.marinetraffic.com
Оказывается, литературный журнал "Новый мир" до сих пор выходит, и кто-то же его героически делает ради тиража в 2000 экз. Это в 1350 раз меньше, чем на пике популярности в 1990 году
Сейчас, наверное, многие захотят сделать инфографику по нашим отношениям с США. За советский период "Аргументы и факты" проделали эту работу 4 года назад

http://static1.repo.aif.ru/1/fe/283888/e7b893eab8e495459bdb9f0c5610ae0e.jpg
Центр стратегических разработок, возглавляемый Алексеем Кудриным, выложил Стратегию развития страны 2018-2024. Продолжительность жизни к 2024 должна вырасти на пять лет, а пенсия достигнет двух прожиточных минимумов. Производительность труда увеличится на треть, несырьевой экспорт — вдвое. Время в пути от пригорода до центра крупного города сократится до 1 часа. И так далее. В общем, если хотите заглянуть в недалекое будущее — вот вам pdf
https://strategy.csr.ru/files/strategy2024.pdf
Минобороны ко Дню космонавтики рассекретило ряд документов о Юрии Гагарине. Оказывается, при росте всего 165 см будущий герой космоса сумел получить разряд по баскетболу. Ну и много другого интересного по ссылке

http://gagarin2018.mil.ru/
Предприниматели любят давать своим фирмам космические имена. Одних "Орионов" в Москве мы, погрузившись в реестры, насчитали больше сотни, хотя другие созвездия не так популярны — никто почему-то не хочет называть компанию "Большой Пёс", "Волосы Вероники" или "Южный Треугольник"
http://b1.mskagency.ru/c/211019.jpg?block_mode=iframe
Диванные аналитики своими поверхностными рассуждениями раздражают специалистов. Но для самих "аналитиков" в этом есть польза -- они учатся нестандартно мыслить. Ведь для дилетанта любое решение в незнакомой ему области -- неординарное
https://4td.fm/article/3-soveta-kak-nauchitsya-nestandartno-myslit/
Зам главного редактора ТАСС Михаил Лукин сообщил первые итоги внедрения автоматического рубрикатора новостей по экономической тематике:

- Точность (количество правильно распознанных) - 91,46%.
- Полнота (количество правильно распознанных от общего числа сообщений по данной рубрике) - 96,50%.

Цифры высокие. По нашей просьбе Михаил рассказал об истории создания автоматического рубрикатора:

"Возникло предположение, что квалифицированному потребителю нужны новости только по определенной тематике, релевантные его запросам, и за возможность получать такие новости он будет платить деньги (дабы не фильтровать вручную самому). Все агентства уже делают «тематические» ленты, но вручную — следовательно, каждый новый продукт а) влечет за собой увеличение штата; б) растет субъективный фактор при отнесении конкретной заметки к той или иной категории.

Поэтому мы решили сделать Систему Автоматической Категоризации Текстов (СКАТ). Она без участия человека в реальном времени присваивает каждому тексту тематическую и географическую рубрику (категорию). В результате потребитель может сам скомпоновать себе любую уникальную ленту - скажем, «происшествия на воздушном транспорте в Финляндии». Причем в тексте может не быть слов «Финляндия» и «авиакатастрофа», достаточно «Хельсинки» и «рухнул самолет». Поскольку понятия выстроены по иерархии, система поймет, что Хельсинки относится к Финляндии, а «рухнул самолет» - к авиапроисшествиям. Также система отличит однофамильцев, синонимы и пр."

СКАТ сделан на базе системы ГИТИКа разработки компании «Рилтим», автор идеи Валерий Бардин. По опыту «боевой» эксплуатации на реальном новостном потоке, утверждает Михаил Лукин, СКАТ работает точнее, чем аналоги в других СМИ.
The Guardian визуализировала рост показателей Amazon, назвав свой материал "Как Amazon стал самой дорогостоящей розничной компанией". Выглядит неплохо, но на самом деле ответа на вопрос КАК? в материале-то и нет. Успехи компании Джеффа Безоса просто констатированы. Ещё один незачёт — за счётчик количества операций Amazon "пока вы смотрите этот материал" — в 2018 году это уже выглядит пошловато
https://www.theguardian.com/technology/ng-interactive/2018/apr/24/bezoss-empire-how-amazon-became-the-worlds-biggest-retailer
Трамп Таун — база данных по более 3000 сотрудников и приближенных президента США, собранная медиа- группой ProPublica. Всё что нужно: фамилия, имя, должность, зарплата, подробное раскрытие доходов, прежние места работы, кого лоббирует. Например, старший советник по сельскому хозяйству Ребекка Адкок имеет зп $170 тыс. в год. Жить можно
https://projects.propublica.org/trump-town
Недавно мы рассказывали об автоматическом рубрикаторе новостей ТАСС, для интересующихся вот некоторые дополнительные подробности. В предыдущем посте презентация проекта, а здесь по ссылке — фундаментальная статья по теме Симона Кордонского и Валерия Бардина
http://www.logosjournal.ru/arch/81/105_2.pdf
Евровидение стартует сегодня, а Google уже знает результаты. Сотрудники поисковика составили итоговую таблицу, исходя из того, как в разных странах гуглят песни, которые будут участвовать в конкурсе. В чем-то такой подход даже корректнее, чем официальный, потому что он свободен от политических пристрастий голосующих народов и вкусовых предпочтений профессионального жюри. Google насчитал первое место Израилю, затем Чехия и Норвегия. Россия займет 8-е место. Ну, поживём увидим
https://googletrends.github.io/eurosearch-2018/?utm_source=The+Den+Bulletin&utm_campaign=930d73cd47-EMAIL_CAMPAIGN_2018_05_04&utm_medium=email&utm_term=0_01a9377b12-930d73cd47-150041041
После недавних заявлений Мосгорсуда, что к рассмотрению дел начнут привлекать искусственный интеллект, по прессе прокатилась волна алармистских публикаций с вопросом, а не начнут ли бездушные машины засуживать невиновных.

Смешно. Речь пока идет только о так называемых бесспорных делах, когда от судьи требуется лишь проверить документ и поставить подпись. Это и поручат бездушному роботу. Настоящая же моральная проблема для систем искусственного интеллекта актуальна совсем в другой области — среди самоуправляемых автомобилей.

Вот на дороге действительно будут возникать ситуации, когда роботу-водителю придётся делать нелёгкий выбор: задавить одного или двоих пешеходов; убить пешехода или пассажира; старого или молодого; мужчину или женщину; дорого одетого менеджера или бомжа. Привить мораль роботу, конечно, нельзя, но можно научить его действовать так, как скорее всего действовал бы на его месте человек.

С этой целью в Массачусетском технологическом институте создали "Машину морали", которую поучить может любой желающий. На основе сценариев поведения людей в пиковых ситуациях будет создана инструкция для робота. Присоединяйтесь, это довольно увлекательно
http://moralmachine.mit.edu/hl/ru