Журналистика данных
4.38K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Forwarded from Тайны Космоса 🔭
This media is not supported in your browser
VIEW IN TELEGRAM
Статистика запусков космических аппаратов по странам, начиная с начала космической эры и по настоящий год.
Forwarded from Журналистика
This media is not supported in your browser
VIEW IN TELEGRAM
Оформление исследования Financial Times «Лондонское метро: самое грязное место в городе». Оно показывает, что в некоторых местах загрязнение воздуха в 8 раз превышает санитарные нормы.

Материал целиком: https://on.ft.com/2NluL2u

Внутри — схемы, графики и фотографии, а также техническая иллюстрация станции Кингс-Кросс. Иллюстратор — Ian Bott.
Надо сказать, что, хотя работа над электронной версией Большой российской энциклопеции ещё только началась, БРЭ уже высоко стоит в поисковиках. Подробное исследование пока не могу провести, но на ряде примеров все выглядит именно так. Когда слова — допустим, "хуася" (предки китайцев) — в Википедии нет, но БРЭ стоит на первом месте. Если же слово в Вики есть — например, "Хуа Гофэн" (китайский политик) — то выше пока что стоит Вики, но БРЭ уже выше Кругосвета.

Подождем, впрочем, более полных исследований
Это 735 323 книги из Амазона, между которыми установлено 10 316 775 связей. Трудно сказать, что всё это значит с точки зрения чистой науки, но красота неописуемая.

По ссылке в статье еще несколько шикарных примеров:
https://www.popmech.ru/science/8242-matematika-kak-iskusstvo-chto-skryvaetsya-za-tsiframi
Сергей Собянин осмотрел ход работ по подготовке Московских центральных диаметров к запуску. Вместе с мэром Москвы в мероприятии принял участие губернатор Подмосковья Андрей Воробьев и глава РЖД Олег Белозеров.

«Мы активно работаем над запуском первых МЦД: МЦД-1 и МЦД-2. Идет реконструкция подвижных путей, станций, и, самое главное, коллеги сегодня представляют новый вид подвижного состава – «Иволгу», которая уже модернизирована под МЦД. Мы заложили самые высокие требования к этому поезду, выше, чем даже к известной всем «Ласточке», которая производится, в основном, Siemens и частично локализована в России. Это будет новый этап развития транспортного машиностроения», - сказал Собянин.

Главное по МЦД:

🔹первые два маршрута – из Одинцово в Лобню и из Нахабино в Подольск – планируется запустить до конца этого года.

🔹первый и второй МЦД – это 132 км путей, 57 станций, 19 пересадок на станции метро, МЦК и радиальные направления железной дороги.

🔹время в пути по МЦД-1 (52 км) составит 80 минут, на первом этапе будет ходить 15 «Иволг». Поездка по МЦД-2 (80 км) займет около 116 минут, по магистрали запустят 24 поезда.

🔹в будущем количество станций на первых двух МЦД планируют увеличить до 66, а число пересадок – до 27.
Forwarded from Digital Review
Тут ребята из @Yandex проанализировали поисковые запросы россиян за год и выяснили непредсказуемое: в столице и Петербурге чаще всего ищут Telegram, а в регионах – WhatsApp с небольшими вкраплениями Viber. Распределение интересное, но напомню, что MAU упомянутых мессенджеров все еще различается в разы.
А тем временем Глобальная сеть редакторов, которая ежегодно проводила Data Journalism Award, приказала долго жить, потому что кончились деньги. Однако её начальник Бертран Пекери заявил, что оптимистино смотрит на будущее отрасли. Мы, в общем-то, тоже

https://www.globaleditorsnetwork.org/about-us/farewell/
Когда нет ресурсов или желания исследовать реальный мир — исследуй поведение юзеров в сети, благо данные под рукой. И вовсе не обязательно получится скучно. Вот, например, свежее исследование, как смеются юзеры, точнее, какими записями они выражают смех.

Лидер тот же, что и десять лет назад — LOL. Но если тогда на его долю приходилось менее 30% всех проявлений сетевого смеха, то сейчас уже более 55%. Десять лет назад LOL'у еще наступало на пятки haha со своими 23% и затем его популярность тоже какое-то время росла, но, достигнув пика в 2013 году, она пошла на спад, LOL получил всю власть

Специалисты считают, что успех именно этого буквосочетания связан с тем, что "оно доброе, оно смягчает противоречия, добавляет к словам тонкий смысл и вызывает сочувствие". Ну что сказать — LOL

https://pudding.cool/2019/10/laugh/
Forwarded from Ivan Begtin (Ivan Begtin)
Максим Акимов назвал сайт Госуслуг вторым по посещаемости госсайтом в мире [1] и что только посещаемость сайта налоговой службы США (IRS) выше в период сдачи деклараций.

Как бы это аккуратнее прокомментировать. В общем-то не сайт IRS наиболее популярный госсайт в США. Там первыми по списку идут:
- ncbi.nlm.nih.gov - 183 миллионов посещений за 30 дней
- tools.usps.com - 145 миллионов посещений за 30 дней
- medlineplus.gov - 51 миллион посещений за 30 дней
и так далее, полный список на специальном сайте [2]

Возможно у IRS есть и всплески в периоды подачи деклараций, но дело в том что у портала Госуслуг нет никакого общедоступного счетчика. Ни внутреннего, ни внешнего, несмотря на наличие подключенной Яндекс Метрики. Если сравнить gosuslugi.ru и irs.gov через Similarweb к примеру [3], то окажется что Госуслуги значительно более посещаемый ресурс, спору нет. Но если мы сравним его с сайтом Минздрава США (nih.gov) поддоменом которого является PubMed (ncbi.nlm.nih.gov), глобальная библиотека публикаций по здравоохранению, то gosuslugi.ru будут не так хороши [4].

Врядли Максим Акимов сам готовил эти цифры, но тем кто готовил ему выступление большой и жирный минус. А портал Госуслуг действительно один из наиболее посещаемых госпорталов в мире, с этим спору нет при любом раскладе. И счётчик его посещаемости давно бы пора, для приличия, открыть.

Ссылки:
[1] https://www.vedomosti.ru/politics/news/2019/11/19/816637-akimov-nazval-gosuslugi-vtorim-po-poseschaemosti-gosresursom
[2] https://analytics.usa.gov/
[3] https://www.similarweb.com/website/gosuslugi.ru?competitors=irs.gov
[4] https://www.similarweb.com/website/gosuslugi.ru?competitors=nih.gov

#data #webstats #government
Как меняется население Манхеттена в течение недели. Вполне можно за графику сердечных ритмов принять

https://twitter.com/dr_keithmcnulty/status/1195415172380340224
Forwarded from ВОРЧ
В сети появилась база жертв нацизма (насчитывает более 10 млн человек). Поиск можно осуществлять по фильтрам: национальности, религии и семейному положению.

База доступна на английском и немецком языках.
https://collections.arolsen-archives.org/en/search/
Кстати, участие в переписи поддерживаю двумя руками — именно как чел, работающий с данными. Вы можете сомневаться в качестве управления даже при хороших исходных данных, но без них норм управления не будет точно
https://www.youtube.com/watch?v=2uTHGX_hrio
This media is not supported in your browser
VIEW IN TELEGRAM
Ну прямо завораживает. Продолжительность светового дня в зависимости от географической широты. Подробности, в том числе расчетная формула, тут — https://www.reddit.com/r/dataisbeautiful/comments/duax05/oc_hours_of_daylight_as_a_function_of_day_of_the/
Свежий отчет "Платформы" об исследовании ожиданий общества и бизнеса от космоса. Помимо содержательной стороны, интересная сама методика — это не простой статистический социологический опрос с целью узнать, сколько граждан поддерживают ту или иную точку зрения. Здесь выяснялись сами существующие точки зрения — разных экспертов опрашивали до тех пор, пока мнения не начали повторяться. А вот теперь, когда весь спектр мнений собран, можно опрашивать тысячи граждан для определения количественных характеристик темы
http://pltf.ru/wp-content/uploads/2019/11/otchet_26.11.1500.pdf
Всем, кто имеет дело с данными и статистикой, на День благодарения полезно вспомнить рассуждение Нассима Талеба из "Черного лебедя":

Представьте себе ход мыслей индейки, откармливаемой на убой. День ото дня ей дают всё больше зерна (как на графике), это продолжается 999 дней. Неглупая вроде бы птица делает вывод — тенденция продлится дальше. И вот тут-то ей, в четвертый четверг ноября, и отрубают голову.

Так что в статистике главное это понимание сути явления, а расчеты всяких там трендов — дело техники
Forwarded from Журналистика
Reuters: Еврокомиссия начала разбирательство в отношении Google. Антимонопольные органы интересует использование и монетизация данных технологической компанией.

Речь идет о данных, связанных с интернет-рекламой, услугами таргетинга онлайн-рекламы, услугами входа в систему, веб-браузерами и т. д.

«Комиссия направила компаниям опросники в рамках предварительного расследования, касающегося применяемых Google методов сбора и использования данных», — говорится в тексте документа.

Напомним, за последние два года Google были выписаны штрафы на общую сумму более 8 млрд евро.
В номинации "Журналистские жанры" уходящий год, на мой взгляд, стал годом интервью. Новости, репортажи и расследования слегка подвинулись. Причем фигурой 2019-го стал не Дудь -- он скорее звезда прошлого года и локомотив моды на жанр, в котором сейчас тон задают проекты "А поговорить?", "Ещё не Познер", "Русские норм" и ряд других, в том числе, кстати, в телеге.

Внутри же самого жанра отрабатывается новый запрос -- на настоящих, а, следовательно, непростых и неоднозначных людей. В сплошную черную или белую краску сегодняшний потребитель интервью не верит. Слегка спекулятивно можно предположить, что этому запросу ответила, а затем и усилила его "Игра престолов", где хоть Старки, хоть Ланнистеры одновременно и ангелы, и черти -- но интересные
Зависимость свободы передвижения от благосостояния. Данные Мирового банка и Henley Passport Index по ВВП на душу в разных государствах и количеству стран, куда из них можно поехать без визы