Журналистика данных
4.38K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Масштабы работы с данными в таксомоторном агрегаторе Uber : информация от 2+ млн водителей в 700+ городах из 70+ стран собирается и обрабатывается в почти-реальном времени, то есть с задержкой 5-10 минут, причем в компании утверждают, что быстрее уже и не надо. Общий объем данных на серверах Uber — более 100 петабайт. Страшно подумать, сколько там тем для заметок
https://conferences.oreilly.com/strata/strata-ny-2018/public/schedule/detail/70937
Многие боятся, что искусственный интеллект скоро станет таким умным, что замыслит неладное, и тогда нам крышка. Между тем бояться нечего, ну или бояться нужно другого — что сама идея ИИ сойдет на нет от излишней популяризации и профанации. Сначала нейросети напрягли рисовать аватарки, ну а теперь появилось совместное творчество людей и ИИ в области модной одежды

https://medium.com/@howtogeneratealmostanything/human-ai-collaborated-fashion-4b2ab94453ed?stream=future
Качественный расклад по памятникам в Москве на основе данных Яндекса
Суммарные доходы поставщиков бигдаты в 2018 году по всему миру составят $65 млрд, а в 2021 году — $96 млрд, говорится в отчете The Big Data Market. Судя по тому, что этот 549-страничный документ продается за 8,880 евро, рынок обзоров рынка бигдаты тоже чувствует себя неплохо
https://www.researchandmarkets.com/research/6qgjf8/big_data_market?w=5
Forwarded from Детали
Согласно данным, опубликованным министерством здравоохранения, в Израиле на 1 000 человек приходится 2,2 больничных койки, в то время как в странах OECD — 3.6 коек на 1 000 человек. Уровень заполняемости коек в отделениях больниц в Израиле составляет 94 процента — второй по величине показатель среди стран OECD, после Ирландии. В среднем по странам организации уровень заполняемости достигает 75,5 процентов. В министерстве здравоохранения признаются, что даже если правительственная программа будет полностью реализована и к 2022 году в израильских больницах появятся еще 1 200 коек, это в лучшем случае поможет сохранить уровень заполняемости на нынешнем уровне, но никак не снизить.
http://detaly.co.il/za-dva-goda-vsego-180-novyh-koek/
Феминизм добрался до анализа данных. Книга так и называется — Data Feminism. Она предваряется довольно мутным, на мой взгляд, рассуждением, что феминизм не сводится только к вопросам пола, а это вопрос о власти. Данные же тоже дают власть, вот вам и связь. Но это только первое впечатление от вступления, может быть, стоит почитать произведение подробнее, чтобы понять мысль авторов
https://bookbook.pubpub.org/data-feminism
Новейшая история России через данные о поголовье скота
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера портал открытых данных Цюриха опубликовал 50 тысяч 3D-моделей зданий города bit.ly/2PTdQ9r
Зимой 1944 в Москве падали круглые снежные хлопья до 10 см в поперечнике — такое возможно только при абсолютном безветрии, малейший ветер ломает хлопья
Девушка Мишель Чандра придумала увлекательное дата-развлечение — она рисует лабиринты на основе реальных данных о городских улицах. Лабиринты эти разрешимы — все-таки в нормальном городе есть возможность проехать откуда угодно куда угодно, но не всегда эта задача такая уж легкая
https://www.dirtalleydesign.com/pages/about
Инфографика в пастельных тонах от Washington Post — количество лет жизни, которые теряют граждане разных стран из-за грязного воздуха. Данные в целом нестрашные. Так, в России больше года теряют 95% населения, а больше двух лет — 8% , но разве нас это удивляет? Скорее это оптимистичная картина. Да и вообще мода на алармизм прошла — никому не втюхаешь страшилку, что завтра небо упадет в Дунай, а горы обратятся в пыль. Интереснее нормальная, симпатично представленная информация
https://www.washingtonpost.com/graphics/2018/national/health-science/lost-years/?utm_term=.67e1762d34ec
Ссылка, которая без ложной скромности называется "классные публичные датасеты". Но это и правда так — действительно классные, и в огромном количестве
https://github.com/awesomedata/awesome-public-datasets
Общий счет побед и поражений за 1158 лет (с 860 до 2018 г.) оказался в нашу пользу. Вышло огромное исследование по военным кампаниям России
https://www.runivers.ru/gal/today.php?ID=595724
История о том, как собрать несколько сотен дата-журналистов для работы над совместным проектом. Сначала пробиваешь твиттер по тематическим хештегам, затем очищаешь информацию (например, кто-то указал дата-журналистику, а сам ею не занимается), наконец, сортируешь по странам и интересам. Все просто, но если это работает и виртуальные коллективы действительно оказываются работающими, то почему бы и нет
https://onlinejournalismblog.com/2018/11/27/how-periodista-de-datos-aggregated-over-300-journalists-in-spain-and-latin-america-to-help-data-journalism-collaboration/
Точно подсчитать количество мужчин 16-60, которых касается ограничение въезда на Украину, не получится — в таблицах Росстата приведены градации по 5 лет, в том числе 15-19 и 60-64, то есть лишние хвосты, приходящиеся на 15 и 61-64 года, нужно оценивать приближенно. Плюс учитываем поправку на количество женщин по возрастным категориям — как известно, до 35 лет у нас мужчин больше, а дальше наоборот. В общем, примерно прикинул — получилось, что забанили где-то 42 млн мужчин
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/#
Кури больше — проживешь дольше?

Презентация выступления товарища из Университета Майами на недавней конференции по журналистике данных в Бразилии. Поднимается вопрос, как избежать парадокса Симпсона — когда объединение наборов данных с понятными закономерностями приводит к ложным выводам. Пример — график, где отмечена продолжительность жизни в разных странах и количество выкуриваемых жителями сигарет. Из него можно сделать ошибочное заключение, что потребление табака продлевает жизнь. На самом же деле люди живут дольше в странах в большим ВВП — и курят там тоже больше

https://drive.google.com/file/d/1PrDaDBkuJ2BPq91jLivfZJ3bJh96_9L3/view