Журналистика данных
4.36K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Трамп Таун — база данных по более 3000 сотрудников и приближенных президента США, собранная медиа- группой ProPublica. Всё что нужно: фамилия, имя, должность, зарплата, подробное раскрытие доходов, прежние места работы, кого лоббирует. Например, старший советник по сельскому хозяйству Ребекка Адкок имеет зп $170 тыс. в год. Жить можно
https://projects.propublica.org/trump-town
Недавно мы рассказывали об автоматическом рубрикаторе новостей ТАСС, для интересующихся вот некоторые дополнительные подробности. В предыдущем посте презентация проекта, а здесь по ссылке — фундаментальная статья по теме Симона Кордонского и Валерия Бардина
http://www.logosjournal.ru/arch/81/105_2.pdf
Евровидение стартует сегодня, а Google уже знает результаты. Сотрудники поисковика составили итоговую таблицу, исходя из того, как в разных странах гуглят песни, которые будут участвовать в конкурсе. В чем-то такой подход даже корректнее, чем официальный, потому что он свободен от политических пристрастий голосующих народов и вкусовых предпочтений профессионального жюри. Google насчитал первое место Израилю, затем Чехия и Норвегия. Россия займет 8-е место. Ну, поживём увидим
https://googletrends.github.io/eurosearch-2018/?utm_source=The+Den+Bulletin&utm_campaign=930d73cd47-EMAIL_CAMPAIGN_2018_05_04&utm_medium=email&utm_term=0_01a9377b12-930d73cd47-150041041
После недавних заявлений Мосгорсуда, что к рассмотрению дел начнут привлекать искусственный интеллект, по прессе прокатилась волна алармистских публикаций с вопросом, а не начнут ли бездушные машины засуживать невиновных.

Смешно. Речь пока идет только о так называемых бесспорных делах, когда от судьи требуется лишь проверить документ и поставить подпись. Это и поручат бездушному роботу. Настоящая же моральная проблема для систем искусственного интеллекта актуальна совсем в другой области — среди самоуправляемых автомобилей.

Вот на дороге действительно будут возникать ситуации, когда роботу-водителю придётся делать нелёгкий выбор: задавить одного или двоих пешеходов; убить пешехода или пассажира; старого или молодого; мужчину или женщину; дорого одетого менеджера или бомжа. Привить мораль роботу, конечно, нельзя, но можно научить его действовать так, как скорее всего действовал бы на его месте человек.

С этой целью в Массачусетском технологическом институте создали "Машину морали", которую поучить может любой желающий. На основе сценариев поведения людей в пиковых ситуациях будет создана инструкция для робота. Присоединяйтесь, это довольно увлекательно
http://moralmachine.mit.edu/hl/ru
Несколько простых рекомендаций по поиску в интернете информации о своих родственниках, участвовавших в Великой Отечественной войне.

Прежде всего соберите всю возможную информацию из семейных архивов: ФИО, звание, номер части и дивизии, каким военкоматом призывался. Теперь можно идти в сеть. Поисковики общего назначения — Google и Яндекс — для прямого поиска информации о конкретных людях малопригодны, так как не залезают внутрь специализированных баз данных. Зато они помогают найти сами необходимые базы, сайты, форумы и сообщества, где уже можно вести предметный поиск.

Наиболее важные и достоверные базы следующие:

https://obd-memorial.ru/html/ — Обобщённых банк данных о погибших, пропавших без вести и умерших в ходе ВОВ

http://podvignaroda.mil.ru/?#tab=navHome — База данных наградных документов

https://pamyat-naroda.ru/ — подлинные архивные донесения о погибших и пропавших без вести, наградные листы, журналы боевых действий

https://www.its-arolsen.org/ru/ — немецкая база по военнопленным и перемещенным гражданским лицам

Если ищете информацию на немецком языке, полезно перебрать несколько возможных вариантов написания таких русских букв, как например "ч", "ш", "щ", поскольку заранее неизвестно, какой вариант был выбран немцами
Наряду с благодарностью Минобороны России за архив ОБД "Мемориал" — а 17 млн обработанных листов документов это колоссальная работа — хотел бы высказать одно пожелание. Сейчас поиск в этой базе позволяет искать документы только по ФИО, году рождения и званию погибших или пропавших без вести в ходе ВОВ. Имеет смысл расширить возможности.

Что если восстановить картину происходившего с конкретным военнослужащим помогут документы не только о нём самом, но и о его однополчанах? Вполне такое может быть. Однако возможности найти однополчан ОБД "Мемориал" сегодня не даёт. Давайте это исправим! Нужно всего лишь открыть доступ к тем полям базы данных, где указаны номера подразделений, соединений или объединений РККА. Допустим, я ввожу в это поле "80 сд" — и получаю список личного состава 80-й стрелковой дивизии.

Что это даёт? Как минимум, можно поизучать этот список и сделать кое-какие выводы, например, о национальном и возрастном составе военнослужащих, их образовательном уровне и способе призыва. Дальше — по этому списку можно попытаться разыскать потомков однополчан вашего родственника, а там как знать — может, они дополнят картину. Можно вообще сформировать в сети сообщество потомков солдат и офицеров конкретной армии или фронта.

Наконец — сорганизоваться всеми такими сообществами на шествие одной группой в составе Бессмертного полка. Только представьте — по Тверской катится волна с транспарантами "1-й Белорусский фронт", "18-я армия"...

Еще лучше было бы открыть в базе не только поля с наименованиями дивизий, армий и фронтов, а дать возможность просто свободно искать слова, как в Гугле и Яндексе. Это открыло бы огромные возможности для исследователей-историков и даже лингвистов. Можно было бы, к примеру, не перелопачивая горы документов руками, делать выводы о том, как менялась наградная политика или сам тон донесений о боевых действиях. Вот такая мечта.

На портале "Подвиг народа", кстати, возможность свободного поиска есть, и поэтому, задавая номер дивизии, можно получать списки её личного состава. Но очень неполные, поскольку на этом портале содержатся только наградные документы. То есть список частей и соединений на самое начало войны вы не получите. Тогда ведь было не до наград

В общем, было бы неплохо как-то сдвинуть этот вопрос. Если кто-то может содействовать, буду благодарен.
Подходит к концу конкурс Data Journalism Awards 2018, в последний день мая уже будут вручены премии. Надо сказать, что они до обидного маленькие — всего $1801, и это за лучшие работы международного уровня. Но такова традиция — премия учреждена в честь Уильяма Плейфэра, который в 1801 году придумал круговую диаграмму.

Пулитцеровским лауреатам повезло больше — им до недавнего времени платили по $10 тыс., а с прошлого года так уже и по $15 тыс. И даже если бы эту премию назначили по году рождения Пулитцера, она всё равно была бы больше, чем у дата-журналистов — $1837.
Рождение, жизнь и смерть российских еженедельников (таймлайн из диплома выпускницы журфака МГУ Анны Третьяк)
Как только в очередной американской школе происходит стрельба, Марк Фоллман обновляет свою базу данных и новая информация немедленно визуализируется на карте. "Ненавижу эту работу больше всего на свете", — написал Марк в своем твиттере на днях, когда занес в базу сведения о 100-й стрельбе с 1982 года, в школе города Санта Фе
https://twitter.com/markfollman/status/997509271095984128
Лучший гонщик Формулы-1 всех времен и народов — Айртон Сенна, на втором месте Михаэль Шумахер, на третьем Льюис Хэмилтон. Таблица с первой тридцаткой, интерактивная инфографика, исследование дуэлей
https://fivethirtyeight.com/features/formula-one-racing/?utm_source=The+Den+Bulletin&utm_campaign=1df2ac45e3-EMAIL_CAMPAIGN_2018_05_29_09_44&utm_medium=email&utm_term=0_01a9377b12-1df2ac45e3-150041041
Может ли инфографика служить единению нации и патриотической пропаганде? Вполне. Авторы карты родных городов военнослужащих США, погибших в Ираке и Афганистане, так и пишут: "Почему это важно: солдат на войну посылал каждый уголок страны"

https://www.axios.com/map-hometowns-of-americas-fallen-servicemembers-since-911-3d64f6a3-fc0b-421d-8dbb-06a6b94a1b66.html?utm_source=The+Den+Bulletin&utm_campaign=1df2ac45e3-EMAIL_CAMPAIGN_2018_05_29_09_44&utm_medium=email&utm_term=0_01a9377b12-1df2ac45e3-150041041
Портал TecMatters составил подборку из 31 лучшего, на его взгляд, инструмента для визуализации данных. Почему именно 31, не спрашивайте -- возможно, тут какое-то суеверие, число 13 наоборот или вроде того

http://tecmatters.com/top-31-best-free-data-visualization-tools/?utm_source=The+Den+Bulletin&utm_campaign=1df2ac45e3-EMAIL_CAMPAIGN_2018_05_29_09_44&utm_medium=email&utm_term=0_01a9377b12-1df2ac45e3-150041041
Лауреаты главной премии по дата-журналистике 2018 года. Пока просто список, обсудим потом )
https://www.datajournalismawards.org/2018-winners/?utm_source=The+Den+Bulletin&utm_campaign=319ea27b82-EMAIL_CAMPAIGN_2018_06_01_09_27&utm_medium=email&utm_term=0_01a9377b12-319ea27b82-150041041
Как справедливо заметил Сергей Кашин (РБК), жаль, что такого проекта нет у нас в России, да он и практически невозможен в силу особенностей нашей переписи населения. Ну хоть на американскую статистику можно посмотреть. Вы отмечаете профессию, которой учились, и получаете расклад, кем в итоге стали получившие эту профессию. Количество американских математиков, ставших журналистами, например, совсем невелико, оно не превосходит стат. погрешности и не выделяется в чарте, а входит в "прочие"

http://www.hamiltonproject.org/charts/median_earnings_for_largest_occupations
Если исходить из рейтингов FIFA для футбольных сборных, матч открытия ЧМ-2018 будет слабейшим за последние 7 чемпионатов. Впрочем, рейтинги условны
Калифорнийский университет в Беркли выложил в свободный доступ 100 тыс. файлов для обучения беспилотных автомобилей. Каждое видео около 40 сек и имеет высокое разрешение — 720р и 30 кадров/сек. В базу собраны ролики с разными погодными условиями и временем суток. Доступна информация с GPS. Беспилотное будущее становится ближе с каждым днём

http://bdd-data.berkeley.edu/
С завидной регулярностью появляются публикации о яхте Luna бывшего владельца "Нортгаза" Фархада Ахмедова, которая, как утверждается, стоит около $500 млн (иногда уточняют, что $492 млн). Причем откуда взялась эта сумма, никто толком объяснить не может.

Ахмедов эту яхту за столько купил? Нет. Он её за столько продаёт? Тоже нет. Он в неё столько вложил? И опять нет. Может быть, это выводы каких-то опытных оценщиков яхт? Так назовите их. Никто не называет.

Есть версия, что владельцу просто выгодно завысить цену и пропустить её несколько раз через все СМИ планеты, чтобы она сама собой превратилась в истину. Ну а потом как-то использовать эту оценку при разводе. Доказать эту версию мы не можем. Но она ничем не хуже астрономической суммы, взятой с потолка
https://www.msn.com/en-gb/news/world/a-russian-oligarch%E2%80%99s-dollar500-million-yacht-is-in-the-middle-of-britain%E2%80%99s-costliest-divorce/ar-AAykdAh?ocid=spartanntp
👍1
Любопытная статистика от Шпигеля по клубному представительству на ЧМ по футболу. Всего в ЧМ участвовало 10,130 футболистов. Максимальное количество делегировали испанская Барселона и итальянский Ювентус -- по 126 игроков. Далее следуют Интер, Реал и Байер -- 121, 117 и 105 соответственно

http://m.spiegel.de/sport/fussball/wm-2018-analyse-der-wm-kader-das-vereinsranking-der-wm-geschichte-a-1211767.html