Ivan Begtin
8.06K subscribers
1.47K photos
3 videos
99 files
4.2K links
I write about Open Data, Data Engineering, Government, Privacy and Data Preservation and other gov and tech stuff
Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech

Contact @NMBabina for ads proposals
Download Telegram
Сегодня 5-летие ГосЗатраты, проекта Комитет гражданских инициатив, самого большого проекта из всех что мы делали и поддерживали в Информационная культура за эти годы. Мы ещё напишем об этом подробнее, в инфографике и в цифрах, а я пока расскажу кое-что за его пределами.

Госзатраты - это большой-маленький проект. Большой потому что из всех общественных проектов в мире его можно считать одним из крупнейших. И по объёму данных и по охвату госконтрактов, организаций и поставщиков.

А маленький потому что из примерно десятка крупных государственных информационных систем раскрывающих информацию о госфинансах тут агрегированы данные только из двух, и те не полностью:
- ЕИС в закупках
- Единый портал бюджетной системы.

Кроме этих систем данные публикуются ещё и в десятках других. Как специализированных про госфинансы, так и во множестве отраслевых.

Я всегда помню не о том что уже есть, а о том чего нет.
До сих пор нет:
- федерального бюджета (со всей структурой изменений)
- региональных бюджетов
- муниципальных бюджетов
- структуры бюджетных учреждений
- отраслевой аналитики
- выявленных нарушений госконтролерами
и многое и многое другое.

Их объём невероятен даже для коммерческих проектов, а для проектов общественных итак трудно найти средства для ведения таких проектов, а тут масштаб ещё выше.
Нет многого и от того я все эти годы говорю что до сих пор уровень открытости государства гораздо выше общественного интереса к этой открытости, как минимум в части госфинансов.

#opendata #opengov #data #clearspending
PapersWithCode [1] компактный каталог научных исследований и статей в областях машинного обучения, алгоритмов, классификации изображений, идентификации объектов и много другого. С одной важной особенностью - статьи слинкованы с открытым кодом привязанным к тексту.

Что-то авторы делают вручную, что-то линкуется автоматически, у каких то статей нехватает привязки, но то уже есть уже очень удобно.

Наличие кода сразу же делает материал статьи практическим, а сами статьи отсортированы по числу "лайков" (звезд) в github'е

Ссылки:
[1] https://paperswithcode.com/

#data #papers
Forwarded from ICT.Moscow
«Ростелеком» подал заявку в ФАС на покупку DataLine // «Коммерсант»

«Ростелеком» подал в ФАС ходатайство о покупке второго крупнейшего в России оператора дата-центров DataLine. По словам собеседников издания, оператор оценил DataLine минимум в 21 млрд руб. С учетом долга компании в 3 млрд руб. реальная сумма сделки может составить около 18 млрд руб., или $275 млн. Ее закрытие планируется в апреле. Мощность центров обработки данных DataLine сейчас составляет 4,7 тыс. стоек (больше только у «Ростелекома» — 5,9 тыс.), а оборот облачной инфраструктуры — около 1,5 млрд руб. в год.

🔗 О том, что «Ростелеком» интересуется покупкой DataLine, сообщалось в середине января. Тогда же уточнялось, что в случае объединения бизнесов доля «Ростелекома» на рынке дата-центров достигнет 25–30%.

🔗 Рейтинг крупнейших поставщиков услуг ЦОД, по версии CNews Analytics.

#Ростелеком #ЦОД #ФАС #DataLine
HackerRank выпустил отчёт о навыках разработчиков [1] на 2019 год на основе данных о 71 тысяче программистов.

Вот некоторые факты:
1. Самым распространенным языком на 2018 год является JavaScript.
2. Наибольший рост с 2017 по 2018 год показали Javascript и Python
3. Наиболее желаемые к изучению языки программирования на 2019 год: Python, Go и Kotlin
4. Любимый стартовый проект у разработчиков сейчас - это калькулятор
5. Интернет вещей, глубокое обучение и облачное машинное обучение - наиболее реалистичные новые технологии.
6. Плохо написанная документация - главный бич современной разработки.
7. Топ приоритеты у разработчиков - это профессиональный рост и образование и баланс работы и жизни.


Ссылки:
[1] https://research.hackerrank.com/developer-skills/2019

#it #tech
Концепция цифрового профиля гражданина одобрена Правительством и рабочей группой по нормативному регулированию при АНО «Цифровая экономика». До следующего года запустится мобильное приложение, в котором граждане смогут получать данные о себе из государственных информационных систем (ГИС), а также давать разрешения на доступ к этим данным государственным или коммерческим организациям.

Подробнее: https://www.kommersant.ru/doc/3875854
Пресса в США активно пишет о том что Google договорился с Роскомнадзором и активно начал блокировать ссылки из списка Роскомнадзора. Об этом пишут Slate [1], Futurism [2], The Inquirer [3], Washington Post [4] и многие другие. Чем это закончится трудно предсказать, антироссийские настроения в США сейчас сильны и как бы руководство Google не вызвали в конгресс и не начали бы общественную компанию по давлению на Гугл.

Вся эта история тем более странна что, например, удалить Telegram из Google.Play Роскомнадзор так и не смог, а договориться с Гуглом о блокировках ссылок вполне получилось.

Ссылки:
[1] https://slate.com/technology/2019/02/russia-censorship-internet-google.html
[2] https://futurism.com/google-censoring-search-results-russia/
[3] https://www.theinquirer.net/inquirer/news/3070725/google-search-censored-russia
[4] https://www.washingtonpost.com/world/europe/reports-russian-authorities-make-deal-with-google/2019/02/08/9a199234-2bce-11e9-906e-9d55b6451eb4_story.html

#tech #it #google
Свежие кадры из презентации о цифровой экономике как нац. провекте
Полная презентация показателей и структуры национальных проектов на сайте правительства [1] .
Сразу возникает много вопросов:
1. В программе Цифровая экономика скрыта/убрана Национальная система управления данными. Куда она подевалась - непонятно, возможно внутри какого-то другого проекта>
2. У Максима Акимова [2] больше всех нацпроектов в кураторстве: Цифровая экономика, Безопасные и качественные автомобильные дороги и Комплексный план модернизации и расширения магистральной инфраструктуры
3. Три вице-премьера: Чуйченко, Борисов и Трутнев не курируют ни одного наз проекта.

Ссылки:
[1] http://static.government.ru/media/files/p7nn2CS0pVhvQ98OOwAt2dzCIAietQih.pdf
[2] http://government.ru/gov/persons/207/events/

#data #budget #nationalprojects
В Италии команда Team Digitale занимается разработкой типового портала муниципального образования, который будет с открытым кодом и который любой муниципалитет может использовать. Они рассказывают про свой опыт в блоге [1], а прототип сайта можно увидеть по ссылке [2].

Открытость разработки - это гораздо больше чем открытый код, это ещё и прозрачность процесса и вовлечение пользователей на ранних этапах проектирования.

Ссылки:
[1] https://medium.com/team-per-la-trasformazione-digitale/standard-website-model-italian-municipalities-design-prototype-mobile-first-open-source-67edd3921e1b
[2] https://projects.invisionapp.com/share/Q2OTF1RMNUB#/screens

#open #opengov
Счетная палата запустила информационную панель по мониторингу национальных целей
http://audit.gov.ru/press_center/news/35883

Счетная палата запустила информационную панель по мониторингу национальных
целей
Специально для тех кто интересуется визуализацией данных доски на Pinterest с примерами:
- Data visualizations
- ещё data visualizations
- Dashboards
- DataViz Clear & Simple
- Dashboard UI
и многие другие

А также автономные каталоги примеров визуализации:
- Data visualization catalogue
- Data Viz Project

А также напоминаю про списки на github'е:
- Awesome data journalism
- Awesome dataviz
где нет такой красивой подачи, но перечисленно множество инструментов

#data #dataviz
Написал большой текст об отсутствии этики работы с данными как будущую проблему доверия с государству
https://begtin.tech/data-trust/

Заодно напомню об интересном исследовании доверия на 2019 год: Edelman Trust Barometer https://www.edelman.com/

Уровень доверия граждан не только государству, но и доверия в целом - очень низкий. Но плохо не только это, беда в том что доверие падает.

#trust #data
Как я писал ранее, этика работы с данными становится приоритетной темой. Даже если она не упоминается.
Forwarded from НовостиFAKE
Please open Telegram to view this post
VIEW IN TELEGRAM
Сколько я не смотрю, не читаю, не поднимаю архивные материалы - хоть убей я не могу понять в чем отличия между:
- национальными приоритетными проектами
- федеральными целевыми программами
- федеральными адресными инвестиционными программами
- государственными программами
- национальными проектами

Причём если о ФЦП ещё кое где остались следы и материалы, то о национальных приоритетных проектах всё давно подчистили. Сайт rost.ru отдали (интересно ещё кто отдал?) Партии Роста, а весь контент про национальные приоритетные проекты - остался только в archive.org [1] и у меня есть слепок этого сайта 2012 года (7 лет назад) который можно скачать тут [2] (700 МБ в распакованном виде).

И риторика всё время одна и та же, как будто всё по новой, как будто никто ничего не помнит.

Ссылки:
[1] https://web.archive.org/web/20070706162228/http://rost.ru/
[2] https://hubofdata.ru/dataset/rost-ru-2012-10-22

#archive #programs #data
Forwarded from Инфокультура
Открытые НКО: перезапуск проекта
https://www.infoculture.ru/2019/02/18/reloading_openngo/

«Открытые НКО» — это портал, где собраны в удобном виде различные данные о
деятельности российских некоммерческих организаций (НКО) и их государственном
финансировании. В обновленной версии проекта мы значительно расширили состав
источников данных. Нам удалось сопоставить данные из Единого государственного
реестра юридических лиц (ЕГРЮЛ) с реестром Минюста России, сравнение их баз
данных по некоммерческому сектору тянет на отдельное аналитическое
исследование. Теперь база данных проекта учитывае
На Medium статья из Washington Post о использовании Amazon Rekognition System для распознавания лиц полицией [1], с большим числом отсылок на публичные и государственные исследования и внедрение технологий идентификаций по лицам. Алгоритмы пока ещё не дотягивают до того уровня когда им можно безоговорочно доверять причем тут срабатывает страновая специфика и тот же алгоритм Amazon не справляется с точным определением пола для людей с темной кожей и с распознаванием лиц в их случае.

Разница во внедрение систем распознавания лиц в разных странах лишь в публичности, хотя бы частичной, алгоритмов. В США они проходят тестирование в NIST, и иногда производители раскрывают модели распознавания. В Китае, в России, во многих других странах вопрос публичности алгоритмов распознавания лиц и ошибки при идентификации даже не поднимаются.

А что, серьёзно, хоть кто-то ещё верит что к 2025 году останется хоть одна гос-камера не оборудованная идентфикацией лиц? или то что на каждом полицейском не будет камеры в режиме непрерывной записи в течение рабочего дня?

Ссылки:
[1] https://medium.com/thewashingtonpost/amazon-facial-id-software-used-by-police-falls-short-on-accuracy-and-bias-research-finds-43dc6ee582d9

#algorithms