Ivan Begtin
8.01K subscribers
1.75K photos
3 videos
101 files
4.46K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Ровно 5 лет назад, 4 февраля 2014 года, был открыт проект КГИ «Госзатраты». Основная цель проекта - повышение прозрачности госфинансов и предоставление данных о госконтрактах. Все эти годы проект разрабатывался при поддержке АНО Инфокультура.

За первую пятилетку мы обработали и опубликовали более 32,5 млн госконтрактов и 96 тыс. субсидий из федерального бюджета. Сформировали профили 1,6 млн поставщиков и 316 тыс. заказчиков, 188 распределителей субсидий и 7 тыс. получателей субсидий. Автоматически выявили более 13 млн аномалий и неточностей в данных о государственных контрактах.

Сайт проекта посетили 6,5 млн уникальных пользователей из 192 стран. Почти половина пользователей сайта - люди от 25 до 34 лет, а пик активности посещений совпадает с рабочим временем в будни.

За эти годы мы опубликовали на сайте несколько сотен новостей, более 600 постов в Facebook и получили более 500 упоминаний в СМИ. Нашими подписчиками в Facebook стали 2000 человек, и мы всегда рады новым ;-).

Были проведены несколько десятков мероприятий, в т.ч. хакатоны, лекции, вебинары, дата-среды, встречи с разработчиками, и подготовлены несколько десятков обращений в госорганы про открытые данные.

Напоминаю наши основные ресурсы, на которых вы можете получать информацию о государственных финансах:

- https://clearspending.ru (сайт проекта «Госзатраты», на котором публикуются закупки, контракты, данные о поставщиках и заказчиках, доступны ежедневные дампы базы данных и ссылки на API);

- https://sub.clearspending.ru (спецпроект «Субсидии», содержащий данные о субсидиях из федерального бюджета, распределителях и получателях);

- телеграм-бот @csParticipantStatsBot (делится статистикой госзаказа организации по ИНН);

- телегам-бот @csDownloaderBot (формирует выборку контрактов по необходимым вам фильтрам);

- телеграм-канал @clearspending (каждый день будет присылать вам три самых крупных контракта по отраслям и оповестит, если в базе появятся очень крупные контракты);

- расширение для браузера Google Chrome bit.ly/clearspending_ext (позволит вам просматривать статистику госзаказа организации, находясь на ее сайте).

Помимо этого, вы всегда можете скачать наш публичный отчет (bit.ly/csReport2017), и узнать о том, как заработать на госзакупках из руководства, переведенного нами в прошлом году (bit.ly/csMoneyGuide).

Инфографику с результатами нашей работы вы можете посмотреть и скачать на сайте проекта (https://clearspending.ru/news/5-let-nazad-byl-zapushen-proekt-kgi-goszatraty/), а мы напоминаем, что всегда рады вопросам, пожеланиям и запросам от пользователей.

Вы всегда можете спросить о том, как в России устроены госфинансы, где найти интересующие вас данные, как разобраться в данных о контрактах, если вы представляете СМИ, НКО или проводите исследование, то можете запросить и нужную вам выборку данных.
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Госзатраты в цифрах.png
3 MB
Сегодня 5-летие ГосЗатраты, проекта Комитет гражданских инициатив, самого большого проекта из всех что мы делали и поддерживали в Информационная культура за эти годы. Мы ещё напишем об этом подробнее, в инфографике и в цифрах, а я пока расскажу кое-что за его пределами.

Госзатраты - это большой-маленький проект. Большой потому что из всех общественных проектов в мире его можно считать одним из крупнейших. И по объёму данных и по охвату госконтрактов, организаций и поставщиков.

А маленький потому что из примерно десятка крупных государственных информационных систем раскрывающих информацию о госфинансах тут агрегированы данные только из двух, и те не полностью:
- ЕИС в закупках
- Единый портал бюджетной системы.

Кроме этих систем данные публикуются ещё и в десятках других. Как специализированных про госфинансы, так и во множестве отраслевых.

Я всегда помню не о том что уже есть, а о том чего нет.
До сих пор нет:
- федерального бюджета (со всей структурой изменений)
- региональных бюджетов
- муниципальных бюджетов
- структуры бюджетных учреждений
- отраслевой аналитики
- выявленных нарушений госконтролерами
и многое и многое другое.

Их объём невероятен даже для коммерческих проектов, а для проектов общественных итак трудно найти средства для ведения таких проектов, а тут масштаб ещё выше.
Нет многого и от того я все эти годы говорю что до сих пор уровень открытости государства гораздо выше общественного интереса к этой открытости, как минимум в части госфинансов.

#opendata #opengov #data #clearspending
PapersWithCode [1] компактный каталог научных исследований и статей в областях машинного обучения, алгоритмов, классификации изображений, идентификации объектов и много другого. С одной важной особенностью - статьи слинкованы с открытым кодом привязанным к тексту.

Что-то авторы делают вручную, что-то линкуется автоматически, у каких то статей нехватает привязки, но то уже есть уже очень удобно.

Наличие кода сразу же делает материал статьи практическим, а сами статьи отсортированы по числу "лайков" (звезд) в github'е

Ссылки:
[1] https://paperswithcode.com/

#data #papers
Forwarded from ICT.Moscow
«Ростелеком» подал заявку в ФАС на покупку DataLine // «Коммерсант»

«Ростелеком» подал в ФАС ходатайство о покупке второго крупнейшего в России оператора дата-центров DataLine. По словам собеседников издания, оператор оценил DataLine минимум в 21 млрд руб. С учетом долга компании в 3 млрд руб. реальная сумма сделки может составить около 18 млрд руб., или $275 млн. Ее закрытие планируется в апреле. Мощность центров обработки данных DataLine сейчас составляет 4,7 тыс. стоек (больше только у «Ростелекома» — 5,9 тыс.), а оборот облачной инфраструктуры — около 1,5 млрд руб. в год.

🔗 О том, что «Ростелеком» интересуется покупкой DataLine, сообщалось в середине января. Тогда же уточнялось, что в случае объединения бизнесов доля «Ростелекома» на рынке дата-центров достигнет 25–30%.

🔗 Рейтинг крупнейших поставщиков услуг ЦОД, по версии CNews Analytics.

#Ростелеком #ЦОД #ФАС #DataLine
HackerRank выпустил отчёт о навыках разработчиков [1] на 2019 год на основе данных о 71 тысяче программистов.

Вот некоторые факты:
1. Самым распространенным языком на 2018 год является JavaScript.
2. Наибольший рост с 2017 по 2018 год показали Javascript и Python
3. Наиболее желаемые к изучению языки программирования на 2019 год: Python, Go и Kotlin
4. Любимый стартовый проект у разработчиков сейчас - это калькулятор
5. Интернет вещей, глубокое обучение и облачное машинное обучение - наиболее реалистичные новые технологии.
6. Плохо написанная документация - главный бич современной разработки.
7. Топ приоритеты у разработчиков - это профессиональный рост и образование и баланс работы и жизни.


Ссылки:
[1] https://research.hackerrank.com/developer-skills/2019

#it #tech
Концепция цифрового профиля гражданина одобрена Правительством и рабочей группой по нормативному регулированию при АНО «Цифровая экономика». До следующего года запустится мобильное приложение, в котором граждане смогут получать данные о себе из государственных информационных систем (ГИС), а также давать разрешения на доступ к этим данным государственным или коммерческим организациям.

Подробнее: https://www.kommersant.ru/doc/3875854
Пресса в США активно пишет о том что Google договорился с Роскомнадзором и активно начал блокировать ссылки из списка Роскомнадзора. Об этом пишут Slate [1], Futurism [2], The Inquirer [3], Washington Post [4] и многие другие. Чем это закончится трудно предсказать, антироссийские настроения в США сейчас сильны и как бы руководство Google не вызвали в конгресс и не начали бы общественную компанию по давлению на Гугл.

Вся эта история тем более странна что, например, удалить Telegram из Google.Play Роскомнадзор так и не смог, а договориться с Гуглом о блокировках ссылок вполне получилось.

Ссылки:
[1] https://slate.com/technology/2019/02/russia-censorship-internet-google.html
[2] https://futurism.com/google-censoring-search-results-russia/
[3] https://www.theinquirer.net/inquirer/news/3070725/google-search-censored-russia
[4] https://www.washingtonpost.com/world/europe/reports-russian-authorities-make-deal-with-google/2019/02/08/9a199234-2bce-11e9-906e-9d55b6451eb4_story.html

#tech #it #google
Свежие кадры из презентации о цифровой экономике как нац. провекте
Полная презентация показателей и структуры национальных проектов на сайте правительства [1] .
Сразу возникает много вопросов:
1. В программе Цифровая экономика скрыта/убрана Национальная система управления данными. Куда она подевалась - непонятно, возможно внутри какого-то другого проекта>
2. У Максима Акимова [2] больше всех нацпроектов в кураторстве: Цифровая экономика, Безопасные и качественные автомобильные дороги и Комплексный план модернизации и расширения магистральной инфраструктуры
3. Три вице-премьера: Чуйченко, Борисов и Трутнев не курируют ни одного наз проекта.

Ссылки:
[1] http://static.government.ru/media/files/p7nn2CS0pVhvQ98OOwAt2dzCIAietQih.pdf
[2] http://government.ru/gov/persons/207/events/

#data #budget #nationalprojects
В Италии команда Team Digitale занимается разработкой типового портала муниципального образования, который будет с открытым кодом и который любой муниципалитет может использовать. Они рассказывают про свой опыт в блоге [1], а прототип сайта можно увидеть по ссылке [2].

Открытость разработки - это гораздо больше чем открытый код, это ещё и прозрачность процесса и вовлечение пользователей на ранних этапах проектирования.

Ссылки:
[1] https://medium.com/team-per-la-trasformazione-digitale/standard-website-model-italian-municipalities-design-prototype-mobile-first-open-source-67edd3921e1b
[2] https://projects.invisionapp.com/share/Q2OTF1RMNUB#/screens

#open #opengov
Счетная палата запустила информационную панель по мониторингу национальных целей
http://audit.gov.ru/press_center/news/35883

Счетная палата запустила информационную панель по мониторингу национальных
целей
Специально для тех кто интересуется визуализацией данных доски на Pinterest с примерами:
- Data visualizations
- ещё data visualizations
- Dashboards
- DataViz Clear & Simple
- Dashboard UI
и многие другие

А также автономные каталоги примеров визуализации:
- Data visualization catalogue
- Data Viz Project

А также напоминаю про списки на github'е:
- Awesome data journalism
- Awesome dataviz
где нет такой красивой подачи, но перечисленно множество инструментов

#data #dataviz
Написал большой текст об отсутствии этики работы с данными как будущую проблему доверия с государству
https://begtin.tech/data-trust/

Заодно напомню об интересном исследовании доверия на 2019 год: Edelman Trust Barometer https://www.edelman.com/

Уровень доверия граждан не только государству, но и доверия в целом - очень низкий. Но плохо не только это, беда в том что доверие падает.

#trust #data
Как я писал ранее, этика работы с данными становится приоритетной темой. Даже если она не упоминается.
Forwarded from НовостиFAKE
Please open Telegram to view this post
VIEW IN TELEGRAM
Сколько я не смотрю, не читаю, не поднимаю архивные материалы - хоть убей я не могу понять в чем отличия между:
- национальными приоритетными проектами
- федеральными целевыми программами
- федеральными адресными инвестиционными программами
- государственными программами
- национальными проектами

Причём если о ФЦП ещё кое где остались следы и материалы, то о национальных приоритетных проектах всё давно подчистили. Сайт rost.ru отдали (интересно ещё кто отдал?) Партии Роста, а весь контент про национальные приоритетные проекты - остался только в archive.org [1] и у меня есть слепок этого сайта 2012 года (7 лет назад) который можно скачать тут [2] (700 МБ в распакованном виде).

И риторика всё время одна и та же, как будто всё по новой, как будто никто ничего не помнит.

Ссылки:
[1] https://web.archive.org/web/20070706162228/http://rost.ru/
[2] https://hubofdata.ru/dataset/rost-ru-2012-10-22

#archive #programs #data
Forwarded from Инфокультура
Открытые НКО: перезапуск проекта
https://www.infoculture.ru/2019/02/18/reloading_openngo/

«Открытые НКО» — это портал, где собраны в удобном виде различные данные о
деятельности российских некоммерческих организаций (НКО) и их государственном
финансировании. В обновленной версии проекта мы значительно расширили состав
источников данных. Нам удалось сопоставить данные из Единого государственного
реестра юридических лиц (ЕГРЮЛ) с реестром Минюста России, сравнение их баз
данных по некоммерческому сектору тянет на отдельное аналитическое
исследование. Теперь база данных проекта учитывае