Ivan Begtin
7.99K subscribers
1.76K photos
3 videos
101 files
4.47K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
По поводу проекта постановления Правительства в котором предлагается засекретить закупки и контракты Роскосмоса подробно написало РБК [1], а сам текст постановления можно прочитать на Regulation [2] я, всё же прокомментирую тезисно.

1. Спектр режимов доступа к информации - это не только режимы "всё открыто" и "всё засекречено", но и такие разные варианты и опции как:
- доступно журналистам по запросу
- доступно общественным контролёрам по запросу
- доступно в сокращённом объёме (без текстов контрактов, к примеру) или с сокращённым/убранным предметом контракта
- доступно с задержкой в 3, 6, 12 месяцев
- доступно органам надзора и аудита

и так далее, там ещё много всего

2. Открытость или закрытость закупок - это всегда баланс между секретностью, коммерческой тайной и интересами общества. Роскосмос не ПАО, его отчетность малопонятна, неудобна, недостаточна и так далее. Если скрывать ещё и его закупки, то госкорпорация станет значительно непрозрачнее.

3. У Роскосмоса есть большая специфика в том что очень многие контракты у них внутрикорпоративные. Я лично могу предсказать исполнителя контракта по его извещению с вероятность до 70-80% при контракте до 50 миллионов и почти под 99% при контракте выше 50 миллионов.

4. Сокрытие сведения о расходах которые находятся в открытой части бюджета - это, в принципе, плохая практика. Если всё так серьёзно - переводите деятельность Роскосмоса в секретный режим, переносите всю его деятельность под гостайну.

5. В разных странах есть разная практика в таких случаях. В Великобритании не публикуются тексты контрактов, но публикуются все транзакции. Армия США публикует сведения о контрактах из открытой части их бюджета с задержкой в 6 месяцев. Информация в них крайне скудная, можно лишь узнать кто поставщик, кто заказчик, краткое описание содержания и сумму, но никаких документов или деталей нет. В других странах повторяется аналогичная практика, для силовых и военных ведомств не публикуются подробности, но публикуется факт контракта, сумма, подрядчик и тд. А также законодательство там позволяет журналистам запрашивать информацию уже целевым образом, поскольку они знают о факте и номере контракта это проще.

Поэтому отвечая на вопрос - адекватно ли сокрытие контрактов Роскосмоса?

Нет, закрытие любых сведений о расходах из открытой части бюджета не является правильным решением. Можно публиковать сведения с задержкой, можно публиковать их в сокращённом объёме. Но полностью закрывать - это порождать/поощрять огромную коррупционную нишу

Я бы задал встречный вопрос, а нормально ли существование госкорпораций в России?

Они зарегистрированы как НКО, публикуют минимальнейшую публичную отчетность, аккумулируют огромные средства, недвижимость, ресурсы и так далее и активно лоббируют ещё большую собственную закрытость.

Ссылки:
[1] https://www.rbc.ru/politics/29/07/2020/5f2089909a7947f5f57eb8cc
[2] https://regulation.gov.ru/projects#npa=106485
#procurement #goszakaz
Для тех кто интересуется современной облачной архитектурой, в том числе применительно к проектам на данных.
- Azure architectures https://docs.microsoft.com/en-us/azure/architecture/browse/ шаблоны проектирования архитектуры на базе Microsoft Azure
- AWS Well-Architected https://aws.amazon.com/ru/architecture/well-architected/ инструментарий и примеры проектирования для Amazon AWS
- Google Cloud Architecture https://cloud.google.com/docs/tutorials#architecture архитектура решений в Google Cloud, включая референсные примеры реализации

С отечественными облаками всё сильно хуже, готовых референсных архитектурных моделей для них нет.

#data #architecture
Сбербанк, похоже, окончательно убил раздел с открытыми данными у себя на сайте. Раньше он был по ссылке "https://www.sberbank.com/ru/analytics/opendata", а теперь она редиректит на ссылку с аналитикой. Там были интересные региональные данные, показатели трат по субъектам федерации, но, остались только аналитические продукты Сбера публикуемые в виде PDF документов.

Очень жаль.
Смотрю рано с утра на записи дискуссий о цифровой слежке и приватности с RightCon (конференция про правам человека идущая в эти дни онлайн).

Содержательных обсуждений там немного, пока самое интересное это Real corporate accountability for surveillance capitalism with Shoshana Zuboff and Chris Gilliard [1]

Так не так много диалога, хорошо и чётко говорит только Shoshanna Zuboff с основными тезисами:

- самое главное - это данные
- защита прав граждан от корпораций должно быть ключевые повесткой правозащитных организаций
- стартапы из 90-х и 00-х выросли в гигантские корпорации с огромным и опасным влиянием
- распознавание по лицам должно быть повсеместно запрещено
- некоторых технологий просто не должно существовать

Всё вместе звучит как часть программы политической партии и реакция остальных спикеров там была довольно сумбурной. В принципе дискуссия там больше походила на серию монологов Shoshanna Zuboff.

Но на что нельзя не обратить внимание, так это то что основными адресатами её речи являются не представители правозащитных организаций, а скорее те кто их финансирует - правительства стран ОЭСР (в основном США и Евросоюз), крупнейшие частные фонды.

И вот тут возникает важнейший вопрос повестки: может ли их политика перестроится в этом направлении?

Основные объекты критики сейчас - это крупнейшие цифровые/дата корпорации. Первые в этом списке Google, Amazon и Facebook, но ими всё не ограничивается. Большинство из них в Кремниевой долине, несколько в других регионах США, но почти все они в США.

Если в других правозащитных вопросах у США применяли моральный императив переноса демократии в другие страны и большая, отлаженная повестка поддержки тех кто защищал права человека в не самых развитых и демократических странах, то здесь это, во многом, внутренний вопрос под сильным внешним давлением других стран, в первую очередь стран ОЭСР, Евросоюза и других союзников США.

Могут ли правозащитные организации перестроиться на атаку на дата корпорации? Наверняка могут и тысячи пчёл могут закусать даже толстокожих слонов, но как это сделать не потеряв контроля за цифровыми экосистемами вот в чём вопрос.

И это же возвращает нас к вопросу о проблемах цифрового контроля государств в Интернете. Сейчас этот контроль, довольно ограниченный есть:

- у США где юридически находятся все основные владельцы цифровых экосистем;
- у Китая где есть свои технологии, корпорации, жесткое регулирование и экономические преференции своим компаниям;
- у Евросоюза за счёт огромного рынка, потребительского и корпоративного

Остальные страны (власти стран) влияют на все эти процессы очень ограниченно.

Можно ещё поразмышлять что будет дальше, а пока стоит посмотреть запись "атаки на Bigtech" на слушаниях в конгрессе США [2]. Где руководители Google, Facebook, Apple и Amazon под атакой членов конгресса скорее сдают позиции чем набирают очки.

Пока всё идёт к сценарию постепенного ужесточения корпоративного регулирования технологических компаний-гигантов в США.

Ссылки:

[1] https://www.youtube.com/watch?v=FX2g6xPeftA
[2] https://www.youtube.com/watch?v=WBFDQvIrWYM

#digital #privacy #government
Я как то рассказывал что веду систематизированный реестр всех госдоменов в России. Они доступны в репозитории на Github [1] для федеральных и региональных властей.

Применений у него много:
- сбор однотипной информации с сайтов
- архивация сайтов с риском исчезновения
- анализ их защищённости (поддержка HTTPS)
- анализ применения стандартов
- анализ цифровых активов госорганизаций
и ещё многое другое.

Но реестр на github'е всегда был не до конца точный, он собирался вначале через поиск корневых доменов и затем поиск всех их поддоменами разными автоматизированными способами.

Но их надо было почистить, классифицировать и тд.

Поэтому на его основе сейчас у меня есть реестр доменов используемых на федеральном уровне власти, 7516 доменов на сегодня. Из них около 2500 - это сайты судов и около 900 сайты подразделений МВД. Все сайты на 3/4 размечены по типам сайтов, на 1/5 по региональной привязке (есть не у всех, а только у территориальных управлений).

Не все из них, в принципе, доступны, некоторые на которых были сайты сохранены по архивным соображениям.

Но по доступным есть проверка поддерживают ли они HTTP и HTTPS.

Если кому-то этот реестр нужен то его рабочая версия есть в отдельной папке репозитория [2]. Этот список - это экспорт из эталонной базы которая теперь перенесена в Airtable. Самой базой в Airtable могу поделиться если кто-то будет готов контрибьютить туда регулярно.

Ссылки:
[1] https://github.com/infoculture/govdomains/
[2] https://github.com/infoculture/govdomains/tree/master/refined

#govenment #domains
К вопросу о "терминологических спорах". Их тоже очень любят в академической среде и поэтому там регулярно разрабатываются тезаурусы. Тезаурус, практически всегда - это не что-то сделанное на бегу, а полноценный и большой проект.

Пример подобного тезауруса - это HASSET [1], британский справочник по гуманитарным и социальным наукам созданный в рамках UK Data Service. Справочник включает чуть более 11800 терминов отклассифицированных как:
- Preferred Terms (предпочитетельные)
- Use For (UFs) or Non-Preferred Terms (используемые для...)
- Broader Terms (BTs) (широкие)
- Narrower Terms (NTs) (узкие)
- Related Terms (RTs) (связанные)

Справочник представлен как связанные данные и связан со онтологией SKOS [2]

А также его можно получить целиком по ссылке [3].

Другой пример профессионально сделанного тезауруса про данные - это тезаурус данных Network of the National Library of Medicine в США [4] где по каждому термину приведены все первоисточники на основе которых он строился и даже при тезаурусе в 70 понятий у него указываются все авторы и составители персонально
---
The Data Thesaurus is the updated eScience Thesaurus which was created by Kevin Read in 2013 and previously resided on the eScience Portal for Librarians (Read et al., 2013). The Thesaurus was rebranded and updated in 2018 by Tess Grynoch for the NNLM RD3 site.
---
Таких примеров ещё много. И не только в области работы с данными, а во всех профессиональных областях. Один и тот же термин в области бухучёта может означать совсем не то же что в регулировании госуслуг, к примеру.

Списки и глоссарии терминов устроены так что ты или делаешь их "тяп-ляп", например делаешь сайт по какой-то теме и выводишь их списком, либо придумываешь свои термины или интерпретацию с прицелом на то что они стали общепринятыми, либо подходишь к этому профессионально и описываешь каждый термин в модели полноценной базы данных тезауруса.

Ссылки:
[1] https://hasset.ukdataservice.ac.uk
[2] https://lod.data-archive.ac.uk/v2-skoshasset/page/en-GB/
[3] https://hasset.ukdataservice.ac.uk/hasset-guide/obtaining-hasset.aspx
[4] https://nnlm.gov/data/thesaurus

#terms #data #glossary
К вопросу о том что изменилось за последние годы с государственной ИТ инфраструктурой, гораздо меньше стало прямой зависимости от не-российских сервисов (но осталось много косвенных зависимостей).

Например, очень немногие сайты госорганов или сделанных за бюджетные средства теперь хостятся за рубежом.
Единственные которые остались в моём личном списке:
- energourok.ru, IP 31.170.123.72, хостинг UKWEBHOSTING (просветительский сайт Минэнерго России)
- old.minstroyrf.ru, IP 178.238.232.114, хостинг Contabo, Германия, сейчас отключен (старый сайт Минстроя РФ)
- torgi.fas.gov.ru, IP 23.236.62.147, платформа создания сайтов Wix, США, сейчас отключён (один из проектов ФАС России)
И, наконец, вишенка на торте, сервер "s.mil.ru" - это укорачиватель ссылок используемый в Минобороны РФ. Этот домен - это custom domain сервиса Bit.ly (США). С его помощью создаются и публикуются ссылки на сайте Минобороны

Это всё без учёта многочисленных бюджетных учреждений, унитарных предприятий и иных структур органов власти. Только по доменам в зоне .gov.ru и по доменам которые относятся к федеральным органам власти, 7502 домена

Если провести аналогичный анализ региональных сайтов/доменов и сайтов госучреждений, то картина будет покрасочнее.

Поэтому пока можно сказать что на федеральном уровне такие случаи стали редкостью. А вот косвенных зависимостей таких как установка отслеживающих кодов, внедренных сервисов и тд. очень много. Какие-то ведомства вставляют в свои страницы визуализацию в Tableau, какие то PowerBI, какие-то самые разные другие инструменты.

Хорошо это или плохо? Это неорганизовано. Госполитики в этой области нет, беда со всеми внедренными сервисами в неархивируемости представленных там материалов.

#government #it #infrastructure
Немного тезисов и рефлексии о том как устроено присутствие государства в интернете сейчас. Всё это по результатам анализа 7500 госсайтов/доменов, всё ещё неполный, но списки большего размера мне неизвестны.
1. Большая часть госсайтов не используют системы CDN (content delivery networks).

2. Используются лишь следующие CDN сервисы: Лаборатория Касперского (МВД), Ngenix (ФНС России) , QRator (Минпром). Больше всего доменов за сервисом Лаборатории Касперского, почти все сайты МВД и несколько сайтов других органов власти

3. В целом около 1900 доменов хостится внутри органов власти и около 1558 на разного вида хостингах и
около 2887 хостится в Ростелекоме за пределами той части Ростелекома которая относится к электронному правительству - они учитываются как хостинг внутри органов власти.

4. Общий тренд последних лет 5 - это консолидация территориальных управлений на сайте органа власти или консалидация их сайтов на одной платформе. Такие платформы ГАС Правосудие и ГАС Выборы включают сотни типовых сайтов субъектов федерации и они существуют давно. А МВД с одной стороны все сайты ГИБДД в субъектах свели в разделы на сайте gibdd.ru, а с другой массово плодят сайты поддоменами в mvd.ru (мвд.рф) для каждого их подразделения, включая все медчасти и ОВД по всем районам и городам. Более 900 сайтов/доменов и число постепенно нарастает

5. Количество создаваемых новых сайтов ежегодно измеряется сотнями. Где-то создают органы власти, их территориальные управления, новые порталы, просветительские проекты. Но чаще - это мероприятия.

6. Единственный поисковик контактов/сайтов органов власти - это ГАС Правосудие (sudrf.ru). Даже у МВД с их 900 сайтами нет поисковика по ним всем или единого перечня.

7. Поиск в гугле или яндексе по домену командой "site:gov.ru" охватывает лишь 904 домена из 7500 потому что слишком многие органы власти, учреждения, мероприятия и тд. используют другие доменные зоны. Корневых доменов для госструктур не менее 150: это мвд.рф, mid.ru, sudrf.ru, mil.ru, vkks.ru, mcx.ru и ещё много других. Большое множество других.

8. За исключением больших платформ для сайтов ГАС Правосудие, ГАС Выборы, системы сайтов МВД и тд. разброс технологий, средств разработки, CMS систем для госсайтов очень большой. Это всегда было и остаётся проблемой на федеральном уровне. Если создавать единую платформу на базе www.gov.ru, к примеру, то придётся решать весьма сложную задачу миграции контента из тысяч сайтов. Это реально расходы в миллиарды рублей и риски потери данных при переносе

9. Ни один орган власти в России не ведёт цифровую архивацию его материалов. Исключение - это Банк России, сохраняющий архивные сайты ФСФР ещё с начала 2000-х годов. Во всех остальных случаях системно архивные материалы/ресурсы/старые версии сайтов не сохраняются. Среднее время жизни старой версии сайта госоргана после того как запускают новую - примерно 1.5 года. В некоторых случаях, как МВД ещё в начале запуска их сайта mvd.ru и когда они поглотили внутрь себя ФМС, срок жизни старых сайтов составлял 0 дней. То есть их моментально уничтожали сразу с появление новой версии, даже если сведения не сохранены и не перенесены.

10. Многие сайты, особенно информационных систем, но часто и сайты ФОИВов невозможно полностью заархивировать. Где они работают на Ajax, где-то некоторый контент доступен только через POST-формы, где-то автоматически срабатывают роботы блокирующие поисковых роботов. В целом даже внешняя архивация затруднена и требует написания парсеров.

11. Опасная тенденция - ограничения на доступ к данным через принудительную авторизацию через ЕСИА. Пример - ЕГИС УОИТ https://uoit.fsrpn.ru/ у Росприроднадзора. Это означает что с данными невозможно работать в режиме система-система, принципы открытости не соблюдаются, поисковые системы не индексируют, но система при этом "типо открыта", можно авторизоваться и посмотреть. Очень важно чтобы эта тенденция не стала массовой. Доступ к открытым данным не должен быть через ЕСИА, ни в коем случае.
12. Хуже этого может быть только если в определенный момент Правительство купит/национализирует Крипто-Про и заставит ставить его на все продаваемые в России компьютеры, смартфоны и другие устройства. А доступ к сайтам будет через Chromium-ГОСТ с поддержкой отечественной криптографии. Но во первых это будет дорого, во вторых сложно, и в третьих, ну просто всегда есть те кто в этом не заинтересован. Но если даже только промелькнет новость о чём-то подобным - помните, время паниковать. Потому что отечественная криптография - это один из наиболее легко обосновываемых и внедряемых способов нарушить сетевую нейтральность на страновом уровне.

#government #web #domains
Мне тут регулярно пишут что я своими предсказаниями будущего подкидываю идей регуляторам и нормотворцам о том как сделать цифровую жизнь россиянам похуже, пожиже, потяжелее.

Это, конечно, льстит что меня воспринимают как кого-то к чьим словам могут прислушаться, но, есть некоторое заблуждение о том почему я пишу. Мои "экстрасенсорные навыки" (самому смешно) не в том что я вижу будущее, а в том что я "слышу мысли", а ещё вернее вижу внутренние тренды и знаю логику принятия решений.

Почти все идеи которые я озвучиваю, у кого-то уже давно сидят в голове, где-то как-то уже реализуются, где-то в виде нормативных документов "под сукном" ожидающих своего часа, где-то "дозревания цифровой среды" чтобы внедрение стало возможным и так далее.

Я то, понятное дело, могу многое из этого всего расписать очень подробно, буквально по шагам как это можно внедрить, публично подать, какие подводные камни и тд.
Но, меня это волнует именно для отслеживания тенденций чтобы понимать когда можно и нужно реагировать.

Да и вообще про то как ограничивать права и свободы, под самыми разными личинами: защита детей, шпиономания, импортозамещение и тд, над этим думают непублично десятки если не сотни людей, с вполне себе неплохим воображением, бэкграундом и достаточной отмороженностью чтобы не понимать что то что они придумают отразится и на них.

Но главная проблема сейчас не в том чтобы увидеть и спрогнозировать что будет, а в том чтобы понять как можно на это повлиять и можно ли.

#ideas
Даже не знаю как прокомментировать такую интересную новость. Хорошо быть Минсельхозом, можно потратить почти 300 миллионов рублей на работу с данными. Куда сложнее когда таких ресурсов у тебя нет. Иной раз сложно не посетовать за какие малые средства приходится делать большие (и интересные) проекты.
📃 В начале года Минсельхоз заключил контракт с компанией “Систематика” на создание государственной информационной системы сбора и анализа отраслевых данных «Единое окно»

Сумма заключенного контракта 299 млн рублей. Предполагается, что система сможет агрегировать и обрабатывать данные, в том числе и исторические, поможет специалистам в моделировании и ведении реестров.

Напомним, по направлению “Открытые данные” в рейтинге открытости ведомств 2020 года Минсельхоз был отнесен к органам власти со средней открытостью. Надеемся, в следующем году с вводом новой информсистемы данные о сельском хозяйстве действительно станут более открытыми.

Подробнее о контракте на систему “Единое окно” – на портале “Госрасхоы”: https://spending.gov.ru/goscontracts/contracts/1770807545420000082/

Ознакомиться с рейтингом открытости ведомств можно на нашем сайте: https://ach.gov.ru/news/gosudarstvo-sredney-zakrytosti-rezultaty-novogo-reytinga-otkrytosti-gosorganov
Для тех кто, возможно, это упустил, Информационная культура @infoculture ведёт много проектов о НКО, для НКО. Среди них такие проекты как:
- Открытые НКО https://openngo.ru большая база сведений о некоммерческих организациях, их бюджетах, контрактах, грантах, субсидиях, бюджетах и так далее
- Данные НКО https://ngodata.ru - портал для публикации данных некоммерческими организациями

И вот открылся ещё один проект - Исследования НКО https://ngo-research.ru, как цикл мероприятий для некоммерческих организаций о том как и почему нужны исследования и как их проводить.

2 мероприятия уже прошло, ещё 2 запланированы на ближайшие дни. На них исследователи расскажут как выявлять и решать реальные проблемы, с чего начинать и так далее. На сайте есть ссылки и регистрация на мероприятия.

#opendata #openresearch #ngo
Один из проектов которые я давно мониторю - это Archives Unleashed [1]. Проект по созданию инструментов с открытым кодом для обеспечения доступности веб-архивов для исследователей. Они сделали несколько инструментов таких как:
- Archives Unleashed Toolkit - удобное ПО для анализа WARC файлов
- Warclight - каталог для поиска и просмотра по WARC файлам
- Archives Unleashed Cloud - удобный поиск данных в веб архивах собранных сервисом Archive-It
и ещё много обучающих материалов в формате Jupyter Notebook.

У них на днях вышел Community Report за 2017-2020 годы [2]

И, в принципе, это очень хороший пример организации доступа исследователей к открытым данным.

Сам проект делается межуниверситетской командой, с основным грантополучателем University of Waterloo, финансируется Mellon Foundation, на $462,000 в 2017 году на 36 месяцев и сейчас в июне 2020 года ещё на $800,000 и 36 месяцев. Переводя в рубли - это 11 миллионов рублей в год по первому гранту и 20 миллионов рублей в год по второму гранту.

На команду из постоянно работающих 4 человек и 7 человек вовлеченных в проект в той или иной форме.

Но главное результат, это действительно очень полезный инструментарий.

Ссылки:
[1] https://archivesunleashed.org
[2] https://news.archivesunleashed.org/archives-unleashed-community-report-2017-2020-d997510e5b70

#opendata #openaccess #digitalpreservation
А почему ОАО "Большая российская энциклопедия" не публикует отченость с 2016 года?
Ни на официальном сайте [1] ни на официальной странице раскрытия информации [2]
Нет, как минимум за 4 года:
- список аффилированных лиц
- состава совета директоров
- годовых отчётов
- годовой бухгалтерской отчетности

Но это не помешало Роспечати в 2019 году выдать им субсидию в 684 миллиона рублей на национальный энциклопедический портал

А то что Минкультуры в 2016 году прекратило у них закупать бумажную большую российскую энциклопедию в массовых количествах - это ещё не повод не публиковать отчетность.

Я, кстати, писал об этом ещё в прошлом году. И всё большие сомнения возникают в том насколько качественно будет сделан этот национальный портал.

Ссылки:
[1] https://greatbook.ru/oao-info.html
[2] https://disclosure.1prime.ru/portal/default.aspx?emId=7709654510

#budgets
Огромная по масштабам утечка кодов Intel, более 20гб доступны уже сейчас [1] и это только начало, главные риски Intel в том что там могут найти специально зашитые бэкдоры, смешным образом, по слову "backdoor" в исходном коде и в том что поскольку Intel не так много исходного кода раскрывало и подвергало публичной проверке кода на безопасность, есть хороший шанс на большое число zero-day уязвимостей которые будут ещё долго всплывать.

В Arstechnica подробнее о том как такое стало возможно [2], если коротко то плохо настроенный сервер в Akami CDN и криво настроенное ПО, а также пароли в формате Intel123 и intel123.

Нет 100% защиты от таких утечек, но в в целом это плохая ситуация для Intel. Если в этой утечке найдут бэкдоры или какие либо подтверждения сокрытия проблем с их процессорами, то это неизбежно отразится и на стоимости их акций и в виде проблем на рынке.

Ссылки:
[1] https://t.me/exconfidential/590
[2] https://arstechnica.com/information-technology/2020/08/intel-is-investigating-the-leak-of-20gb-of-its-source-code-and-private-data/

#security #leaks
Кроме того что в России не работает защита персональных данных, есть не менее острая проблема в том что защиты от спама тоже нет. Деятельность ФАСа в части борьбы с рекламой (спамом) не то что хреновая, её просто нет.

Если Вы когда либо регистрировали юридическое лицо или заключали контракт по 44-ФЗ или 223-ФЗ, то Вы знаете что спамеры начинают звонить ещё до того как Вы сами узнаете об этом контракте или факте регистрации юр. лица. Не гнушаются рекламными звонками и письмами никто - банки, посредники организации, посредники физ. лица и так далее. Казалось бы проводи контрольную закупку и выноси административные штрафы потоком (можно до 100 штрафов в сутки так выписывать).

То что у нас нет службы/инструментов/сервиса/уполномоченного по защите прав потребителей в цифровой среде - это, конечно, маленькая катастрофа, которая однажды станет большой.

#digital
Government Digital Service в Великобритании опубликовали серию стандартов по работе с государственными данными и API [1] и отдельно открытые стандарты по описанию метаданных для наборов данных и табличных файлов и описания самих табличных файлов [2]. Большая часть рекомендаций касается использования стандарта Dublin Core для ведения метаданных, стандарта OpenAPI для проектирования и документирования API.

Все они связаны с появлением Open Standards Board [3] состоящем из знаковых лиц с большим опытом работы с данными,в том числе за пределами Великобритании [4], можно сказать что это реформа в области стандартизации работы с данными в госсекторе. Кроме того есть ряд рассматриваемых сейчас стандартов обмена информацией [5]. Можно обратить внимание что при написании стандартов прямо указывается что аудитория их использования - это data scientist'ы и те кто публикуют госданные [6]. А также много интересных идей и обсуждений непосредственно в Github репозитории открытых стандартов [7] включая стандартизацию печати документов, наличия у каждого госдокумента уникального идентификатора и так далее.

Лично я не могу не отметить лаконичность описания каждого стандарта, формата, рекомендации. Это совершенно несопоставимо с чтением всего что касается стандартизации на международном уровне или у нас в стране (да и ещё много где).

Ссылки:
[1] https://www.gov.uk/guidance/gds-api-technical-and-data-standards
[2] https://www.gov.uk/government/publications/recommended-open-standards-for-government
[3] https://www.gov.uk/guidance/choosing-open-standards-for-government
[4] https://www.gov.uk/government/groups/open-standards-board
[5] https://www.gov.uk/government/publications/open-standards-for-government
[6] https://www.gov.uk/government/publications/open-standards-for-government/country-codes
[7] https://github.com/alphagov/open-standards/issues

#data #standards
Читаю отчётность одного учрежденного государством некоммерческого фонда, сопоставляю параллельно, сведения из его годового отчёта, бухбаланса и аудиторского заключения за 1 год, который для этого фонда тоже был неполным (он в середине года появился).
А там расходы на ФОТ 84 миллиона рублей на 8 человек менее чем на 6 месяцев, скорее месяцев на 4-5.

Пока это рекорд по скорости освоения средств через фонд оплаты труда у учреждённых министерствами и другими органами власти НКО.

Другие примеры тоже есть, но не таких масштабов.

Всё это из общедоступных источников информации, главное лишь знать где искать.
Названия и имена приводить не буду, потому что источник хоть и открытый, но узнай о нём кто-то - сразу закроют/прикроют/ограничат.

#government #digital
В Великобритании, в принципе, много хороших примеров того что нужно и правильно делать в цифровизации госуправления. Они были и остаются одними из лидеров и являются частью Digital 5, наиболее цифровых стран мира.

Помимо открытости стандартов, приведу в пример несколько очень правильных практик:
- Каталог государственных API [1]. Всего около 20 API с описанием, ссылками на доступ и документацию.
- Реестр реестров [2] уже не каталог, а цельная платформа для публикации разного рода реестров создаваемых центральным правительством UK. В России, кстати, есть как минимум 2 хороших примеров аналогичных проектов. Система НСИ Минздрава России [3] и система классификаторов Санкт-Петербурга [4].
- GOV.UK Notify [5] система уведомлений граждан через электронную почту, SMS и обычную почту. Централизованный сервис G2G для всех органов власти. Достаточно лишь зарегистрироваться и пользоваться им через сайт или API. Используется 780 организациями для 3015 сервисов, значительно дешевле чем любые коммерческие сервисы.

Таких примеров ещё множество по разным странам.

Ссылки:
[1] https://alphagov.github.io/api-catalogue/
[2] https://www.registers.service.gov.uk/
[3] http://nsi.rosminzdrav.ru
[4] http://classif.gov.spb.ru/
[5] https://www.notifications.service.gov.uk/

#government #digital