Ivan Begtin
8.06K subscribers
1.7K photos
3 videos
100 files
4.39K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Ростелеком выложил куски исходного кода [1] применяемого ЦИК РФ электронного голосования [2] с более подробным описанием на Habr'е [3].
Про проверку кода на доверительность/недоверительность электронного голосования и без меня напишут достаточно, поэтому я о другом.

Код совсем не впечатляет, без документации, без комментариев, ощущение что делалось "на коленках". Например, для инструмента cryptolib [4] на Python поверхностная проверка кода через pylint даёт качество кода 3.21 из 10. По остальным "кускам кода" ситуация не сильно лучше, уж незнаю какие почасовые рейты у разработчиков Ростелекома, но это уровень культуры программирования ниже среднего.

В любом случае это прецедент публикации госкода на Github'е, хорошо бы чтобы ещё и исполнительная власть туда подтянулась.

В принципе, из органов власти только у Счетной палаты есть публичный открытый репозиторий кода где мы выкладываем компоненты создаваемых проектов [5].

Ссылки:
[1] https://github.com/cikrf
[2] https://t.me/cikrossii/616
[3] https://habr.com/ru/company/rostelecom/blog/518090/
[4] https://github.com/cikrf/cryptolib
[5] https://code.ach.gov.ru/public

#opensource
Коллеги напоминают что код который выложил Ростелеком на Github'е (код ЦИК РФ, правильнее сказать, потому что Ростелеком тут подрядчик) так вот этот код не первый в таком роде и ранее на Github'е публиковал код ДИТ Москвы [1]

Я по прежнему считаю неправильным когда исполнительная власть делает сервисы для избирательных комиссий, но хорошо что хоть некоторые органы власти начинают вести если не открытую разработку, то раскрытие кода.

Если Вы знаете примеры репозиториев открытого кода публикуемых российскими органами власти и бюджетными учреждениями, присылайте мне. Я хочу свести их список

Ссылки:
[1] https://github.com/moscow-technologies

#opensource #moscow
Пока вот такой куцый список публичных проектов и репозиториев открытого кода созданного органами власти РФ и по их заказу [1]

Если знаете какие-либо упущенные, пишите мне тут или через issues в Github'е.

Ссылки:
[1] https://github.com/infoculture/awesome-gov-opensource-russia

#opensource
Давайте будем честными, так можно прийти ко всем замминистрам и интеграторам внедрявшим ФГИСы. Буквально почти без исключений.
Forwarded from RT на русском
Замминистра энергетики Анатолий Тихонов причастен к хищению 630 млн рублей. Об этом сообщает СК.

По данным следствия, Тихонов пытался скрыться, меняя машины и переезжая с квартиры на квартиру. Похищенные деньги были выделены Российскому энергетическому агентству Минэнерго России для создания информационной системы.

Помимо Тихонова, задержаны его советник Роман Рыжков, а также вице-президенты АО «ЛАНИТ» Владимир Макаров и Виктор Серебряков. Всем предъявлены обвинения по статье «Мошенничество».

Во время допроса Тихонов вину не признал
Открытые данные не только и не обязательно создаются государством. Blender, движок с открытым кодом по 3D рендерингу, теперь включает специальный сайт с открытыми данными по бенчмаркам Blender на разных платформах [1]. Все данные публикуются в виде ежедневных снапшотов более чем 123 тысяч измерений [2], начиная с 2018 года

Ссылки:
[1] https://opendata.blender.org/
[2] https://opendata.blender.org/snapshots/

#opendata #opensource
Правительство Абу Даби (город в Объединённых арабских эмиратах) запустило портал открытых данных [1] с 550 наборами данных, в первую очередь геоданных в формате API и слоёв для геоинформационных систем. Для сравнения, на портале открытых данных страны Bayanat.ae [2] опубликовано чуть менее 2400 наборов данных, в основном статистика в формате Microsoft Excel.

Ссылки:
[1] https://data.abudhabi
[2] http://data.bayanat.ae

#opendata
На сайте Европейского партнерства для демократии (EPD) появилась [1] совместная декларация [2] 29 организаций гражданского общества, специализирующихся на цифровых продуктах, о значимой прозрачности всей рекламы ( meaningful transparency on all ads ).

Это не только про открытые данные, а ещё и про технологическую и алгоритмическую прозрачность и открытый код и, в том числе, про стандартизацию библиотек, форматов и API применяемых в рекламном рынке.

Текст и предложения в нем весьма любопытные, весьма разумно проработанные, но, безусловно, если превратятся в регулирование то затронут не только мировых игроков рынка рекламы: Facebook, Google и др., но и российские крупнейшие онлайн сервисы, как минимум, Яндекс и MRG.

Тема довольно большая, я сделаю отдельный обзор всего что там предложено.

P.S. Конечно, очень расстраивает что во всех подобных инициативах Россия теперь упоминается исключительно в негативном контексте, в виде кейсов по дезинформации и fake news.

Ссылки:
[1] https://epd.eu/2020/09/08/pressreleaseadstransparency/
[2] https://epd.eu/wp-content/uploads/2020/09/joint-call-for-universal-ads-transparency.pdf

#opendata #opensource #ads
Правительство Великобритании опубликовало Национальную стратегию по работе с данными [1].
О стратегиях работы с данными я, обычно, делаю более подробные обзоры у себя в блоге begtin.tech, в ближайшие дни подготовлю обзор и этой стратегии.

Ссылки:
[1] https://www.gov.uk/government/publications/uk-national-data-strategy

#datastrategy #opendata
К вопросу о том что я писал ранее про проект Спутник и его закрытие [1] и об отсутствии "культуры провалов" в государственном ИТ (это, кстати, вместе с системой госзакупок и формирует ситуацию когда правоохранители прийти могут к каждому ответственному за государственные информационные системы, даже если это кристально "честный и порядочный человек" (c), они встречаются как и единороги, я верю в это (с).

В США GSA (U.S. General Service Administration) опубликовали руководство по снижению рисков при внедрении государственных ИТ проектов [2]. Начало там хорошее "Only 13% of large government IT projects succeed" из отчёта Standish Group "Haze" [3].

Вот лишь несколько рекомендаций оттуда, по стадии Планирование:
- Назначьте выделенных и уполномоченных владельцев продуктов чтобы возглавить усилия по разработке
- Вовлекайте конечных пользователей на ранней стадии и чаще в работу по разработке ПО
- Оценивайте риски в ситуациях сделать-или-купить, учитывайте все факторы при принятии решений
- Обеспечивайте открытость по умолчанию (открытость разработки кода, в первую очередь)
- Требуйте реализации инфраструктура-как-код и однокомандного развертывания и еже-спринтовую государственную верификацию функциональности
- Лидер должен устанавливать направления и усиливать команды
- Усилия по разработке должны быть четко определены для снижения риска и избежания перерасходов
- Ясный "путь до продукта" до заключения контракта
- Дайте командам доступ к инструментам взаимодействия которые им нужны для успеха
- Инвестируйте в технологии постепенно и управляйте бюджетом для управления рисками прототипирования

Всё это из Federal Field Guide [4]
И там же далее стоит обратить внимание и на остальные стадии. В целом материал там хорошо изложен и его даже если просто перевести на русский язык, то оно применимо и к госпроектам в России. Вернее могло бы быть применимо, если бы в последние годы у нас не было бы ровно противоположной тенденции - укрупнение ИТ проектов, сверхконцентрация усилия на мега-ФГИС и миллиардные расходы (и последующие посадки).

Ссылки:
[1] https://t.me/begtin/2103
[2] https://derisking-guide.18f.gov/
[3] https://www.standishgroup.com/sample_research_files/Haze4.pdf
[4] https://derisking-guide.18f.gov/federal-field-guide/

#opensource #guides #it #failures
Вышел доклад ОЭСР Building Capacity for Evidence-Informed Policy-Making (Создание потенциала для разработки политики, основанной на фактических данных), или как в России чаще употребляют термин : "Доказательная политика" [1]

Доклад интересен и большим числом примеров данных собираемых и используемых государственными органами для выстраивания долгосрочной политки.

Ссылки:
[1] https://www.oecd.org/publications/building-capacity-for-evidence-informed-policy-making-86331250-en.htm

#data #policy
Netflix заопенсорсили Polyglot [1] аналог Jupyter Notebook, но на Scala.
Выглядит весьма перспективно, для тех кто не любит Python и любит Scala.

Ссылки:
[1] https://medium.com/dataseries/netflixs-polynote-is-a-new-open-source-framework-to-build-better-data-science-notebooks-4bdab6b8d0ae

#opensource
В Австралии офис Национального дата комиссионера (комиссара?) опубликовал The Foundational Four [1] документ рекомендаций для государственных агентств по работе с данными.

Это хороший верхнеуровневый документ покрывающие такие вопросы как:
- лидерство
- организация работы
- стратегия работы с данными
- инвентаризация и владение данными


Ссылки:
[1] https://www.datacommissioner.gov.au/resources/foundational-four

#data #australia
Ещё одна новость из Австралии и также из офиса Национального дата комиссионера (комиссара?).
На днях они опубликовали черновик для дискуссии документа регулирующего аккредитацию пользователей, сервисов и посредников в работе с чувствительными государственными данными.

Фактически основная идея в том чтобы привести на законодательном уровне к единым правилам все регламенты предоставления доступа к чувствительными данным (перс. данные, коммерческая тайна и тд.)

Основные тезисы:
- аккредитацию проводит Office of National Data Comissioner
- типы аккредитаций: Data Custodian, Accredited Data Service Provider, Accredited User
- аккредитацию должны проходить коммерческие сервисы которые хотят получить статус Accredited Data Service Provider и выполнять функции по: услугам обмена данными (Data Sharing Services) и комплексным услугам интеграции данных (Complex data integration services)
- организации проходящие аккредитацию могут быть любого размера, но должны продемонстрировать что "в должной мере" ими владеют австралийские граждане

Попробую привести гипотетический пример того как это может работать.
1. Предположим что налоговая служба Австралии будет готова делиться с банками с данными о налогоплательщиках в целях обеспечения процедур due diligence.
Им необходимо аккредитоваться как Data Custodian.
2. Некоторые data стартапы хотят добавить эти данные в их услуги скоринга - они должны аккредитоваться как Accredited Data Service Provider.
3. Ряд банков хочет воспользоваться сервисами этих стартапов и для этого им необходимо получать статус Accredited User.

Это довольно жёсткая форма аккредитации, с контролем на каждом этапе: владельца, посредников и конечных получателей. Для некоторых видов данных, таких как персональные данные, возможно других сценариев и быть не может, в принципе же это могло бы накладывать большие ограничения, но, на самом деле, это механизм по снятию ограничений с тех данных которые сейчас просто закрыты для любого использования.

Этот принцип уже применяется в австралийском статистическом ведомстве [2] для интеграционных проектов работающих с детальными статистическими данными.

Ссылки:
[1] https://www.datacommissioner.gov.au/exposure-draft/accreditation
[2] https://statistical-data-integration.govspace.gov.au/about-3/about-these-guidelines

#data #australia
Не знаю как у Вас, а лично у меня возникает мощный диссонанс между тем что Росреестр контрактуется с Высшей школой экономики на 4,98 миллиона рублей [1] за НИР по теме "«Исследование вклада Росреестра в развитие экономики Российской Федерации»" и одновременно в Государственной Думе сейчас ко второму чтению готовится проект федерального закона № 962484-7 [2]

В котором, на 114 странице [3] текста представленного к первому чтению есть такие пункты:

24. Полученные органами государственной власти, органами местного самоуправления, организациями или гражданами сведения, содержащиеся в Едином государственном реестре недвижимости,
не могут быть предоставлены ими третьим лицам за плату.
25. Не допускается создание сайтов в информационно-телекоммуникационной сети "Интернет" (за исключением официального сайта), обеспечивающих возможность предоставления сведений, содержащихся в Едином государственном реестре недвижимости, и использование таких сайтов создавшими их гражданами, организациями или иными лицами в целях предоставления, в том числе организации
и (или) обеспечения предоставления, таких сведений заинтересованным лицам


Так каким же будет вклад Росреестра в экономику России после принятия этого законопроекта?

Ссылки:
[1] https://spending.gov.ru/goscontracts/contracts/1770656053620000057/
[2] https://sozd.duma.gov.ru/bill/962484-7
[3] http://sozd.duma.gov.ru/download/3B7F674D-DBE8-4140-84C3-D1C265483CEA

#data #government #rosreestr
Минцифра России опубликовали проект приказа " Об утверждении типовых условий контрактов на выполнение работ по созданию и (или) развитию (модернизации) государственных (муниципальных) и (или) иных информационных систем" [1]. Его можно прочитать и прокомментировать на regulation.gov.ru


Ссылки:
[1] https://regulation.gov.ru/projects#npa=108289

#it #government
Свежая история про китайские социальные рейтинги. В городе Suzou в 100 километрах от Шанхая сделали приложение Suzou App в которое добавили "civility score" (гражданскую оценку) [1] где изначально предполагалось хранить сведения о состоянии здоровья и историю поездок чтобы не разрешать некоторым гражданам посещать общественные места. Но, как оказалось, кроме этих данных там собирались ещё многие данные для формирования "личного портрета" гражданина.

Инициатива понравилась далеко не всем, её даже сравнивали с системой liangmin zheng (сертификат хорошего гражданина) японской армии на оккупированных китайских территориях.

В итоге приложение свернули после 3 дней эксплуатации, с формулировкой что ещё есть многое для доработки.


Ссылки:
[1] https://algorithmwatch.org/en/story/suzhou-china-social-score/

#privacy #china
Ещё один интересный проект в рамках европейской исследовательской программы Horizon 2020 - это проект ARCHIVER (Archiving and preservation for research environments) [1] в котором Евросоюз финансирует разработку и пилотирование технологий архивации данных петабайтного объёма и выше.

В проекте три крупных исследовательских центра: CERN, DESY и PIC и две консалтинговые компании.
В проекте собраны основные сценарии использования для которых нужны новые технологии [2] и уже сформировались 5 консорциумов компаний, в основном вокруг крупных облачных игроков [5] таких как Google и Amazon

P.S. Архивация и долгосрочное сохранение - это одна из моих любимых тем и очень жаль, конечно, состояние цифровизации этой отрасли в России. Остаётся лишь писать про лучшие практики в мире

Ссылки:
[1] https://www.archiver-project.eu/
[2] https://www.archiver-project.eu/deployment-scenarios
[3] https://www.archiver-project.eu/design-phase-award

#data #archival #eu
Свежий договор с ГКУ "Мосгортелекома" с Максима Телеком на 434 миллиона рублей [1]. По сайту госзакупок на "услуги обработки данных", а согласно ТЗ на "Оказание услуги единого оператора городского Wi-Fi.". Из профиля на Госзатратах [2] можно увидеть что это не самый крупный контракт Максимателеком с органами власти Москвы, но стоит обратить внимание что именно здесь, в их ТЗ максимально подробно описано как именно собираются сведения об устройствах пользователей. Заодно может быть кто-то поможет найти распоряжение ДИТ Москвы 64-16-141/20 от 27 марта 2020 года в соответствии с которым эта система мониторинга создаётся и которого, по неизвестным причинам, нет на mos.ru и других официальных ресурсах официального опубликования НПА.

Ссылки:
[1] https://spending.gov.ru/goscontracts/contracts/2770194454620000028/
[2] https://clearspending.ru/supplier/inn=7703534295&kpp=771001001

#moscow #dit #privacy