Ivan Begtin
7.98K subscribers
1.83K photos
3 videos
101 files
4.53K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
В России до сих пор проекты состоящие только из базы данных, без иного продукта до сих пор не воспринимаются как общественные проекты. А тем временем в США Urban Institute [1] создали проект открытых данных по образованию Education Data Portal [2] которые отдаёт API с данными по школам, школьным округам и колледжам. Это некоммерческий проект с финансированием от Overdeck Family Foundation, что характерно, его потребители не граждане, а ИТшники, программисты, которые на его основе сделают свои проекты.

Ссылки:
[1] https://www.urban.org
[2] https://educationdata.urban.org/documentation/

#data #opendata
Ещё один способ рассказывать об открытых данных - это периодическая таблица влияния открытых данных (Periodic table of open data impact factors) [1].

The GovLab, авторы такой карты, умеют правильно расставлять акценты не на технических аспектах работы с открытыми данными.

Ссылки:
[1] http://odimpact.org/periodic-table.html

#opendata
Объём информационного бизнеса в Испании составляет 1.7 миллиардов евро, это примерно 128 миллиардов рублей. Это всё и конкретные примеры можно узнать из отчёта Asedie. Informe Sector Infomediario 2018 [1] выпускаемого ассоциацией ASEDIE.

Ссылки:
[1] http://www.asedie.es/assets/informe-sector-infomediario-2018.pdf

#opendata
Tim Berners-Lee анонсировал Solid [1], это сервис, сервер и приложения позволяющие создать экосистему при которой пользователь сам контролирует свои данные. Важный шаг, но насколько возможен такой мир? Сейчас дата-корпорации контролируют безусловно большую часть перс-данных пользователей. Пользователи имеют лишь малую долю контроля, иногда имея права экспортировать свои данные. Возможна ли модель которую Тим продвигает? Я не знаю, но определенно согласен с тем что она лучше имеющейся.

Ссылки:
[1] https://www.inrupt.com/blog/one-small-step-for-the-web

#privacy
Зачем нужна архивация веб-сайтов? Например, для того чтобы исправлять ссылки в википедии когда исчезают опубликованные статьи на которые указывают ссылки на страницах Википедии. Бот IABot от Internet Archive находит и исправляет такие ссылки [1], на сегодняшний день он исправил более 9 миллионов ссылок в статьях на 32 языках.

Ссылки:
[1] https://meta.wikimedia.org/wiki/InternetArchiveBot
[2] http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued/

#digitalpreservation
VentureBeat пишет о том что китайские спецслужбы внедряли специальные чипы для дистанционного контроля серверов на базе Supermicro [1], ссылаются на большой материал Bloomberg [2] где всё подробно рассказано. Да, что и говорить, китайские спецслужбы, в отличие от российских, показывают немалую изворотливость и способность играть в длинную историю с внедрением таких чипов.

А многочисленные издания пишут о рутките LoJax [3] который ESET выловили на днях и в котором обнаружили опасную способность внедряться в BIOS материнских плат, в то что называют UEFI (Extensible Firmware Interface) [4] используемый для управления операционными системами и работающий на уровне выше ОС, что позволяет через него контролировать компьютер и избегать внимания антивирусов.

Ссылки:
[1] https://venturebeat.com/2018/10/04/china-reportedly-hacked-supermicro-servers-used-by-apple-and-amazon/
[2] https://www.bloomberg.com/news/features/2018-10-04/the-big-hack-how-china-used-a-tiny-chip-to-infiltrate-america-s-top-companies
[3] https://www.welivesecurity.com/2018/09/27/lojax-first-uefi-rootkit-found-wild-courtesy-sednit-group/
[4] https://ru.wikipedia.org/wiki/Extensible_Firmware_Interface

#privacy #security
В Новой Зеландии рассматривают черновик плана открытости страны на 2018-2020 годы [1]. Из неожиданного, обратите внимание на пункт Government's use of algorithms. Основной смысл в том чтобы алгоритмы в госсистемах были бы понятно описаны и доступны гражданам и гражданскому обществу.

В мае они же выпускали отчет Report: Review of Government Algorithms[ 2] и инициировали ревизию алгоритмов в госсистемах.

О чём это говорит? О том что в разговорах о роботизации госуправления важно помнить что за роботами (алгоритмами и AI) нужен надзор, а его сейчас никто не осуществляет. Но это вопрос ближайших 2-х лет, в том числе в России. Потому что после digital government следующим хайпом будет AI government.


Ссылки:
[1] https://www.ogp.org.nz/assets/Resources/55c0ef139b/New-Zealand-Action-Plan-2018-2020-draft.pdf
[2] https://data.govt.nz/assets/Blog-files/Review-of-Government-Algorithms-Report-14-May-2018-for-release.pdf

#governance #ai #data
27 сентября вышел отчёт ОЭСР " Open Government Data Report: Enhancing Policy Maturity for Sustainable Impact" [1] посвящённый обзору правил, законов и практик работы с открытыми госданными в странах ОЭСР и их партнёрах. Сканированную версию отчёта можно прочитать онлайн [2], а последнюю версию индекса работы с данными OURData Index за 2017 год можно увидеть и скачать здесь [3].

Начну с главного, России нет в этом обзоре. Поскольку Россия не член ОЭСР и уже не партнёр организации, то найти там себя мы не сможем, но можно узнать о том как устроено всё у других.

Главное что есть в этом документе - это чётко структурированные различные аспекты доступа к госданным, начиная с хранения версий датасетов, продолжая условиями доступа, бесплатного или за деньги, к государственным реестрам. С большим числом очень конкретных примеров в странах лидерах.

Читая эти примеры я никак не могу сказать что "в России всё плохо" и наоборот что всё хорошо. Скорее мы самоизолируемся, придумываем собственные практики, часто неплохие, ещё чаще странные или бесполезные. Но важнее что они чаще всего оторваны от реальных потребителей данных и мировых практик.

А вот в мире несколько важных трендов:
1. Open by default. А то есть доступность данных по умолчанию и постепенное открытие реестров за которые государство ранее взимало деньги - это реестры организаций и кадастровые данные, например.
2. Открытые данные как основа управления данными. Через тему открытых данных наводится порядок в госданных в принципе, проводится их каталогизация
3. Enterprise Data Inventory. Органы власти должны инвентаризировать все свои данные и на основе этой инвентаризации определять то что публикуется онлайн. В 2015 году Sunlight Foundation писали о том что такие реестры ещё и должны быть общедоступны [4], а в США это требование по ведению EDI были в Implementation Guide для Open Data Policy [5]. Например можно увидеть EDI у департамента по делам ветеранов с более чем 3800 файлами в каталоге из которых 322 не доступны для публики. Схожие требования есть и в других странах ОЭСР.

Ссылки:
[1] https://www.oecd-ilibrary.org/governance/open-government-data-report_9789264305847-en
[2] https://read.oecd-ilibrary.org/governance/open-government-data-report_9789264305847-en
[3] https://read.oecd-ilibrary.org/governance/government-at-a-glance-2017/ourdata-index-government-support-for-data-re-use-pillar-3-2017_gov_glance-2017-graph140-en
[4] https://sunlightfoundation.com/2015/01/22/enterprise-data-inventories-should-be-public-not-hidden-away/
[5] https://project-open-data.cio.gov/implementation-guide/
[6] https://www.data.va.gov/dataset/va-enterprise-data-inventory

#opendata #opengov
Многие знают термин GONGO (Government oriented NGO) который характеризует некоммерческие организации де-факто помогающие осуществлять госполитику и напрямую или опосредованно аффилированные с государством. Гораздо реже звучит термин BINGO - это Big International NGO, подвид некоммерческих международных организаций особо большого размера.

Их не так много в мире, около 50, и годовая выручка некоторых из них может превосходить 1 миллиард фунтов стерлингов, они работают всегда во множестве направлений и охватывают более 50+ стран каждая.

В исследовании "Whither large International Non-Governmental Organisations?" [1] (Куда движутся крупные международные некоммерческие организации) разбирается то что с ними происходит сейчас и какие варианты у них есть для развития, в том числе, цифровой трансформации которая явно в таком виде не упоминается, но присутствует по сути. Всё это в контексте Великобритании

Вот лишь несколько вызовов с которыми BINGO сталкиваются:
1. Растущая зависимость от государственных грантов и контрактов.
2. Развитие технологий позволяет финансировать местные сообщества напрямую и становится непонятной роль крупнейших НКО которые обычно создают цепочку из партнёров через которых осуществляют свои программы.
3. Рост организаций привел к существенной забюрократизированности и, соответственно, снижению эффективности.
4. Неготовность организаций к быстром соответствию меняющемуся контексту, использованию технологий и тд.
5. Снижение доверия к BINGO по причинам необоснованного роста зарплат руководителей НКО, недостаточной коммуникацией с поддерживающими их гражданами.

Итоговые рекомендации в 3-х вариантах направлений развития:
1. Фрагментация
Разделения крупной INGO на множество меньшего размера и выделение в отдельную компанию всей обслуживающей и сервисной инфраструктуры. Фактически это модель франшиз и децентрализации под единым брендом.

2. Консолидация
Приобретение малых НКО/компаний которые могут обеспечить качественное технологическое изменение или же объединение с похожими INGO в общую группу. Пример: Age UK было создано в 2009 году на базе Help the Aged и Age Concern

3. Платформизация
Или Уберизация. Цифровая трансформация - это примеры Wikipedia, Airbnb, We Farm. Примерами могут быть ведущие онлайн сообщества и стартапы, идея в полной перезагрузке работы организации.


Исследование хотя и небольшое и хотя и охватывает только аспекты и особенности НКО в Великобритании, очень интересное и в осмыслении будущего НКО в России.

Ссылки:
[1] https://www.birmingham.ac.uk/generic/tsrc/documents/tsrc/working-papers/working-paper-142.pdf

#ngo #analytics
Kiaolo [1] - это визуализация дискуссий. Маленький стартап который позволяет структурировать аргументы в обсуждении спорных тем, выстраивает их в иерархии и даёт веб-интерфейс для обсуждений. Например, обсуждение универсального базового дохода [2]

Кто знает, может быть именно таким должно быть обсуждение законопроектов и иных госинициатив?

Ссылки:
[1] https://www.kialo.com
[2] https://www.kialo.com/should-there-be-a-universal-basic-income-ubi-1634/1634.0=1634.1+1634.505+1634.7697-1634.3847+1634.4993-1634.5134

#discussions #startups
The Economist выложили данные и скрипты для расчёта Индекса Бигмака [1]. Много данных, ещё с 1986 года, когда впервые Big Mac Index [2] был заявлен.

Все подробности на их Github репозитории [3]

Ссылки:
[1] https://medium.economist.com/peeling-back-the-curtain-487bd3be0c47
[2] https://www.economist.com/bigmac
[3] https://github.com/TheEconomist/big-mac-data
Знаете почему в обсуждениях, пересказанных встречах и материалах, например, к Национальной системе управления данных (почти нет материалов, но всё же). Так вот знаете почему к этому всему нет отсылок к результативному международному опыту и примеров?

Потому что нет успешных мировых проектов в этой области, а вот провальных много. И проваливались они из-за исключительной сложности интеграции негармонизированных данных, тяжёлом процессе разработки стандартов и сильнейшему сопровотивлению всех отраслевых регуляторов. Ну или незаинтересованности.

Очень не хочется быть мрачным предсказателям и объяснять куда пойдет и что будет с этой затеей без должного проектирования.

#government #data
Госуслуги дают мощный сбой в Сургуте [1] и в Красноярске [2], Татарстане [3] [4], Оренбурге [5] и это не в первый и не в последний раз, ранее были сбои при подключении школ и детских садов в Бурятии [6].

Причина сегодняшнего сбоя в запуске Единого государственного реестра записей актов гражданского состояния созданного ФНС России. Благая цель по объединению всех ЗАГСов в одну федеральную государственную информационную систему, в первую очередь, в целях учёта налогоплательщиков, привела к тому что система работает с перебоями.

Но беда не только в этом, беда в том что на федеральные госинформсистемы сейчас завязана вся цифровая инфраструктура субъектов федерации. Кабель оборванный пьяным экскаваторщиком, сбой ПО, вирусная атака, отказ оборудования и многое другое может привести к катастрофическим последствиям резкой де-цифровизацией значительных областей нашей жизни завязанных на централизованные сервисы.

Это страшнее чем внедрение Большого брата, это хрупкий мир.

Ссылки:
[1] https://sitv.ru/arhiv/news/gosuslugi-dali-sboj-v-surgutskom-zagse-naplyv-posetitelej/
[2] www.prima-tv.ru/news/society/49550-v_zagsakh_obrazovalis_ogromnye_ocheredi/
[3] https://ntr-24.ru/index.php?newsid=52251
[4] http://www.evening-kazan.ru/news/na-portale-gosuslug-rt-proizoshel-proizoshel-sboy-nedostupna-podacha-zayavleniy-v-zags.html
[5] http://www.orenday.ru/novosti/novostnaya-lenta/091018160605
[6] http://vtinform.com/news/147/130940/

#госуслуги
В Ирландии Open Data Governance Board выделил 30 тыс. евро на Open Data Engagement Fund, Фонд вовлечения работы с открытыми данными [1] с максимальным финансированием одного проекта до 5 тыс. евро.

В рублях это 2,3 миллиона рублей фонд, и до 380 тыс. рублей соответственно. Прямо скажем суммы очень скромные, но в подробностях его работы можно узнать что из него дают средства в том числе на презентации, блоггинг, проведение мероприятий, разработку приложений и тд. [2]

Лично я давно думал о необходимости такого Фонда микрогрантов в России, и даже не так много денег нужно на него, менее 10 миллионов рублей в год с учётом отличий по численности граждан и размере территории, но в России институциональная поддержка каких-то тем вроде открытых данных очень усложнена.

Ссылки:
[1] https://data.gov.ie/pages/open-data-engagment-fund
[2] https://data.gov.ie/uploads/page_images/2018-09-21-094351.783158Open-Data-Engagement-Fund-2018-2019.pdf

#opendata #ireland
Wikileaks опубликовали карту дата центров Amazon [1] и нанесли их на карту мира [2]. Всё это из конфиденциального документа утекшего в Wikileaks относительно недавно [3].

Amazon давно был известен своей секретностью по местонахождению их дата центров, не раскрывая их местонахождения много лет.

При этом у Amazon уже 34% рынка облачных сервисов [4], их активно использует разведывательное сообщество США, Минобороны США и тясячи компаний и госучреждений. Это всё со ссылками и примерами и упоминают WikiLeaks

Сейчас дата-центры Amazon'а есть во всех ключевых юрисдикциях: США, Евросоюз, Япония, Китай, Австралия.
Но они полностью отсутствуют в странах СНГ, арабских странах и в Африке.

Ссылки:
[1] https://wikileaks.org/amazon-atlas/
[2] https://wikileaks.org/amazon-atlas/map/
[3] https://wikileaks.org/amazon-atlas/document/AmazonAtlas_v1/AmazonAtlas_v1.pdf
[4] https://www.srgresearch.com/articles/cloud-revenues-continue-grow-50-top-four-providers-tighten-grip-market

#privacy #hosting #amazon
Оказывается Андрей Мовчан перевёл выступление Рубини по поводу криптовалют в сенате США. Вот лишь несколько фраз оттуда [1]
---
«Крипто – самый серьезный скам и (уже лопнувший) пузырь в истории, а блокчейн – самая переоцененная технология, которая в реальности не лучше чем таблица Экселя или обычная база данных»
«Падение биткоина на 70% было хорошим исходом – более 95% остальных криптовалют обвалились более чем на 95%. 81% ICO оказался простым мошенничеством, 11% умерли не родившись, только 8% торгуются на биржах»
«Называть криптовалюты «шиткоин» - это оскорбление субстанции, которая является важным органическим удобрением»
---
Лично у меня, в маленькой чёрной записной книжечке и в онлайн контактах давно напротив некоторых людей стоит маленькая пометочка: "Осторожно! Пропагантировал(-а) крипту и блокчейн". И если блокчейну (вернее: distributed ledger technology) ещё, в ооочень редких случаях, но есть применения, то крипта мало чем от скама отличается.

Ссылки:
[1] https://www.facebook.com/andrei.movchan/posts/2140224592700406

#crypta #scam
Новость которая чуть было не прошла незаметно "Adobe, Microsoft and SAP announce the Open Data Initiative to empower a new generation of customer experiences" [1]

Майкрософт, SAP и Adobe запустили свою инициативу по Open Data.

Что описывают как:
- каждая организация владеет и обеспечивает полный прямой контроль за своими данными
- клиенты могут включить процессы основанные на ИИ для получения инсайтов и знания из унифицированных поведенческих и операционных данных
- широкая экосистема партнёров должна помочь легкому подключению моделей данных к решениям

Иначе говоря - это не про открытость, а про "открытое предложение для бизнеса". Определение никак не бьётся с определением из Open Definition [2] и я предвижу уже многочисленные конфликты который возникнут из-за названия "Open Data Initiative". Понятно что вкладывается принцип что это "Открытая инициатива по работе с данными", а открытость - это открытость для вендоров и партнёров, но, близость терминов до смешения не поможет ей.

Тем временем соответствующие разделы на сайте Microsoft [3], Adobe [4] и SAP [5] уже появились.

Ссылки:
[1] https://news.microsoft.com/2018/09/24/adobe-microsoft-and-sap-announce-the-open-data-initiative-to-empower-a-new-generation-of-customer-experiences/
[2] http://opendefinition.org
[3] https://www.microsoft.com/en-us/open-data-initiative
[4] https://www.adobe.com/experience-platform/open-data-initiative.html
[5] https://www.sap.com/about/announcement/open-data-initiative.html

#opendata