Ivan Begtin
8.03K subscribers
1.75K photos
3 videos
101 files
4.45K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Рубрика "Без комментариев". Я так понимаю что пока Meduza [1], а вскоре и остальные СМИ пишут о том что база паспортов всех проголосовавших через электронное голосование оказалась в открытом доступе.

Плохое в этом то что вообще была эта программа и то что она оказалась в открытом доступе (как и база к ней). Это не фатальная утечка, там только номера паспортов, но крайне неприятная, в виду контекста. Я пока не могу придумать рабочий кейс при котором просто список номеров паспортов без иной информации может повредить, но, как бы, даже такого лучше не допускать. Если, кстати, кто-то понимает как такие утечки могут наносить ущерб - напишите в @begtinchat

Хорошее, в том что при таких масштабах голосования неизбежно должны были быть и ошибки в паспортах и я не удивлюсь если сам реестр недостоверных паспортов на который ссылается Медуза, мягко скажем, не вполне достоверен. Во всяком случае доверия к данным МВД у меня лично по умолчанию значительно ниже чем к данным в Минкомсвязи.

P.S. То что некоторые телеграм каналы и не только эти сведения распространяют, это как раз разница политактивизма и профессионального подхода. Лично я считаю правомерным распространять причины утечек только после выполнения последовательных шагов:
- предупредить источник утечки данных
- передать журналистам для публикации материала (при условии отсутствия раскрытия самих персональных данных)

А распространять саму базу - это, мягко скажу, если доказать что это перс данные - то незаконно, а даже если не доказать, то неэтично. Конкретные примеры каналов приводить не буду.

Ссылки:
[1] https://meduza.io/feature/2020/07/09/vlasti-fakticheski-vylozhili-v-otkrytyy-dostup-personalnye-dannye-vseh-internet-izbirateley

#pdleaks #leaks
Я всё не успел прокомментировать новость что Amazon AWS приходит в Россию с партнерством с Mail.ru. Новость нельзя сказать что плохая, больше качественной инфраструктуры - всегда лучше. Но, всегда есть нюансы.

Я бы оценил вероятность что российский бизнес резко рванет переводить свою инфраструктуру из серверов Amazon в других юрисдикаций в российкуую - как невысокую. И так можно обеспечить доступность веб-контента через CDN, а недоступность данных для российских силовиков куда актуальнее чем скорость подключения.

А вот зарубежным компаниям которые ещё не локализовали в России персональные данные россиян будет некуда деваться. Если Mail.ru/Amazon будут действовать в тесном контакте с Роскомнадзором, то могут усилить давление на тех кто ещё не хранит данные в России.

#hosting #aws #thoughts
По поводу "утечки паспортов" с электронным голосованием не могу не продолжить. Много лет назад, когда деревья были большими, а я меньше работал с большими данными, я начал (и, эх, не закончил) книгу под названием "скрытые данные" которая была посвящена извлечению данных из многочисленных кодов, численных и буквенных, которые нас окружают. Там было о том как читать ОГРН, ИНН и так далее, бесконечное число кодов для расшифровки. Более 99 я тогда проанализировал и, даже, вздох, тогда ещё думал формулировать их онтологию ибо многие были взаимосвязаны.

Номера паспортов в России - это тоже некоторые уникальные коды, не менявшиеся структурно десятилетия, чем-то похоже на Social Security Numbers в США, с одной стороны объект пристального внимания и страха, с другой стороны малозначащие сами по себе.

Что важно знать о номере паспорта:
- номера паспортов не уникальны (не спрашивайте меня, я не отвечу), просто посмотрите на портал госуслуг и вспомните что там СНИЛС, а не номер паспорта. Подробностей тут не расскажу
- в отличие от других кодов у него нет проверочного номера
- первые 2 цифры серии паспорта - это код субъекта федерации, следующие 2 цифры серии - это номер года печати бланка, как правило соответствует или предшествует дате выдачи паспорта.
- остальные цифры инкрементальны, но нет какого-то известного алгоритма как они распределялись по УФМС/ОВД для выдачи поэтому нельзя оценить по номерам паспортов, например, общее число выданных паспортов за год или дату выдачи конкретного.

Из-за всего этого прямое раскрытие номеров паспортов проголосовавших дистанционно - это, конечно, не раскрытие персональных данных. Это раскрытие факта голосования, да, но не персональных данных формально.

Фактически эту базу стоит воспринимать как состоящую из 3 значений:
- номер паспорта
- признак что его владелец жив
- признак что его владелец использовал интернет-голосование (имеет телефон, компьютер и тд.)

Для всех кто находится в правовом поле эти данные ничего не дадут потому что большинство подобных пользователей не оперируют базами с паспортными данными людей.

А вот если мы говорим о неэтичных/пограничных моделях использования данных, то они, конечно, есть.
1. Всяческие торговцы базами "база покупателей БАДов", "база игроков Форекс", "база посетителей казино" могут теперь обогащать свои данные дополнительной информацией, голосовал ли человек онлайн. Можно ли это применить во вредоносных целях? Я по прежнему не могу придумать. Вижу лишь возможность обогащения одних баз данных другими данными.
2. Контроль голосования на крупных предприятиях. Если предположить что на некоторых предприятиях контролируют явку граждан на выборы, то о проверке голосовавших на УИКах руководство предприятий может договориться на месте, а проверку проголосовавших онлайн можно сделать только с помощью вот такой вот базы
3. Косвенная социология, вроде той что делала медуза по номерам бланков паспортов, выявляя потенциальные возрастные и территориальные группы голосовавших. Очень сомнительная социология, потому что нет возможности сравнить с демографией голосовавших в принципе, а не только онлайн.

Выводов у меня нет, я по прежнему считаю что персональных данных здесь нет, но публикация базы паспортов (базы хэшей) - это ошибка.

Кстати, когда в мае 2019 года я писал о том как реально извлекать закодированные персональные данные из цифровых подписей к документам - вот это была реальная утечка данных. Хочешь узнать чей-то СНИЛС, найди документ который этот человек подписал цифровой подписью (с)

Там тоже применялось "кодирование информации", но без хэш сумм.

Вся эта ситуация и многочисленные ранее говорят нам постоянно лишь об одном непреложном факте - в России нет регулятора защищающего права граждан на приватность. Обсуждать роль Роскомнадзора - это просто бессмысленно тратить время. Нужна ли реформа в этой сфере? Необходима.

#privacy #personaldata
3-6 сентября этого года служба статистики ООН будет проводить онлайн хакатон AIS Big Data hackathon [1] где AIS - это automatic identification system, система автоматической идентификации судов в море позволяющей им не сталкиваться друг с другом. Эта система работает за счёт специальных устройств посылающих и принимающих сигналы в VHS диапазоне и в этой системе уже более 100 тысяч судов по всему миру. Её можно сравнить с технологией ADS-B [2] для самолетов.

До 31 июля они собирают заявки на участие которые предоставят помощь и наборы данных.

Вся эта история интересна тем что наличие AIS создаёт источник альтернативных данных, уже есть коммерческие сервисы которые умеют монетизировать отслеживание судов (в основном это логистические стартапы), но также это возможность получать важные экономические индикаторы в реальном времени.

Ссылки:
[1] https://unstats.un.org/bigdata/events/2020/ais-hackathon/
[2] https://ru.wikipedia.org/wiki/ADS-B

#opendata #un #hackathon
Я тут ранее много ругался на то как ведут свои реестры и информационные системы Минэкономразвития, Минюст России и многие другие органы власти и время от времени хвалил то Минкультуры России то Минфин России за то что у них ситуация обстоит получше.

И это, конечно правда, если сравнивать. Но если сравнивать даже наиболее продвинутые из органов власти с реальным миром, то и там всё, мягко говоря, далеко не так хорошо.

Например, единый портал бюджетной системы (ЕПБС) является частью системы "Электронный бюджет". Большая система со множеством подсистем, реестров и данных которые публикуются там регулярно. На мой взгляд система, с одной стороны значительно переросла себя по сложности того что там публикуется и и по навигации по ней, а с другой стороны эта сложность превращается в огромное число несвязанных разделов на сайте и, что значительно хуже, разделов неактуальных.

Среди размещенных там, самых разных срезов данных, в основном предоставляемых на веб страницах сайта и иногда в виде открытых данных, не меньше чем в 10 разделах данных не обновлялись с января 2018 года (2.5 года).

Самый наглядный и очевидный всем пример - это паспорта участников бюджетного процесса [1].

Если посмотреть на них то:

- у Министерства цифрового развития название всё ещё "Министерство связи и массовых коммуникаций", а руководитель не назначен (сменился в январе 2020 г., 6 месяцев назад)
- у Роскосмоса руководителем всё ещё является Комаров Игорь Анатольевич (с 28 мая 2018 года руководителем является Дмитрий Рогозин)
- у Генпрокуратуры России руководитель всё ещё Чайка Юрий Яковлевич (сменился в январе 2020 года, 6 месяцев назад)
- у Верховного суда руководителем указан первый заместитель Верховного судьи Серков Петр Павлович. Интересно, а Лебедев об этом знает?

И так далее. Там много неактуальной информации как по внесённым участникам бюджетного процесса, так и по тем которые появились или изменились и особенно по их руководителям.

Я привожу этот пример исключительно как понятный всем пример того как официальные государственные сведения становятся недостоверными по той причине что не актуализируются, причём неактуализируются они не в "замороженных" или "выводимых из эксплуатации" информационных системах. А во вполне хорошо профинансированных.

Аналогично можно пройтись по многим другим разделам на сайте во многих из которых нет данных за последние 2.5 года.

На случай если сайт закроют на техобслуживание, скриншоты у меня в фэйсбуке https://www.facebook.com/ibegtin/posts/10157556711463263

Ссылки:
[1] http://budget.gov.ru/epbs/faces/p/%D0%91%D1%8E%D0%B4%D0%B6%D0%B5%D1%82%D0%BD%D0%B0%D1%8F%20%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0/%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA%D0%B8%20%D0%B1%D1%8E%D0%B4%D0%B6%D0%B5%D1%82%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%BF%D1%80%D0%BE%D1%86%D0%B5%D1%81%D1%81%D0%B0

#finances #opengov #opendata #errors
На regulation.gov.ru выложен документ "О проведении эксперимента по созданию, миграции и развитию государственных сервисов и информационных систем органов государственной власти Российской Федерации и государственных внебюджетных фондов на единой цифровой платформе Российской Федерации «ГосТех»" [1]

Я давно хочу начать декомпозировать НПА в понятную форму, понемногу начну "экспериментировать" на этих НПА

Уровень: Постановление Правительства РФ

Вовлечённые стороны
- Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации;
- Автономная некоммерческая организация «Аналитический центр при Правительстве Российской Федерации»;
- Федеральное агентство по управлению государственным имуществом;
- Федеральный фонд обязательного медицинского страхования;
- Федеральная служба государственной регистрации, кадастра и картографии;
- государственные учреждения, иные юридические лица, обеспечивающие реализацию задач ...ж
- иные организации, индивидуальные предприниматели, а также граждане, согласившиеся на участие в эксперименте на добровольной основе;
- поставщик платформы разработки, которая представляет собой набор технологических компонентов и сервисов, позволяющих разрабатывать и эксплуатировать прикладное программное обеспечение
- Федеральная служба безопасности (не указана явно в списке участников, указана в тексте постановления)
- ФСТЭК России (не указана явно в списке участников, указана в тексте постановления)

Создаваемые оргструктуры:
- межведомственная рабочая группа для координации мероприятий, необходимых для реализации эксперимента

Создаваемые документы:
- требования к платформе «ГосТех»
- оценка результатов эксперимента, в том числе в части определения эффективности применения платформы «ГосТех (? нечеткое определение ?)
- доклады в Правительство Российской Федерации, включающих в том числе предложения по развитию и доработке платформы «ГосТех»
- предложения по целевой архитектуре и модели данных платформы «ГосТех»
- методическая поддержка проведения эксперимента (? нечеткое определение ?)
- модели угроз и модель нарушителя безопасности информации и техническое задание на создание системы защиты информации в рамках компонентов платформы разработки (по каждому эксперименту);

Сервисы
- сервисы для взаимодействия между гражданами, бизнесом и государством в сфере учета и управления государственным имуществом
- сервисы в рамках системы обязательного медицинского страхования;
- сервис, направленный на удобство осуществления кадастровой деятельности и оказания услуг по выполнению кадастровых работ;
- сервис, направленный на повышение удобства совершения сделок с недвижимостью
- сервис, направленный на интеграцию и предоставление заинтересованным лицам аналитической информации на основе сведений Единого государственного реестра недвижимости, сведений, содержащихся в фонде данных государственной кадастровой оценки и в иных источниках
- иные сервисы, определяемые Министерством цифрового развития, связи и массовых коммуникаций Российской Федерации

Финансирование
- Национальная программа «Цифровая экономика Российской Федерации».

Ссылки:
[1] https://regulation.gov.ru/projects#search=01/01/07-20/00105928&npa=105928

#laws #regulation
Только-только ИТ отрасли пообещали льготы и поддержку, как Следственный комитет создал отдел расследований в ИТ [1], а у ИТ подрядчиков Почты России начались обыски [2].

Лично я не испытываю больших симпатий российскому интеграторскому рынку, было время когда создавать ИТ системы и поставлять оборудование государству было сверх-маржинально (и коррупционно). Но, главное чтобы лечение болезни не оказалось хуже самой болезни.

Я подозреваю что очень скоро системные интеграторы будут не рваться на первые позиции в рейтингах поставщиков по госзаказу, а предпринимать все возможные усилия чтобы там не светиться.

Ссылки:
[1] https://www.interfax.ru/russia/716874
[2] https://www.tadviser.ru/index.php/%D0%9F%D0%B5%D1%80%D1%81%D0%BE%D0%BD%D0%B0:%D0%95%D0%BC%D0%B5%D0%BB%D1%8C%D1%87%D0%B5%D0%BD%D0%BA%D0%BE%D0%B2_%D0%A1%D0%B5%D1%80%D0%B3%D0%B5%D0%B9_%D0%95%D0%B2%D0%B3%D0%B5%D0%BD%D1%8C%D0%B5%D0%B2%D0%B8%D1%87#.2A2020:_.D0.97.D0.B0.D0.B4.D0.B5.D1.80.D0.B6.D0.B0.D0.BD.D0.B8.D0.B5_.D0.B8_.D0.BE.D0.B1.D1.8B.D1.81.D0.BA.D0.B8_.D1.83_.D0.BF.D0.BE.D0.B4.D1.80.D1.8F.D0.B4.D1.87.D0.B8.D0.BA.D0.BE.D0.B2

#it #russia
Относительно недавняя новость о том что OpenAI помогает автоматически создавать исходный код на Python и визуальная демонстрация этого [1] - это, на самом деле, не несёт никаких рисков работе программистов и программной инженерии в целом.

Я неоднократно уже писал ранее, важнейшая особенность разработки ПО в последние годы - это то что программисты, по факту, чаще выступают "склейщиками" кода, интегрируя десятки готовых открытых библиотек и создавая своё ПО на их основе. В отличие от программирования в классическом понимании - это перевод программной инженерии в архитектурную плоскость. В практической работе сейчас важнее продумать на базе чего ты будешь писать свой код, поддерживается ли выбранная библиотека, выполняет ли она необходимые функции и тд.

То что ИИ может заменить часть простых и рутинных задач - это, в целом неплохо, но, если честно не так сильно отличается от генераторов кода на основе таблиц в базах данных или UML моделей или платформ NoCode/LowCode. Генерация кода для ORM - это то чем давно уже никого не удивишь.

В итоге, то что ИИ может писать простой код - это может сильно облегчить работу многим разработчикам, но, на прикладном уровне, ИИ не умеет ещё управлять сложностью разрабатываемого кода. А давление на ИТ рынок разработки будет куда большим не от этих новинок, а от прихода большего числа непрофессионалов работающих с NoCode платформами.

Ссылки:
[1] https://youtu.be/fZSFNUT6iY8

#ai #openai #codegen
Когда в 2024 году появятся беспилотные такси, они должны сразу везти должников к судебным приставам, а преступников в розыске в полицию или блокировать двери и не выпускать пока не подойдут должностные лица или нарушитель штраф не заплатит?

#2024 #taxi #future
На CNews, в очередной раз, заметка о том как надо поправить госзакупки в ИТ чтобы они стали "нормальными" [1]. Такие заметки там выходили раз 10 за последние 15 лет, я лично немало писал у себя в блоге, колонок для разных медиа и тд. о том как реформировать ИТ закупки.

У меня тоже много разных идей и соображений, но главная, увы, неразрешима. 44-ФЗ необходимо переделывать полностью, но никто на это в ближайшие годы морально не готов, а бенефициары текущего состояния хорошо удерживают статус кво. Так что лично у меня хороших новостей о регулировании госзаказа нет.

Ссылки:
[1] https://www.cnews.ru/articles/2020-07-15_dvuhgodichnye_sprinty_pochemu_sushchestvuyushchaya

#goszakaz
Вокруг технологий и их применения появляются новые международные соглашения/партнерства/союзы.

15 июня анонсировано [1] создание GPAI (читается как Gee-Pay), глобального партнерства искусственного интеллекта в котором участвуют: Австралия, Канада, Франция, Германия, Индия, Италия, Япония, Мексика, Новая Зеландия, Республика Корея, Сингапур, Словения, Великобритания, США и Европейский союз.

Секретариат партнерства будет создан на базе ОЭСР [2], в Париже, а само партнёрство это результат 2-х летней цифровой дипломатии Канады и Франции [3] [4].

Основные темы партнёрства:
- ответственное использовании ИИ
- управление данными
- будущее труда/занятости
- инновации и коммерциализация

Ранее во Франции был анонсирован проект Ambition Inria 2023 [5] включающий развитие технологий ИИ, а Евросоюз ранее публиковал брошюру Artificial Intelligence. A European Perspective [6].

В подобных партнерствах важно не только те кто в них участвует, но и то кого там нет. А нет в нём Китая, которого ещё недавно, в январе 2020 в статье Forbes называли "AI сверхдержавой" [7]. Отсутствие Китая в этом альянсе да и то что во главу поставлен ОЭСР, это всё признаки того что GPAI создаётся именно в противовес Китаю и то что вступление туда России маловероятно. Будут ли появляться другие аналогичные партнёрства на международном уровне, например, на базе ASEAN в Азии, будет ли Китай объединять вокруг себя потребителей продуктов ИИ китайских корпораций и ещё много других вопросов на которые ответы пока неизвестны.

Ссылки:
[1] https://www.canada.ca/en/innovation-science-economic-development/news/2020/06/joint-statement-from-founding-members-of-the-global-partnership-on-artificial-intelligence.html
[2] https://www.oecd.org/going-digital/ai/oecd-to-host-secretariat-of-new-global-partnership-on-artificial-intelligence.htm
[3] https://www.gouvernement.fr/en/launch-of-the-global-partnership-on-artificial-intelligence
[4] https://www.gouvernement.fr/en/artificial-intelligence-canada-and-france-work-with-international-community-to-support-the
[5] https://www.gouvernement.fr/en/inria-for-scientific-technological-and-industrial-leadership-in-digital-technology
[6] https://publications.jrc.ec.europa.eu/repository/bitstream/JRC113826/ai-flagship-report-online.pdf
[7] https://www.forbes.com/sites/cognitiveworld/2020/01/14/china-artificial-intelligence-superpower/

#ai #oecd #partnership
CNews пишет о том что сайт с законопроектами Госдумы скоро будет недоступен во многих браузерах поскольку использует TLS 1.0, а скоро этот стандарт передачи данных не будет поддерживаться в Firefox и других браузерах [1]

Долго думая что добавить к этой новости, не могу не вспомнить о том что, например, сайт обращений к Президенту РФ letters.kremlin.ru до сих пор не имеет своего сертификата [2]. Там только относительно недавно стал отзываться https с сертификатом от другого домена [3].

Раньше, для того чтобы, например, губернатору знать о том на что жалуются граждане Президенту, достаточно было договориться с крупнейшими местными провайдерами чтобы перехватывать все отправленные сообщение от граждан направляемые через незащищённый http протокол.
Да и сейчас, пока своего сертификата у домена нет, тоже можно, лишь чуть сложнее, но ничего нереального. Тем более что по умолчанию letters.kremlin.ru только http и поддерживает.

Но это всё, разумеется, исключительно умозрительная, нереалистичная ситуация. Конечно же, ни один губернатор, по причине высоких моральных качеств и этических принципов, не мог даже задуматься о подобном.

Ссылки:
[1] https://www.cnews.ru/news/top/2020-07-16_sajt_s_zakonoproektami_gosdumy
[2] http://letters.kremlin.ru
[3] https://letters.kremlin.ru

#tls #ssl #https #privacy
Одна из ключевых "особенностей" российского государственного ИТ рынка - это непонимание законодателей и регуляторов как он устроен, со всеми посредниками, перепродавцами, "добавителями" добавленной стоимости и так далее.

Я приведу в пример организацию ИТ закупок в Австралии и Новой Зеландии.

В Австралии существует такой способ государственных закупок как Whole-of-Government Arrangements (Всегосударственные соглашения) [1], их аналог в Новой Зеландии - это All-of-Government Contracts (Всегосударственные контракты) [2].

Их смысл в том что, либо правительство, либо уполномоченный орган власти заключает рамочное соглашение с одним или несколькими поставщиками и к этому соглашению *присоединяются* госзаказчики. Как правило эти соглашения, либо содержат заранее согласованные цены, либо формулы цен в зависимости от продукции.

Например, соглашение Агентства цифровой трансформации Австралии (DTA) с компанией IBM [3] было заключено в 2018 году и продолжит действовать до 2023 года. Соглашение устанавливает правила к которым может присоединиться любое государственное агентство.

Остальной текст не помещается в пост в канале и его можно прочитать у меня в блоге https://begtin.tech/aus-procurement/

#australia #ict #procurement
Wall Street Journal пишет о академическом проекте в США по мониторингу военных объектов в России на основе данных собираемых приложениями для смартфонов [1].

Хотя проект и называется академическим, но данные которые в нём используются предоставляются поставщиком Babel Street Inc. на основе их продукта Locate X. О Babel Street Inc. [2] мало общедоступной информации, самый подробный рассказ о них есть в мартовской публикации в Protocol о большом числе их контрактов с правительственными агентствами в США [3], а из их публичной активности известна лишь регистрация торговой марки в 2017 году [4] и ряд госконтрактов упомянутых в статье выше.

Собственно из этих госконтрактов и появляются сведения о Locate X Data [5] который предоставляется заказчику как фид данных.

Причём ранее о продуктах Babel Street было больше информации, они упоминались в отчете Homeland Security за 2016 году, и там были ссылки на описание их продукта Babel X по анализу и категоризации текстовых данных, стоимостью в $14640 за одно рабочее место в год по базовому тарифу и по $41640 по энтерпрайз тарифу.

Это очень большая цена за ПО подобного типа.

Более всего вся эта ситуация похожа на что в какой-то момент Babel Street как поставщик для спецслужб в США и Пентагона (их первый клиент) добавили в линейку своих продуктов покупаемые ими с рынка данные о геопозиционировании конкретных пользователей смартфонов в привязке к местности. Анонимность тут очень условна, поскольку зная контекст и трек передвижений, идентифицировать пользователя возможно давно.

Вопрос лишь где они закупают эти данные? Согласно статье в Protocol - этот поставщик Gravy Analytics [7] о которых ранее в 2020 году медиа писали о том что у них и у компании Venntel [8] правоохранительные органы США закупают данные по точному геопозиционированию.

SDK от Gravy Analytics используются во многих трекерах в ПО для смартфонов. Они партнёрствуют с Adobe [9] и с Axiom [10] и со многими другими. При этом, например, в Exodus Privacy нет трекеров от Gravy Analytics [11], во всяком под текущим их брендом.

Из их презентации за март 2019 года [12] что они собирают данные из более чем 400+ миллионов устройств в объёме до 25 миллиардов событий в сутки (300 тысяч в секунду).

Gravy Analytics, конечно же, не единственная компания собирающая и торгующая данными пользователей. В данном случае ситуация была в выявлении конкретных лиц на испытании на полигоне в Нёноксе под Северодвинском [13].

Здесь мне бы хотелось сказать что-то ободрящее, вроде того что "так будет не всегда" и тотальная слежка за гражданами останется в прошлом, а не как сейчас когда тотальная слежка за потребителями даёт возможности разведкам следить за военными объектами в других странах.

Но объективная ситуация такова что если по умолчанию предполагать что такая возможность есть как минимум у США и Китая (США как страны агрегатора данных сервисов и Китая как агргегатора данных на уровне производителей мобильных устройств), то российских спецслужб в этом списке нет только из-за технических ограничений и из-за того что в России отечественные "национальные ИТ чемпионы" удобных сервисов для мобильной экосистемы создать не сумели и даже какое-нибудь приложение Минфина РФ "Бюджет РФ" [14] или приложение "МВД России" от МВД России [15] или Минкомсвязи "Госуслуги Стопкоронавирус" включают код передачи данных Google, а не AppMetrica от Яндекса [16].

В качестве послесловия добавлю лишь что на фоне тотальной технологической слежки продолжающаяся шпиономания в стиле 20-го века выглядела бы смешно, если бы не было так грустно.
Дмитрий Бутрин в Коммерсанте пишет о продолжении "киборгизации" нацпроектов [1]. Здесь хорошо бы вспомнить аналогичные попытки запустить единую систему госуправления на базе ГАС "Управление". Хотя "запустить" тут будет слишком сильным словом. И про практику внедрение такой вот иерархической проектной модели управления в некоторых субъектах. Куда логичнее, на самом деле, чем на федеральном уровне. Но реформа госуправления глобально давно необходимо, начнётся ли она от этих изменений или ими только и закончится - покажет время.

Ссылки:
[1] https://www.kommersant.ru/doc/4424229
#government
Дайджест по данным и технологиям, с минимальными комментариями:
- Подкаст "How to make the most of AI? Open up and share data " с вице-президентом Open Data Institute, Jeni Tennison [1]
- Семь проектов поддержанных Open Data Institute грантами в 15-20 тысяч фунтов [2]
- Мониторинг воздействия COVID0-19 на сельское население Северной Африки [3]
- Reall - инвестиционная и инновационная компания по продвижению доступного строительства домов в развивающихся странах, делятся данными о их проектах. Для доступа нужна только авторизация [4]
- Digital Leaders в Великобритании 30 июля проводят соревнование питчей о бизнес моделях на основе открытых данных [5]. Не знаю будет ли там что-то новое, но любопытно.
- Economic Value of Open Data [6] исследование Евросоюза о влиянии открытых данных. Объём рынка связанного с открытыми данными оценивается в 184 миллиарда евро к 2025 году.
- в блоге Microsoft о революции открытых данных в Европе [7] за авторством вице-президента по отношениям с Европой. Это публикация в блоге EUPolicy [8], поэтому она ранее выпадала из под моего мониторинга, но теперь понятно что там будет больше публикаций об открытости.

Ссылки:
[1] https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/how-to-make-the-most-of-ai-open-up-and-share-data?cid=other-eml-alt-mip-mck
[2] https://www.ukauthority.com/articles/odi-funds-seven-data-sharing-projects/
[3] https://blogs.worldbank.org/opendata/monitoring-impact-covid-19-and-climate-change-pastoral-populations-sahel?cid=dec_tt_data_en_ext#_ftn3
[4] https://www.reall.net/data-dashboard/global/
[5] https://www.eventbrite.com/e/building-a-sustainable-business-using-open-data-mini-pitch-competition-tickets-113886950936
[6] https://www.europeandataportal.eu/en/impact-studies/open-data-impact
[7] https://blogs.microsoft.com/eupolicy/2020/07/02/europes-open-data-revolution/?_lrsc=0a8a7a2b-c8d0-4feb-be16-05687ca4e303
[8] https://blogs.microsoft.com/eupolicy/

#opendata #digest
Я не успеваю реагировать на все "цифровые новости" длинными комментариями. Постараюсь пробежаться по ним здесь, коротко.

Цифровые трудовые книжки
То что сейчас всех пока добровольно, потом, более вероятно, одномоментно переводят с бумажных трудовых книжек на так называемые цифровые электронные книжки.
В 2012 году я по просьбе одной небольшой организации делал документ видения/дорожной карты внедрения электронных трудовых книжек. Задача была увлекательная, заняла у меня пару недель, и по её окончанию у меня окончательно сложилось мнение что трудовые книжки - это исключительно советский рудимент трудовых отношений актуальный в СССР как в глобальной мета-корпорации, но нефункциональный в современных реалиях. Я думал эта идея тогда померла, но нет, оказывается живее всех живых.
В выигрыше от их внедрения, в первую очередь, контролирующие и надзирающие органы поскольку невозможно будет вносить изменения/правки/записи задним числом. В случае белого-легального бизнеса в выигрыше будет работник (частично). Большинству работодателей это невыгодно, слишком много сложившихся практик это порушит и скорее приведёт к уходу из видимой зоны части трудовых отношений. Поэтому и наиболее вероятный сценарий развития что в цифровую трудовую книжку в определенный момент потребуют вносить все временные договора и договора ГПХ, а может быть, и договора с самозанятыми.
Ах да, ещё в выигрышном положении оказывают банки и все кто занимаются скорингом.
Лично я бы рассматривал эту историю как начало пути к "единому реестру сделок" и значительному упрощению доступа государства к коммерческой тайне. Кстати, и трудовые отношения тоже коммерческая тайна, если что. Перевод их в цифру для многих служб безопасности может быть редчайшей находкой и проблемой.

Экспериментальный режим доступа к перс. данным
НПА которое сейчас продвигает Минэкономразвития и которое уже активно критикуют и будут критиковать дальше, на самом деле, это другая крайность очень плохого регулирования персональных данных в России. Начнём с того что в текущем виде закон о персональных данных не устраивает никого кроме продавцов сертифицированного оборудования. А ещё точнее продавцов сертификации для оборудования. По хорошему регулирование перс. данных - это часть регулирования цифрового потребительского рынка. Для него необходим свой цифровой Роспотребнадзор или глубокая перетряска текущего, аналогового, лампового Роспотребнадзора. И, соответственно, выдерживание баланса интересов граждан и бизнеса.
Проблема сейчас в том что классические механизмы разрешения на использование данных через подпись на бумаге должны быть заменены цифровыми разрешениями и правом цифрового отзыва разрешения на использование данных и, соответственно, право на запрос собственных данных в информационных системах по аналогии с требованиями GDPR и CCPA.
Но важно помнить тут что важен баланс между правом гражданина и правом компаний на обработку данных. Экономика данных в мире сейчас почти на 100% построена вокруг данных о потребителях. Чрезмерные ограничения на использования данных приводят к тому что компании продавцы уходят в серый рынок, меняют юрисдикции и так далее.

Концепция развития искусственного интеллекта
Хорошая задумка, но по прежнему это дом без фундамента. Потому что в ситуации отсутствия национальной стратегии работы с данными, акцент на ИИ, при недоступности данных собираемых государством, не даст возможности полномасштабного развития ИИ. Для сравнения такие стратегии есть во многих странах, наиболее масштабная стратегия единого цифрового рынка Евросоюза. В принципе государство российское пока очень мало делает для доступности больших объёмов данных для ИИ. Посмотрим изменится ли это в ближайшем будущем.

#reactions
Казначейство США открыло специальный портал с открытыми данными по госфинансам FiscalData [1]
Сейчас там опубликовано 18 наборов данных охватывающих такие темы как:
- Debt - госдолг
- Financial Summaries - сводные финансовые показатели
- Interest&Exchange Rate - проценты и курсы обмена
- Revenue - доходы
- Saving Bonds - выпуски облигаций
- Spending - расходы

Некоторые данные, такие как госдолг, представлены за 230 лет, начиная с 1790 года. Данных там много, особенно данных по платежам.
Делает портал команда DataLab [2], это внутренняя команда Казначейства США делающая также их портал раскрытия данных о закупках - USASpending.gov [3]

Правда практически не осталось независимой оценки качества этих данных. В последний раз Sunlight Foundation проводили оценку качества данных в USASpending.gov в 2012 году [4] с общим выводом что с качеством данных там, как бы не очень.

Как бы то ни было - новый источник данных, это всегда радость сердцу и много любопытного. К слову, там же можно немало найти о контрактах в России и ближайших к нам странах.

Ссылки:
[1] https://fiscaldata.treasury.gov
[2] https://datalab.usaspending.gov/
[3] https://usaspending.gov
[4] https://sunlightfoundation.com/clearspending/

#spending #usa #fiscaldata
То что сейчас происходит с компанией Garmin [1] [2], отключение их почты, коллцентров и все сервисов - это, конечно, куда больше чем просто временная недоступность. Это как раз и есть ситуация с падением критической инфраструктуры. Да, Garmin - это крупнейший производитель спортивных гаджетов, но куда важнее то что Garmin это ещё и сервис flyGarmin используемый пилотами по всему миру.

Что немаловажно, flyGarmin используется и пилотами ВВС США [3], включая пилотов разведывательных самолётов U-2.

Для рядовых же пользователей наибольшие риски в том что их устройства "превратились в кирпичи" (нефункциональны) и то что могут быть потеряны накопленные данные за многие годы.

Как предотвращать подобные ситуации и возможно ли? Важнейшим драйвером интернета вещей многие годы было отсутствие регулирования и запретов на централизацию. Устройства пользователей давно перестали хранить их данные, все передаётся на сервера и через сервера же проходит их обновление.


Ссылки:
[1] https://vc.ru/marketing/145101-garmin-upal-i-molchit-sportivnoe-soobshchestvo-v-shoke
[2] https://finance.yahoo.com/news/garmin-global-outage-caused-ransomware-161117855.html
[3] https://theaviationist.com/2020/07/25/garmin-aviation-app-and-services-down-in-ransomware-attack/

#iot #garmin
Правительство Великобритании опубликовало руководство по открытости государства Open Government Playbook [1].

Это перечень действий которые должны выполнять органы власти по направлениям:
- Прозрачность
- Вовлечение
- Подотчётность
- Цифровизация
- Коммуникации

Все направления разделены на стадии: До (Before), В процессе (During) и После (After) по каждому из которых небольшой чёткий список действий.

Ссылки:
[1] https://www.gov.uk/government/publications/open-government-playbook

#opengov