Ivan Begtin
7.98K subscribers
1.83K photos
3 videos
101 files
4.53K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Первый трансатлантический корабль ведомый искусственным интеллектом совершит своё путешествие в сентябре 2020 года [1]. Вместо капитана будет AI Captain на базе IBM Power AC922 с использованием IBM Power9 CPUs и NVIDIA V100 Tensor Core GPUs.

Корабль, тримаран, поплывёт без команды и будет способен действовать даже в сложных ситуациях. Подробнее в ролике о корабле на канале IBM News [2].

Честно говоря уже интересно узнать результат и прогноз того сколько моряков останутся без работы через 10-20 лет.

Ссылки:
[1] https://www.maritime-executive.com/article/sea-trials-begin-for-artificial-intelligence-captain
[2] https://www.youtube.com/watch?v=q7wBl3IPg08

#ai #ships
Сайт открытого правительства open.gov.ru, де-факто, перестал существовать. Теперь при его открытии выдаётся ошибка. Всем кому понадобятся материалы с их сайта и других ресурсов - все они у нас сохранены в Национальном цифровом архиве, скоро мы сделаем нормальный навигатор по ресурсам в архиве, пока же пишите если что-то понадобится
Много лет я пишу о том что в современном мире государства конкурируют не только и не столько между собой, сколько с другими институтами общества. Пример с коронавирусом и общественной паникой не первый и не последний. Не государства, а самые разные активисты, НКО, исследовательские центры создают сейчас мобильные приложения, онлайн сервисы и тд. для информирования граждан. Пример, приложение для iPhone вышедшее недавно [1], сделано небольшой ИТ компанией. А репозиторий с данными собираемыми в JHU CSSE уже давно доступен [2].

Если посмотреть на официальный канал оперативного штаба Москвы по коронавирусу [3], то он появился 2 марта, в то время как анонимные телеграм каналы начали "хайпожорить" на коронавирусе начиная со второй половины января.

В Российским Минздраве создали страничку про коронавирус 13 марта (вчера) [4] и поставили на главной странице его рядом с баннером нацпроектов. Однако данные по выявленным случаям не обновляли уже больше 27 часов (последнее обновление в 13 марта в 16:12), а также ни в коей мере не сделали информирование более наглядным.

Похожая страница есть на сайте российского Роспотребназдора [5], не синхронизованная со страницей на сайте Минздрава и не содержащая статсведений, они в других разделах сайта Роспотребнадзора.

В мире только проектов на открытом коде посвящённых коронавирусу несколько сотен [6]

Как должно быть организовано информирование граждан? Как государства(-о) должно заполнять информационный вакуум?

Ссылки:
[1] https://coronatracker.samabox.com/
[2] https://github.com/CSSEGISandData/COVID-19
[3] https://t.me/COVID2019_official
[4] https://www.rosminzdrav.ru/ministry/covid19
[5] https://rospotrebnadzor.ru/about/info/news_time/news_details.php?ELEMENT_ID=13566
[6] https://weileizeng.github.io/Open-Source-COVID-19/

#opengov #government #coronavirus
Тем временем у многие международных НКО занимающихся открытыми данными меняются и корректируются приоритеты. Например. Open Knowledge Foundation в этом году плавно подходит к теме ответственности искусственного интеллекта и алгоритмов. В посте в блоге OKF [1] приводятся основные направления: подотчётность, мониторинг и улучшение. Всё это с большим акцентом на просвещение.

В этом нет ничего удивительного, действительно эти темы, наряду с приватностью, становятся одними из ключевых в развитии "цифровой правозащиты".

Ссылки:
[1] https://blog.okfn.org/2020/03/13/open-knowledge-ai-and-algorithms/

#opendata #okf #ai #literacy
В Kaggle объявили конкурс для дата сайентистов по анализу статей по коронавирусу COVID-19 [1]. Для конкурса предоставили набор данных из 29 тысяч статей посвящённых коронавирусу из которых 13 тысяч статей с полным текстом [2]. Конкурс организован Белым домом в коалиции с ведущими исследовательскими центрами.

Вопросы на которые пытаются найти ответы в этом конкурсе (привожу их на английском языке):
What is known about transmission, incubation, and environmental stability?
What do we know about COVID-19 risk factors?
Sample task with sample submission
What do we know about virus genetics, origin, and evolution?
What do we know about vaccines and therapeutics?
What has been published about ethical and social science considerations?
What do we know about non-pharmaceutical interventions?
What do we know about diagnostics and surveillance?
What has been published about medical care?
What has been published about information sharing and inter-sectoral collaboration?

Ссылки:
[1] https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
[2] https://pages.semanticscholar.org/coronavirus-research

#data #opendata #contest
В Коммерсанте вышла заметка "Очень нормативный русский" [1] про исследование Института государственного и муниципального управления НИУ ВШЭ [2] о сложности российских законов. Сам текст исследования найти не удалось, выводы в нём вполне очевидные, но подкрепленные сравнительными оценками о том что российские законы давно уже стали нечитаемыми/нечитабельными и, как следствие, создающими барьер к их пониманию не-юристами и особенно рядовыми гражданами.

Я напомню что это не первое подобное исследование. Денис Савельев из Европейского университета делал более масштабный анализ законодательства в 2018 году [3] где на ещё большей выборке законов показывал их усложнение.

Я писал об этом в декабре 2018 года [4], коллеги использовали наши наработки в оценки сложности языка [5]. В случае с НИУ ВШЭ интересен их "Индекс синтаксической сложности нормативно-правовых актов", новая методика оценки сложности текстов. Очень надеюсь что они опубликуют её и исходный код подсчёта сложности текстов на её основе.

К этим публикациям мне также есть что добавить. Помимо сложности текста проблема существует ещё и в общем числе принимаемых ежегодно законов и других НПА и в их объёме. Текст может быть простым, но огромным, законов в России принимается избыточно много и тексты их весьма раздуты. И это проще даже измерять чем сложность языка.

Я выложил как раз сегодня на data.world статистические цифры по результатам анализа "Федеральных законов", "Распоряжений Президента", "Указов Президента" на основе данных с kremlin.ru [6]. По ссылке можно увидеть их в виде наглядного графика с 1994 по 2019 годы [7] и там видно как всё менялось. Однако я заранее предупрежу что... не все указы, распоряжения Президента и федеральные законы публикуются на kremlin.ru. С 1994 года по 2019 там не были опубликованы 92 федеральных закона (они точно должны публиковаться) и многие указы и распоряжения. В основном потому что официальным сайтом для публикования является сайт publication.pravo.gov.ru, а всё что публикуется на сайтах Президента и Правительства никак не регламентировано.

Честно говоря за всей работой над проектами в Счетной палате не доходят руки до полномасштабного исследования, так что могу только по хорошему порадоваться за коллег проделавших такую интересную работу.

Ссылки:
[1] https://www.kommersant.ru/doc/4291932
[2] https://ipag.hse.ru/
[3] https://enforce.spb.ru/images/analit_zapiski/memo_readability_2018_web.pdf
[4] https://t.me/begtin/1218
[5] http://plainrussian.ru
[6] https://data.world/infoculture/lawstats/
[7] https://data.world/infoculture/lawstats/workspace/insight?insightid=97c6e0df-8cbe-4c91-a9f5-0005e12028bd

#laws #data
Структура числа и общего объёма федеральных законов в РФ с 1994 по 2019 годы https://data.world/infoculture/lawstats/workspace/insight?insightid=97c6e0df-8cbe-4c91-a9f5-0005e12028bd
Между Кот-Д'Ивуаром и Танзанией расположилась Россия на 94 месте в международном индексе верховенства закона [1] за 2020 год, подготовленном в World Justice Project [2]. Индекс состоит из 8 компонентов и только в одном из них, "Открытом правительстве" [3] Россия не на самых низких позициях находится между Тунисом и Монголией и это место 69 в этой группе. Во всем остальном оценки довольно низкие.

Хуже всего у России позиция в блоке "Ограничения на государственную власть", там Россия на 115 месте [4]

Лидируют Дания, Норвегия, Финляндия, Швеция, Нидерланды. Привычные лидеры во всех рейтингах качества государства, демократии и открытости.

Ссылки:
[1] https://worldjusticeproject.org/rule-of-law-index/factors/2020/Russian%20Federation/
[2] https://worldjusticeproject.org/
[3] https://worldjusticeproject.org/rule-of-law-index/factors/2020/Russian%20Federation/Open%20Government/
[4] https://worldjusticeproject.org/rule-of-law-index/factors/2020/Russian%20Federation/Constraints%20on%20Government%20Powers/

#opendata #opengov #ratings #wjp
Первый вопрос который возникает при дистанционной работе - а зачем офис теперь держать? Это ж сколько денег. А госорганы вообще могут массовую распродажу недвижимости организовать раз в текущей ситуации научатся работать дистанционно.

Давайте делиться хорошими практиками организации корп. культуры при дистанционной работе.

Кто что применяет, что хорошо работает, а что не очень

Дистанционные планёрки - как, с помощью чего?
Регулярные созвоны команд?
Совместные мероприятия онлайн?

В Notion.so есть хорошая вики по дистанционной работе [1]
Какие ещё есть качественные систематизированные ресурсы, книги, гайды?

Обсудить можно у меня в чате @begtinchat или в комментариях к посту.

P.S. Если у Вас есть инсайды о том как сейчас организуется дистанционная работа в госорганах, пожалуйста, поделитесь, буду писать обзорный текст об этом.

Ссылки:
[1] https://www.notion.so/Remote-work-wiki-1b21ef5501714fffa9f5c5c25677371f

#distant
В Новой газете статья "Большой медбрат" [1] за авторством Дарьи Козловой погружает нас в мир тотальной слежки государств на фоне коронавируса. Там есть упоминания, и Китая, и Ирана, и России, но важнее то что эта слежка есть сейчас практически везде. А где нет, там в ближайшее время она появится, потому что ничто так не позволяет ограничивать права граждан как глобальные катастрофы.

Нарушения приватности под идеей защиты от коронавируса куда более обоснована, логична и неоспорима чем прикрываться борьбой с террористами, преступниками, педофилами или нарушителями копирайта. И проблема куда глубже - проблема в том что по мере развития текущего кризиса права будут ограничиваться всё больше.

Права на доступ к информации (конечно же чтобы избежать паники), права на передвижение (конечно же чтобы избежать распространения болезни), права на приватность (чтобы снизить риск граждан) и так далее по списку.

И всё это будет обосновано, и от того только страшнее.

Ссылки:
[1] https://novayagazeta.ru/articles/2020/03/20/84424-bolshoy-medbrat

#coronavirus #privacy
Минфин России, пока на уровне письма [1], но будет неудивительно если и на уровне НПА в будущем, упростил правила госзакупок на время борьбы с коронавирусом, о чём пишет Екатерина Мереминская в статье в Ведомостях [2]. В каком-то смысле это было неизбежно, но и мы почувствуем это в довольно короткое время. Объявленные режимы повышенной готовности и ЧС в субъектах федерации дадут возможность закупок у ед. источника даже заказчикам в районах, пока, не затронутых коронавирусом.

Это неизбежно приведёт к снижению не только конкуренции на торгах, но и к общему числу активных участников. На портале spending.gov.ru мы ещё в конце 2019 года опубликовали индикатор числа активных поставщиков [3], это индикатор по числу юридических лиц получавших какие-либо контракты по 44-ФЗ в течение года. Моё предсказание что их число в течение 2020 года сильно измениться. А для нашей команды - это вопрос актуализации этого или иного индикатора показывающего состояние контрактной системы в оперативном режиме.

Возвращаясь к письму Минфина России как к отражению ситуации в экономике страны в целом, у меня лично очень пессимистичные ощущения.
Вполне возможно что с каждым днём нам нужны меньше панели мониторинга нац проектов и больше мониторинга состояния экономики и подготовка программы её восстановления.

Ссылки:
[1] https://www.minfin.ru/ru/document/?id_4=129863-pismo_minfina_rossii_ot_19.03.2020__24-06-0621324_ob_osushchestvlenii_zakupok_u_yedinstvennogo_postavshchika_podryadchika_ispolnitelya_pri_vvedenii_rezhima_povyshennoi_gotovn
[2] https://www.vedomosti.ru/economics/articles/2020/03/20/825822-pravila
[3] https://spending.gov.ru/analytics/indicators/5/

#goszakaz
Data Ventures [1], коммерческий (!) проект статистической службы Новой Зеландии (Stats NZ) в котором статистическая служба предоставляет данные и API о мобильности населения на уровне отдельных городов и поселений страны.

Данные собираются в партнёрстве с сотовыми операторами, обрабатываются, полностью деперсонализируются и предоставляются в разрезе дней недели и часов дня по любой территории.

Сейчас проект существует в режиме G2G и основные потребители - это власти территорий страны, озадаченные вопросами территориального планирования, развития городов и так далее.

Подробнее о проекте писали СМИ в Новой Зеландии в октябре 2019 года [2], а в декабре 2019 в блоге проекта появилась наглядная визуализация структуры дня и недели [3] у множество поселений, с объяснением почему так всё устроено.

Ссылки:
[1] https://dataventures.nz
[2] https://www.tvnz.co.nz/one-news/new-zealand/data-cellphone-towers-used-help-government-make-infrastructure-decisions
[3] https://medium.com/data-ventures/where-we-live-work-play-a15a191b334f

#opendata #data #dataventures
Forwarded from Госзатраты
‼️ Минпромторг РФ закупит аппараты ИВЛ для больниц по всей стране у единственного поставщика ‼️

Правительство России поручило Минпромторгу закупить аппараты искусственной вентиляции легких и экстракорпоральной мембранной оксигенации для медучреждений в регионах страны. Распоряжение за подписью Михаила Мишустина датировано 21 марта.

Как следует из документа, Минпромторг РФ в 2020 году будет закупать указанное оборудование у единственного поставщика — АО «Концерн Радиоэлектронные технологии» (входит в состав Госкорпорации «Ростех»). Исполнитель отвечает и за доставку товара. При этом к исполнителю не будут применять условия предоставления обеспечения контракта и гарантийных обязательств.

Минздрав РФ, в свою очередь, направил в Минпромторг адресный список медучреждений, в которых есть потребность в таких поставках. Это ведомство будет отвечать за установку оборудования на местах.

Текст распоряжения: http://amp.gs/0E2N
В Евросоюзе вышел обзор применения новейших технологий в госзакупках, в виде каталога интересных практик [1] и в виде доклада [2].

В докладе очень много примеров по таким направлениям как:
- 3D печать
- Искусственный интеллект и машинной обучение
- Дополненная и виртуальная реальность
- Большие данных и дата аналитика
- Блокчейн
- Интернет вещей
- Роботизируемая автоматизация процессов
- Роботы и дроны

Всего 96 примеров, включая страны ЕС и многие страны за пределами ЕС. Есть там и пример из России, в виде системы Vnesheconombank (VEB) Blockchain project описываемой как обеспечивающей лучшую защиту документов и обеспечение приватности.

Много примеров из США, Украины и Австралии. А я приведу те которые, на мой взгляд, наиболее любопытны.

В правительстве Нового южного Уэльса в Австралии используют систему машинного обучения CAITY (Categorisation Artificial Intelligence Technology) [3] для автоматической классификации транзакций по госрасходам. Система обучалась на 45 миллионах записей размеченных вручную и была разработана за 8 месяцев всего 1 нанятым сотрудником после чего обеспечила экономию до 160 человеко/дней в год.

В Филлипинах используют дронов, спутники, лидары и гео-тэггинг для отслеживания развитие проектов по строительству и зависимость от затраченных средств [4]

В Финляндии с 2015 по 2020 была внедрена система Palkeet Intelligent Automation обеспечивающая автоматизацию рутинных процессов в госзакупках [5] с помощью 26 ботов и автоматизации подверглись 70 процессов. В основе лежит программное решение на базе продукта uiPath. Стоимость решения 1 миллион евро (за 2015-2020 годы, всего). Экономия в оценке в человеко-часах достигла около 2,6 миллионов евро

В США, Нью Йорк, собирают данные о всех закупках из внутренних и внешних источников и вылавливают ситуации когда власти города могут запросить скидку у поставщиков [6]. Уже сэкономили 780 миллионов долларов за 5 лет.

А также множество примеров о каждом из которых можно написать много. Каждый может найти там что-то интересное для себя

Ссылки:
[1] https://ec.europa.eu/growth/single-market/public-procurement/digital/emerging-technologies_en
[2] https://ec.europa.eu/docsroom/documents/40102/attachments/1/translations/en/renditions/native
[3] https://ec.europa.eu/docsroom/documents/39905
[4] https://govinsider.asia/innovation/women-in-govtech-2018-lilia-guillermo-the-chief-information-officer-of-the-department-of-budget-and-management/
[5] https://ec.europa.eu/docsroom/documents/39919
[6] https://datasmart.ash.harvard.edu/news/article/ten-great-ways-data-can-make-government-better-1041

#tech #procurement #goszakaz #government
РБК пишут [1] о готовящихся требованиях к сайтам доступ к которым должен быть предоставлен операторами бесплатно.

Процитирую обязательные требования к таким сайтам:
- используют домен, относящийся к группе составляющих национальную доменную зону;
- функционируют с использованием компьютерных программ и баз данных, включенных в реестр российского программного обеспечения;
- предоставляют возможность доступа исключительно к отечественным социально значимым информационным ресурсам и российскому контенту;
- провайдер хостинга сайта является российским юрлицом, использует серверы, которые имеют заключение о подтверждении промышленной продукции на территории России, а также софт, включенный в реестр отечественного ПО;
- владельцем сайта выступает российское юрлицо или гражданин России.

А теперь по списку:
1. Мониторинг использования кириллических имён доменов органами власти не велся Минкомсвязи и не ведётся сейчас. По моим оценкам, скорее всего завышенным, не более 10% органов власти имеют доменные имена сайтов на в национальной доменной зоне. Более того, не все сайты правительства и Президента РФ находятся в этой зоне.
2. Подавляющее число российских сайтов создано на ПО которое не входит в этот реестр. Это ПО с открытым кодом, например, веб-сервер nginx, такие системы CMS как Wordpress, Drupal, Joomla и какое-то число продуктов на проприетарном ПО. Разумеется всего этого нет в реестре российского ПО (и быть не может!).
3. Без специальной комиссии не представляю себе как определять эту социальную значимость.
4. Хотелось бы комментариев провайдеров, но не могу не отметить что ПО используемое провайдерами крайне разносторонне. И даже "национальные телеком чемпионы" используют множество зарубежного ПО которому нет альтернатив. Кроме того "российское юр. лицо" вполне может принадлежать гражданам других стран или международным холдингам. Так что странный критерий.
5. Аналогично пункту 4, про российское юр лицо понятно, однако принадлежать оно может зарубежному юр лицу.

Вообще попытки Минкомсвязи навести порядок в "социально значимых ресурсах" вырождается в попытки систематизировать требования к госсайтам, полноценного анализа которых они не проводили.

Казалось бы, столько неглупых людей там было и туда пришло, а тут такая неприятная профанация.

Ссылки:
[1] https://www.rbc.ru/technology_and_media/24/03/2020/5e74ace59a79475a1ef2b709

#sites #government #regulation
О необходимости непрерывной архивации документов не только на сайтах госорганов, но и госпрограмм, нац проектов, подчинённых им учреждений и разного рода госАНО.

С сайта нацпроекта "Цифровая экономика" исчезли все документы по направлениям всем направлениям, например [1] [2]

Хочется надеяться что это "ошибка" тех кто ведёт сайт, а сознательное "заметание следов". Если документы неактуальны, то создаётся раздел архива на дату, а тут просто доки исчезают с сайта.

Ссылки:
[1] https://digital.ac.gov.ru/about/27/#docs
[2] https://digital.ac.gov.ru/about/7/#docs

#opendata #opengov
Официальные государственные сайты (органы власти, учреждения, госпроекты) вне зоны .ru, .рф:
- http://ombudsmanrf.org/ - уполномоченная по правам человека
- http://esimo.net/ - Единая государственная система информации об обстановке в Мировом океане (ЕСИМО)
- https://www.tarifkchr.net/ - главное управление по тарифам Карачаево-Черкесской республики
- http://uzags.com/ - Управление по архивам и ЗАГС Ульяновской области
- http://edu22.info - сайты образовательных организаций Алтайского края

и так ещё много.

Как Вы думаете у кого есть полный реестр госсайтов ? Правильно, у меня есть.

Как думаете кто никогда не проделывал исследований о структуре и состояния госвеба? Правильно, Минкомсвязи
В проекте международного интернет-архива Archive.org только что открыли National Emergency Library [1] с более чем 1,4 миллионом книг. Из них на английском около 1,3 миллиона книг, а также есть книги на китайском, французском, испанском и на русском языке. На русском языке около 3 тысяч книг, в основном из оцифрованных библиотек университетов в США.
Подробнее в их анонсе на сайте [2].

Напомню также что в России есть Российская электронная библиотека [3] где доступны более 1500 книг в онлайн доступе, а также библиотека Максима Мошкова [4] и множество других менее официальных и специализированных онлайн библиотек.

Ссылки:
[1] https://archive.org/details/nationalemergencylibrary
[2] https://blog.archive.org/2020/03/24/announcing-a-national-emergency-library-to-provide-digitized-books-to-students-and-the-public/
[3] https://rusneb.ru/
[4] http://lib.ru/

#openculture
Среди всякого странного не могу не отметить обилие бардака и дезорганизованности на сайте Правительства. Помимо того о чём я писал в колонке [1] в РБК что на сайте Правительства не указаны десятки учреждённых им НКО, так там ещё и документы публикуются с большими задержками, впрочем этому есть формальное объяснение в виде того как официальным сайтом публикации является pravo.gov.ru, но кроме того даже в таком раскладе документы публикуются с очень большой задержкой.

А вот ещё странность. В перечне документов на сайте есть только:
- Постановление Правительства Российской Федерации
- Распоряжение Правительства Российской Федерации
- Распоряжение Президента Российской Федерации
- Указ Президента Российской Федерации
- Федеральный закон
- Федеральный конституционный закон
- Кодекс

А в самих документах есть такие как: Распоряжение Министерства природных ресурсов и экологии Российской Федерации от 10.06.2010 г. № 21-р/68-рп, Правительства Санкт-Петербурга от 10.06.2010 г. № 21-р/68-рп [3]

Ни в одну из категорий документов выше не попадающие, не говоря уже о таких типах документов как:
- Распоряжение Правительства РСФСР
- Указ Президента РСФСР
- Распоряжение Президента РСФСР
- Постановление Правительства РСФСР
И это ещё не полный список.

И я ещё ничего не говорю про полноту базы опубликованных там НПА, она, скажем так, не подтверждена ничем.

Вопрос - зачем до сих пор Правительство держит у себя раздел "Документы" на сайте. Могли бы сразу заменить эту часть официального сайта на систему Минюста или ФСО.

В принципе, законы и другие нормативные документы - это главный продукт государства. Они должны быть открыты как открытые данные, они, в первую очередь, должны быть полны, достоверны и исчерпывающе опрозрачены.

P.S. Да, как вы наверняка догадались, я занимаюсь в том числе и тем что создаю набор данных нормативных документов для последующего исследования и сопоставления.

Ссылки:
[1] https://www.rbc.ru/opinions/politics/13/03/2020/5e69e70a9a7947737fc79cf3
[2] http://government.ru/docs/all/73495/
[3] http://government.ru/docs/all/73495/

#laws #npa #opengov