Ivan Begtin
8.09K subscribers
1.45K photos
3 videos
98 files
4.18K links
I write about Open Data, Data Engineering, Government, Privacy and Data Preservation and other gov and tech stuff
Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech

Contact @NMBabina for ads proposals
Download Telegram
Росреестр не уложился в сроки при внедрении информационной системы ЕГРН
http://audit.gov.ru/press_center/news/35987

Росреестр не уложился в сроки при внедрении информационной системы ЕГРН
Британский парламент назвал Facebook "цифровыми гангстерами" , о чём пишет Engadget[1]. Причем это именно что позиция парламента потому что формулировка содержится в официальном отчете парламента по итогам 18-ти месячного расследования.

Ждем очередных штрафов Facebook'а в UK и обещанного создания специальной службы надзора за социальными сетями.

Ссылки:
[1] https://www.engadget.com/2019/02/18/uk-facebook-digital-gangsters/

#facebook #investigation
Вместо департамента открытого правительства пришел на смену Департамент регуляторной политики.
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Как публикуется реестр субсидий из федерального бюджета?

Пожалуй, выхода этой публикации про разработку раздела «Субсидии» на Госзатратах я ждала больше всего. Для статьи в журнале «Бюджет» мы систематизировали найденные «особенности» структуры и качества данных, составили ТОП распределителей субсидий и сформулировали несколько рекомендаций по публикации данных.


Распределение субсидий происходит без объявления аукциона или тендера - госорганы решением Правительства или самостоятельно определяют, кто сколько средств получит и на что их сможет потратить. На федеральном уровне “Реестр соглашений о предоставлении субсидий федерального бюджета” (реестр субсидий) публикуется на Едином портале бюджетной системы (ЕПБС). Он содержит сведения о субсидиях, субвенциях и иных межбюджетных трансфертах бюджетам субъектов РФ, юрлицам и ИП.

Мы изучили структуру реестра и представленные данные и выявили ряд особенностей, которые нужно учитывать при подготовке аналитики. Впрочем, сразу нужно отметить, что благодаря Федеральному Казначейству и Минфину России на федеральном уровне данные о субсидиях машиночитаемые и регулярно обновляются, в то время как на региональном уровне они публикуются не в полном объеме и фрагментарно.

Как публикуется реестр на портале ЕПБС?

Реестр федеральных субсидий публикуется на портале ЕПБС (budget.gov.ru/rs) в виде веб-интерфейса, предоставляющего возможность просматривать карточки субсидий, осуществлять поиск по ним и скачивать файлы по сформированным выборкам. Помимо этого для разработчиков доступен API и подробная документация о структуре данных (которая была актуализирована менее чем за 10 дней после запроса в Казначейство России).

Данные о субсидиях обновляются ежедневно и дополняются прикрепленными файлами с сканами или текстами договоров или соглашений о предоставлении субсидий, дополнительных соглашений и платежных поручений. В некоторых субсидиях файлы с текстами соглашений отсутствуют или могут быть пустыми.

Всего на момент подготовки статьи были доступны данные о 94 125 субсидиях, выданных 189 «распределителями». В них входят ГРБС, главные управления МЧС, суды, относящиеся к Судебному департаменту при Верховном Суде РФ, аппараты Государственной Думы и Совета Федерации Федерального собрания. Сумма всех субсидий, доступных в реестре, - 15,89 трлн руб. Период, за который доступны данные, не очевиден – реестр субсидий публикуется с 2015 года, но некоторые опубликованные субсидии были заключены раньше, например в 1995 году, и по ним до сих пор могут выделяться средства регионам.

Мы агрегировали данные до ГРБС и собрали статистику о сумме и количестве распределенных субсидий. Выяснилось, например, что 6 ГРБС распределили 41% от суммы всех субсидий, а количество субсидий, распределенных Минобрнауки России (включая Министерство науки и высшего образования РФ) и Минпросвещения России составляет 21%. Подробные данные доступны в таблице. При их анализе нужно учитывать, что субсидии могут быть многолетними, то есть если в соглашении о субсидии указана определенная сумма, нельзя автоматически считать, что она вся уже поступила к получателю, например, сумма субсидии с реестровым номером 32118P01000005 составляет 25 млрд руб., но только 8,9 млрд руб. должны быть перечислены в 2018 году (из них 7 млрд руб. перечислены на момент подготовки статьи).

Текст статьи и ТОП распределителей доступны по ссылке: https://clearspending.ru/news/reestr-subsidij-kachestvo-dannyh-o-raspredelenii-16-trln-rub/
По поводу "жёсткого поручения" Дмитрия Медведева Силуанову по госзакупкам [1] я многое могу написать, начинаться всё будет со слов "не верю!".
Я регулярно пишу и тут и на других площадках о том как устроен госзаказ в России и мимо этой новости пройти никак не смогу.
1. Доля единственных поставщиков растет по той же причине почему ряду крупных государственных компаний отдаются крупнейшие контракты - это огусодарствление экономики.
2. Надо понимать что единственные поставщики возникают не из воздуха и назначаются, в том числе, постановлениями Правительства. Медведевым то есть.
3. Кроме единственных поставщиков ещё есть практика перевода госконтрактов в госзадания, а вместо договоров с внешними поставщиками - оформление по ГПХ или в штат физическиз лиц.
4. А если получателя госзадания и субсидии под него перевести в некоммерческий статус или изначально создавать в некоммерческом статусе с господчинением - то полный вывод из под 44-ФЗ и полная свобода. Пример: Аналитический центр при Правительстве с момента оформления его как АНО перестал действовать по 44-ФЗ.
5. Кроме единственных поставщиков есть ещё и вполне коммерческие процедуры в которых выигрывают подчиненные самому же ведомству бюджетные организации.

Итого
Проблема не столько в самой контрактной системе, а в де-факто не рыночной ориентацией Правительства следствием чего и является текущее состояние закупок у ед источника.

Ссылки:
[1] https://www.rbc.ru/economics/25/02/2019/5c7446069a794726504083ad

#procurement
2-3 марта состоится День открытых данных 2019, в котором Ассоциация принимает участие как соорганизатор.

Программа направления "Государство и бизнес: участники рынка данных".

📅 2 марта, Большой конференц-зал

🕰 13:00-14:30 — Дискуссия о Национальной системе управления данными. Участники:

Иван Бегтин, директор Ассоциации участников рынка данных.
Сергей Алимбеков, зам.директора по технологическому развитию ФРИИ.
Михаил Петров, директор Департамента цифровой трансформации Счетная палата Российской Федерации.
Иван Фост, руководитель направления в Аналитическом центре при Правительстве РФ.

Модератор — Василий Буров, член экспертного совета при Правительстве РФ.

🕰 15:00-16:30 — Дискуссия «Персональные данные: можно ли найти компромисс между интересами личности, государства и бизнеса?». Участники:

Александра Орехович, директор по правовым инициативам ФРИИ.
Дмитрий Волвач, начальник отдела технологического взаимодействия с иностранными государствами, ФНС России.
Зингерман Борис Валентинович, руководитель Ассоциации разработчиков и пользователей искусственного интеллекта в медицине.
Сергей Муслаев, руководитель отдела консалтинга компании Б-152.

Модератор — Светлана Белова, руководитель IDX.

🕰 16:45-18:00 — Public talk: Как не потеряться в цифровом мире. Образование и необходимые компетенции. Участники:

Инна Скрытникова, руководитель курса "Лидеры цифровой трансформации" Ассоциации участников рынка интернет-вещей.
Вера Адаева, руководитель проектного центра по интеграции Национальной технологической инициативы с программой "Цифровая экономика" Агентства стратегических инициатив (АСИ), о программе Chief Data Officer (CDO).
Ксения Ткачева, директор Центра подготовки руководителей цифровой трансформации ВШГУ РАНХиГС, о программе Chief Digital Transformation Officer (CDTO).

📅 3 марта, Большой конференц-зал

10:00-12:15 — Кейсы:

"Privacy preserving data mining: как найти инсайты в данных не нарушив приватность и зачем это нужно", Дмитрий Бугайченко, инженер-аналитик Mail.ru, к.ф.-м.н.
"Вопросы легальной обработки персональных данных из открытых данных", Денис Лукаш, исполнительный директор Центра цифровых прав, консультант Роскомсвободы.
"Orange: интерактивный анализ данных", Дмитрий Стефановский, РАНХиГС, зав. лабораторией цифрового консалтинга и информационных технологий.
"Влияние отключения интернета на экономику регионов: исследование по открытым источникам", Михаил Климарев, исполнительный директор "Общества Защиты Интернета".

📌 Подробная программа и регистрация: http://msk.opendataday.ru.
Из всех докладов и инициатив в рамках цифровой экономики публикации Росатома [1] в виде:
- Атласа сквозных технологий цифровой экономики России [2]
- и Национального индекса развития цифровой экономики [3]
выглядят самыми проработанными.

Их, скажем так, уже можно сравнивать с аналогичными докладами и визуализациями зарубежных исследовательских центров.

Ссылки:
[1] http://digitalrosatom.ru/centr-kompetencij-gk-rosatom-predstavil-dva-opublikovannyx-ekspertnyx-doklada-na-zasedanii-nablyudatelnogo-soveta-ano-cifrovaya-ekonomika/
[2] http://digitalrosatom.ru/wp-content/uploads/2019/01/%D0%90%D1%82%D0%BB%D0%B0%D1%81-%D1%81%D0%BA%D0%B2%D0%BE%D0%B7%D0%BD%D1%8B%D0%B5-%D1%82%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D0%B8-%D1%86%D0%B8%D1%84%D1%80%D0%BE%D0%B2%D0%BE%D0%B9-%D1%8D%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B8-%D0%A0%D0%BE%D1%81%D1%81%D0%B8%D0%B8.pdf
[3] http://digitalrosatom.ru/wp-content/uploads/2019/01/%D0%98%D0%BD%D0%B4%D0%B5%D0%BA%D1%81_%D1%80%D0%B0%D0%B7%D0%B2%D0%B8%D1%82%D0%B8%D1%8F_%D0%A6%D0%AD.pdf

#data #tech
Свежий законопроект № 654418-7 от сенатора Боковой. Правильно ли я понимаю что в первую очередь он затронет сайты использующие рекламные объявления на сайтах с контентом для детей?
Свежий законопроект от сенатора Боковой [1] О внесении изменений в Федеральный закон "О защите детей от информации, причиняющей вред их здоровью и развитию" и отдельные законодательные акты Российской Федерации по вопросу обеспечения безопасности и развития детей в информационном пространстве"

Внесен 26 февраля вечером и содержит положение о недопущении размещения информации о привлечении детей к участию в создании информационной продукции, причиняющей вред их здоровью и (или) развитию

и ещё ряд положений.

Формулировки размытые, в ФЭО как всегда "расходов федерального бюджета не потребуется" несмотря на то что есть раздел:
——
3) статью 16 дополнить частью 4 следующего содержания:
«Организации, осуществляющие образовательную деятельность,
обязаны применять меры для защиты несовершеннолетних обучающихся
от информации, причиняющей вред их здоровью и (или) развитию, путем
разработки и реализации программ обеспечения информационной
безопасности обучающихся.
Программы обеспечения информационной безопасности
обучающихся данных организаций должна учитывать требования к
административным и организационным мерам, техническим и
программно-аппаратным средствам защиты детей от информации,
причиняющей вред их здоровью и (или) развитию.».
——

а слова "обязаны" как-то трудно трактовать без увеличения расходов.

Ссылки:
[1] http://sozd.duma.gov.ru/bill/654418-7

#internet #runet #kids #watchdog
Появился итоговый перечень поручений Президента по итогам послания федеральному собранию [1]

О каких из них важно помнить в контексте цифровой экономике и гос ИТ:
—-
3. Правительству Российской Федерации:
а) совместно с Государственной Думой Федерального Собрания Российской Федерации обеспечить принятие в весеннюю сессию 2019 года:
...
федеральных законов, направленных на развитие цифровой экономики, в том числе определяющих порядок совершения гражданско-правовых сделок в электронной форме, а также предусматривающих регулирование цифровых финансовых активов и привлечение финансовых ресурсов с использованием цифровых технологий.

Срок – 1 июля 2019 г.

8. Правительству Российской Федерации при участии автономной некоммерческой организации «Агентство стратегических инициатив» и ведущих общественных объединений предпринимателей обеспечить создание и внедрение в пилотном режиме цифровой платформы для приема обращений субъектов предпринимательской деятельности в связи с оказанием на них давления со стороны правоохранительных органов.

Срок – 15 декабря 2019 г.

Ответственный: Медведев Д.А.

9. МВД России, ФСБ России, Генеральной прокуратуре Российской Федерации и Следственному комитету Российской Федерации в соответствии со своей компетенцией издать акты, предусматривающие утверждение порядка рассмотрения указанных в пункте 8 настоящего перечня поручений обращений субъектов предпринимательской деятельности.

Срок – 1 октября 2019 г.

Ответственные: Колокольцев В.А., Бортников А.В., Чайка Ю.Я., Бастрыкин А.И.

11. Минприроды России совместно с Росреестром до 1 января 2022 г. завершить внесение сведений о местоположении границ особо охраняемых природных территорий федерального значения в Единый государственный реестр недвижимости.

Доклад – до 1 июля 2019 г., далее – один раз в полгода.

Ответственные: Кобылкин Д.Н., Абрамченко В.В.
—-


Ссылки:
[1] http://kremlin.ru/acts/assignments/orders/59898
Одна из наиболее сложных задач в понимании "кому-что-и-как положено" в доступе к данным - это декомпозиция прав доступа из федерального законодательства. Например, сегодня в 22:05 внесён законопроект № 655193-7 "О внесении изменений в отдельные законодательные акты Российской Федерации " [1] с изменениями в несколько законов, в том числе в Федеральный закон "Об актах гражданского состояния" N143-ФЗ [2] где прописаны условия доступа органов власти к Единому государственному реестру записей актов гражданского состояния (ЕГРЗ).

Законопроект расширяет перечень органов власти имеющих доступ к этим сведениям на избирательные комиссии, и комиссии референдумов. В перечень который и без того уже весьма немал. Я бы даже сказал что список имеющих доступ уже столь велик что скоро можно будет всерьёз задумываться не будет ли утечек из ЕГРЗ, не продаются ли уже эти сведения на чёрном рынке.

Напомню что сейчас статья 13.2 в 143-ФЗ выглядит следующим образом (форматирование моё)
--
Сведения о государственной регистрации смерти, содержащиеся в Едином государственном реестре записей актов гражданского состояния, и сведения о внесении исправлений или изменений в записи актов о смерти, содержащиеся в Едином государственном реестре записей актов гражданского состояния, предоставляются:
- федеральному органу исполнительной власти в сфере внутренних дел (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по контролю и надзору за соблюдением законодательства о налогах и сборах (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по формированию официальной статистической информации о социальных, экономических, демографических, экологических и других общественных процессах в Российской Федерации (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по выработке и реализации государственной политики и нормативно-правовому регулированию в области обороны (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по выработке и реализации государственной политики и нормативно-правовому регулированию в сфере деятельности войск национальной гвардии Российской Федерации, в сфере оборота оружия, в сфере частной охранной деятельности и в сфере вневедомственной охраны
- федеральному органу исполнительной власти, уполномоченному Правительством Российской Федерации на осуществление государственного кадастрового учета, государственной регистрации прав, ведение Единого государственного реестра недвижимости и предоставление сведений, содержащихся в Едином государственном реестре недвижимости (его территориальным органам)
- Пенсионному фонду Российской Федерации
- Фонду социального страхования Российской Федерации
- территориальным фондам обязательного медицинского страхования
- органам исполнительной власти субъектов Российской Федерации, осуществляющим полномочия в сфере информационно-коммуникационных технологий и организации информационного взаимодействия с федеральными органами исполнительной власти и (или) автоматизированными системами федеральных органов исполнительной власти
- главам местных администраций муниципальных районов, городских округов, внутригородских территорий городов федерального значения, а в случаях, предусмотренных законами субъектов Российской Федерации - городов федерального значения,
- территориальным органам исполнительной власти городов федерального значения.
--


Ссылки:
[1] http://sozd.duma.gov.ru/bill/655193-7
[2] http://www.consultant.ru/document/cons_doc_LAW_16758/

#data #duma #law
Поскольку в последнее время всё больше влияния государства на рынок данных через госинформсистемы я буду чаще в рубрике #law писать о законопроектах и других НПА связанных с госрегулированием ИТ, данных, связи и всего что рядом с этим. Могу сказать пока по личным наблюдениям что тренд на то что "всё-ИТ" усиливается.

Этот тренд в том что какую тему не тронь, всё более она либо завязаны на информационные системы, либо на интернет-вещей, либо на другие аспекты технологической политики. Это касается и законопроектов, редкий отраслевой законопроект в ближайшие годы не будет указывать на госинформсистему. Может быть это и ественное развитие вещей, может быть.
Сегодня на Дне открытых данных (msk.opendataday.ru) организованным Инфокультурой, Ассоциациацией участников рынка данных и ФРИИ выступал Алексей Кудрин и за примерно час рассказал о приоритетах работы Счетной палаты.

Что было самого важного в его выступлении:
- открытость государства и открытые данные - это приоритет в работе Счетной палаты
- все сведения о проверках Счетной палаты кроме секретных будут публиковаться в открытом доступе
- Счетная палата будет работать с экспертным сообществом и общественными организациями по организации общственного контроля

О выступлении написали многие журналисты, собственно весь медиаэфир завален упоминанием его выступления. Правда журналисты из всего что говорилось выцепили только самое "жареное", его фразу про граждан у которых нет чувства налгоплательщиков, кстати, весьма справедливая фраза.

1-й день открытых данных был очень насыщенным. Будучи организатором и модератором секций, мне удалось не всё застать лично, но обо всём что удалось я ещё расскажу подробнее и детальнее.

Завтра, 3-го марта, второй день с семинарами и мастер-классами. Будет не менее интересно и гораздо больше к практике.

#opengov #opendata
Хорошая новость ко дню открытых данных, группа Open Data Institute в Австралии выпустили версию 1.0 продукта Data Curator [1], это инструмент с открытым кодом для контроля качества данных. Создавался он с оглядкой на другой инструмент с открытым кодом Comma Chameleon [2] помогающий работать с csv файлами.

У Data Curator есть важная особенность - это поддержка стандарта Data Packages [3] из проекта Frictionless Data.
Data Packages - это способ описания данных в виде плоских таблиц в CSV с качественным описанием метаданных.

Data Curator не единственный продукт позволяющий работать над качеством данных. Я напомню про Open Refine о котором даже есть статья в Википедии [4] и созданный на базе проекта Google Refine. Этот продукт довольно активно используется всеми командами работающими с открытыми данными и в России тоже

Есть немало коммерческих продуктов по очистке данных используемые в России сильно реже.
Например:
- Trifacta https://www.trifacta.com/
- ClearStory https://www.clearstorydata.com/product/data-prep/
- DataIku https://www.dataiku.com/

Среди них самый интересный по заходу - DataIku. Они продают себя как инструмент для корпоративного искусственного интеллекта (enterprise AI), а платформа изначально заточена по machine learning.

Все эти инструменты очень полезны, но нет ни одного совсем универсального. Дело в том что инструменты умеющие делать базовую проверку качества - например структуру полей описания набора данных, идентификацию типов и так далее, обычно не умеют делают валидацию справочников с отраслевой спецификой. Например, валидация кодов ИНН или ОКАТО организаций, декомпозиции и валидации адреса, геокоординат и так далее. Всё это требует специализированных инструментов или же целевого программирования под эти задачи.

Вчера на дне открытых данных была секция о качестве данных где много говорили про разные, но в основном, не инструментальные, аспекты качества.

Ссылки:
[1] https://github.com/ODIQueensland/data-curator
[2] https://comma-chameleon.io/
[3] http://frictionlessdata.io/data-packages/
[4] https://en.wikipedia.org/wiki/OpenRefine

#opendata #dataclean #dataquality
CivicTech.guide [1] онлайн навигатор по технологическим гражданским проектам в обновлённом формате как раз сегодня представляется на дне открытых данных в Нью Йорке. Проект является каталогом технологических инструментов, конференций, митапов и людей вовлеченных в технологии и действующие на общественное благо.

Каталог там велик и позволяет найти очень для тех кто хочет начинать свой проект не с нуля, а воспользоваться опытом тех кто уже работает с данными или с краудсорсингом или с технологическими медиа.

Ссылки:
[1] https://civictech.guide
В последнее время я много рассказываю про качество данных и мои коллеги выступают с этой же темой. На дне открытых данных я модерировал секцию посвященную качеству данных, но там всё было больше от кейсов.

С чего начинать погружение в контроль качества данных и какие материалы полезны?
Вот подборка ссылок которые помогут быть в курсе этой темы:
1. С DAMA-DNBOK второй редакции [1] - Data Management Body of Knowledge (DAMA-DMBOK2) представлят собой аналог PMBOK для данных и уже скоро по нему будут учить, сдавать экзамены и не только.
2. ГОСТ Р 57773-2017 (ИСО 19157:2013) Пространственные данные. Качество данных [2]
3. ISO 8000-8:2015 Data quality -- Part 8: Information and data quality: Concepts and measuring [3]
4. Стандарт для data.gov.sg , портала данных Сингапура [4]
5. Bad data guide [5] кропотливая подборка практических примеров случаев плохих данных

Качество государственных данных, в принципе, в России очень низкое. За редким исключением, данные неактуальны, плохо обновляются, без метаданных, с пропусками в ключевой информации и не только.

Ссылки:
[1] https://www.oreilly.com/library/view/dama-dmbok-data-management/9781634622479/
[2] http://docs.cntd.ru/document/1200157078
[3] https://www.iso.org/standard/60805.html
[4] https://github.com/datagovsg/data-quality
[5] https://github.com/Quartz/bad-data-guide

#opendata #baddata #dataquality
США опубликовали 4-й национальный план действий в рамках партнерства Открытых правительств [1]. Несмотря на то что многие в OGP ожидали что США выйдет из этого партнерства. Сам план довольно краток, немногообещающ и подвергся уже публичной критике [2].

Впрочем в США открытость зависит не только от Белого Дома и открытость данных обеспечивается даже без того чтобы об этом говорил действующий президент.

Ссылки:
[1] https://open.usa.gov/assets/files/NAP4-fourth-open-government-national-action-plan.pdf
[2] https://e-pluribusunum.org/2019/02/22/after-years-of-delays-and-democratic-regression-usa-releases-weak-open-government-plan/

#opengov #usa