Ivan Begtin
7.98K subscribers
1.83K photos
3 videos
101 files
4.53K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Я на днях ругался в адрес Минфина России который опубликовал план законопроектной деятельности в виде скана. Но, всё, как говорится, познаётся в сравнении.

Например, Минтруд не публиковал план законопроектной деятельности на 2020 год и не публикует на 2021 [2].

Минэнерго публикует только приказ об утверждении плана законопроектной деятельности и не публикует сам план [3]

Другие примеры:
- Минпромторг - публикует в PDF, не сканом [4]
- Минтранс - распоряжение сканом PDF и сам план файлом MS Word пригодном для работы [5]
- Минкультуры [6] - невозможно найти планы на 2019-2021 годы
- Минстрой РФ [7] - не публикуют план с 2019 года
- Минприроды [8] - до сих пор не опубликовали план на 2021 год, все предыдущие публиковали в виде сканов
- Минюст [9] - последний раз публиковали в 2019 году на 2019 год (1 марта вышло распоряжение) с той поры более нет
- Минцифра [10] - почему-то называют это планом законопроектных работ, последний раз был такой на 2018 год.

Такого ещё много, и здесь несколько вопросов. Вопрос прозрачности работы исполнительных органов власти, вопрос организации работ над нормативными документами и вопрос публикации открытых данных, потому что эти планы существуют все в табличной форме. И, конечно, отдельный вопрос к том что публикуется далеко не всё. Ежеквартально ФОИВы отчитываются перед Минюстом о исполнении плана и эти отчёты не публикуются [11] и отдельный вопрос - почему так происходит.

А я напомню что НПА - это, вообще-то, изначально основной продукт деятельности органов власти. Прозрачность нормотворчества - это прозрачность государства.

Ссылки:
[1] https://t.me/begtin/2590
[2] https://mintrud.gov.ru/ministry/opengov/13
[3] https://minenergo.gov.ru/node/10760
[4] https://minpromtorg.gov.ru/activities/practice/plans/
[5] https://mintrans.gov.ru/documents/2/11113?type=2
[6] https://culture.gov.ru/documents/?DOCS%5BKEYWORDS%5D=%D0%9F%D0%BB%D0%B0%D0%BD+%D0%B7%D0%B0%D0%BA%D0%BE%D0%BD%D0%BE%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D0%BD%D0%BE%D0%B9+%D0%B4%D0%B5%D1%8F%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8+%D0%9C%D0%B8%D0%BD%D0%B8%D1%81%D1%82%D0%B5%D1%80%D1%81%D1%82%D0%B2%D0%B0+%D0%BA%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D1%8B+%D0%A0%D0%BE%D1%81%D1%81%D0%B8%D0%B9%D1%81%D0%BA%D0%BE%D0%B9+%D0%A4%D0%B5%D0%B4%D0%B5%D1%80%D0%B0%D1%86%D0%B8%D0%B8&DOCS%5BVIEW_DOCUMENTS%5D=&DOCS%5BAUTHORITY%5D=&DOCS%5BTYPE_DOCUMENTS%5D=&DOCS%5BDATE_1%5D=&DOCS%5BDATE_2%5D=&DOCS%5BNUMBER%5D=
[7] https://minstroyrf.gov.ru/trades/normativno-pravovaya-deyatelnost/normativnaya-baza/
[8] http://www.mnr.gov.ru/docs/open_ministry/plan_normotvorcheskoy_deyatelnosti_minprirody_rossii/plan_normotvorcheskoy_deyatelnosti_minprirody_rossii_na_2020_god/
[9] https://minjust.gov.ru/ru/documents/7595/
[10] https://digital.gov.ru/ru/documents/?words=%D0%9F%D0%BB%D0%B0%D0%BD+%D0%B7%D0%B0%D0%BA%D0%BE%D0%BD%D0%BE%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D0%BD%D0%BE%D0%B9+%D0%B4%D0%B5%D1%8F%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8&type=&directions=&department=&start_date=&end_date=
[11] https://www.consultant.ru/document/cons_doc_LAW_87670/0190686c0773ecbabbdea1599fa197cb301c0ae0/

#opengov #opendata #laws #legal
Не бывает нормальных госреестров, бывают недообследованные (с)

Чтобы для коллег из Минцифры которые читают мои публикации потом это не было неожиданностью, несколько фактов про реестр аккредитованных ИТ компаний [1]

1. Примерно у 1.5% записей недостоверные реквизиты, около 200 записей из 13543. Не точно потому что где-то записи дублируются, а где-то, например, перепутаны названия организаций и реквизиты ИНН/ОГРН соседних записей и требуется ручная проверка. Скорее всего реально записей с ошибками больше.
2. Многие ИТ компании одновременно являются образовательными учреждениями и я не понимаю как они заявляют (заявили) выручку от ИТ в 90%. Примеры: Университет Иннополис, Московский технологический университет, Прайм-Сервис и др.
3. В реестре ИТ компаний много госучреждений, ФГУПов и компаний учрежденных органами власти. Трудно отнести их к ИТ компаниям, хотя, формально под критерии они могут подпадать. Последний забавный пример, ФГУП «Главный научно-исследовательский вычислительный центр» Управления делами Президента Российской Федерации теперь также "ИТ компания" с пониженным налогообложением.
4. Это ещё не все вопросы. Самый главный вопрос всегда в достоверности того что основной выручкой компаний является ИТ деятельность.

И отдельная большая тема, интересная по другому, о том почему многие компании в ИТ рынке с большой выручкой не регистрируются в этом реестре.

Однажды у меня или коллег дойдут руки посмотреть на это всё более пристально. Пока же лишь обращаю на этот реестр внимание и на то что в других отраслях ситуация не сильно лучше и чаще сильно хуже и по достоверности данных и тому что в госреестры вносят. Достаточно вспомнить Минэкономразвития с реестром СО НКО который почистили от ошибок по формату и ничего не сделали со смысловыми ошибками.

Ссылки:
[1] https://digital.gov.ru/ru/activity/govservices/1/

#government #registries #it
Я здесь регулярно пишу о НКО и госНКО (учреждённых государством в разных формах) и не могу не напомнить про два некоммерческих проекта по НКО которые ведёт Инфокультура.

Открытые НКО [1] - база всех некоммерческих организаций, их контрактов, субсидий, грантов, бухбалансов и отчетов. С открытыми данными, API и тд. Это не только те НКО которые регистрируются в Минюсте, но и те которые имеют регистрацию только в ФНС России.

Данные НКО [2] - портал для публикации данных собираемых некоммерческими организациями. В том числе данные которые мы сами в Инфокультуре собираем.

О том как устроен некоммерческий сектор "на самом деле" я довольно много писал в блоге на Яндекс.Дзен и в колонках в РБК.

- Как устроен некоммерческий сектор в России. Часть 1 [3]
- Как устроен некоммерческий сектор в России. Часть 2 [4]
- Некоммерческий бюджет: как чиновники стали использовать стали использовать НКО в своих целях [5]
- Незачет по НКО: чем плох реестр социально ориентированных организаций [6]

При этом данных о НКО гораздо больше, не все получается быстро и просто интегрировать в централизованную базу Открытых НКО, поэтому они лежат наборами данных в Данных НКО.

Например:
- Архивные данные президентских грантов за 2013 год [7] (до появления Фонда президентских грантов)
- Данные грантовых конкурсов Ростуризма [8] включают данные по НКО тоже
- НКО зарегистрированные на портале Душевная Москва [9]
- Данные аналитического доклада "Некоммерческий сектор в России" [10]
- Некоммерческие организации в зарегистрированные органами власти [11]

И другие наборы данных в категории "Некоммерческие организации" [12].

Ссылки:
[1] https://openngo.ru
[2] http://ngodata.ru
[3] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/kak-ustroen-nekommercheskii-sektor-vrossii-chast-1-5a363ff08139ba06ba669bf7
[4] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/kak-ustroen-nekommercheskii-sektor-v-rossii-chast-2-5a3a1e898139ba9e538c916b
[5] https://www.rbc.ru/opinions/politics/13/03/2020/5e69e70a9a7947737fc79cf3
[6] https://www.rbc.ru/opinions/society/17/06/2020/5ee8ce139a79479edce77585
[7] http://ngodata.ru/dataset/prgrants2013
[8] http://ngodata.ru/dataset/grant-contests-rosturizm
[9] http://ngodata.ru/dataset/dushmosorgs
[10] http://ngodata.ru/dataset/nonprofit-sector-russia
[11] http://ngodata.ru/dataset/gov-ngo
[12] https://ngodata.ru/group/ngo

#ngo #data #opendata
Знаете ли Вы что... Государственная фельдъегерская служба (ГФС России) - это, возможно, единственный федеральный орган исполнительной власти одновременно являющийся поставщиком по 44-ФЗ и, возможно, по 223-ФЗ.

Более 1300 контрактов с другими органами власти, на сумму более чем 1.1 миллиарда рублей. Органы власти контрактуются с ГФС России через закупку у единственного поставщика и оплачивают работы переводами на лицевые счета ГФС России по кодам КБК.

Почему до сих пор фельдъегерская служба существует как ФОИВ для меня загадка, подозреваю что никаких причин кроме исторически сложившейся ситуации нет.

Вообще же, анализ, денежных потоков между органами власти и их подведами и подведами других органов власти и госкорпорациями и госкомпаниями - это увлекательнейшее занятие. Где-то есть сложившиеся отношения ещё с советского времени (ГФС России, архипелаг ФСИН), а где-то явный тренд на "чеболизацию" в виде госхолдингов и ряда крупнейших олигархов.

Причём тренд на государственые чеболи сильнее чем на частные. Когда нибудь руки дойдут и до анализа этого всего, но этого всего много, поэтому может и не скоро дойдут. А пока, для тех кто любит анализировать госзакупки и госрасходы напомню что эти и многие другие факты можно найти на порталах Госрасходы [1] и Госзатраты [2].

Ссылки:
[1] http://spending.gov.ru
[2] http://clearspending.ru

#government #it
Comparitech выпустили сравнение 96 стран по тому как те используют биометрические данные [1]. Согласно исследованию хуже всего ситуация в Китае и лучше всего в Эфиопии и Туркменистане (видимо из-за неразвитости технологий). В целом исследование не претендует на научность и практически полностью основано на публикациях в СМИ, которые и приведены в списке источников.

Уровень использования биометрических данных в России лучше чем в США или в Иране, но хуже чем в Польше, Германии или Казахстане.

Опять же, поскольку методология исследования вызывает очень много вопросов, интереснее приводимые там факты. Например, национальная биометрическая база в Китае включающая теперь ещё и данные ДНК [2] или разрешение компаниям собирать данных о мозговых волнах работниках [3].

И так далее, ещё много примеров по другим странам.

Что находится за пределами этого исследования так это то что биометрические данные концентрируются не только в государстве. Если говорить про Россию, то из актуального - это вхождение Яндекса в капитал Генотек'а [4], где хоть и сделано множество оговорок про не передачу Яндексу каких-либо данных, но не тревожить не может.

Впрочем, если говорить про Россию, то у нас наиболее вероятен китайский путь с построением одной или нескольких национальных баз данных с биометрическими данными и постепенное введение регуляторки по сдачи в государственную информационную систему(-ы) биометрических данных собираемых частными компаниями.

P.S. Не все знают и не все понимают природу биометрических данных. Приведу несколько примеров, без ссылок:
- кроме распознавания лиц есть немало других технологий бесконтактного снятия биометрических данных, например, распознавание радужной оболочки возможно на расстоянии до 10 метров, распознавание походки, распознавание по форме рук и кистей и др.
- расшифровка генома - это передача третьей стороне данных не только о себе, но и о своих ближайших родственниках;
- отпечатки пальцев родственников имеют много схожих признаков и, при наличии финансирования исследований в этом направлении, можно научиться выявлять взаимосвязи;

По биометрии не так много хорошей литературы, многие технологии в этой области очень наукоёмки и требуют длительных исследований, с другой стороны, если запреты на именно распознавание по лицам получит распространение, то пойдут инвестиции в исследования в других направлениях: распознавание одежды, формы горла и ушей и иных биометрических признаков.

Ссылки:
[1] https://www.comparitech.com/blog/vpn-privacy/biometric-data-study/
[2] https://www.rfa.org/english/news/china/collect-08232019115209.html
[3] https://www.businessinsider.com/china-emotional-surveillance-technology-2018-4?r=US&IR=T
[4] https://blog.genotek.ru/genotek-and-yandex

#privacy #biometrics #genetics
OpenNeuro - открытый каталог наборов данных в области исследования мозга [1], включает более 500 наборов данных, как правило, очень большого объёма. Проект чем-то похож на Galaxy, другой проект по работе учёных с данными, в области расшифровки генома. OpenNeuro также не просто каталог, а интегрированный инструмент, связанный с такими проектами как Brainlife [2] и имеющий встроенную проверку данных на предмет соответствия стандарту сообщества Brain Imaging Data Structure (BIDS) [3]

Внутри OpenNeuro используется сервис DataLad [4], все данные в OpenNeuro публикуются на Github [5] (вообще, в последнее время, Github всё чаще используют как бесплатное хранилище данных условно любого объёма.
А также сам исходный код платформы общедоступен [6]

Специализированных платформ для публикации открытых научных данных становится всё больше, многие из них - это реинкрнация систем обмена научными данными ещё из раннего периода систем обмена научной информации в Интернете. При этом в таких областях как биоинформатика, геномные исследования, компьютерная лингвистика и других такие платформы оказываются более востребованными чем более универсальные Dataverse или Mendeley и другие.

Ссылки:
[1] https://openneuro.org
[2] https://brainlife.io
[3] http://bids.neuroimaging.io/
[4] https://www.datalad.org
[5] https://github.com/OpenNeuroDatasets
[6] https://github.com/OpenNeuroOrg/openneuro

#opendata #openaccess #openscience
Отвлекаясь от основной темы моего канала хочу порекомендовать канал моей коллеги и соучредителя Инфокультуры Катерины Аксеновой - prometa.pro книжки Катерина читает книги и делает им ёмкие обзоры, в том числе это обзоры про такие книги как "Надзирающий капитализм" Шошанны Зубофф о которой я также писал.

У Катерины отличный канал, с редкими и продуманными текстами, и интересными книгами. Всячески рекомендую!

#recommendations #books #channels
Парламентская газета пишет что "Минцифры подготовило единый стандарт для государственных информсистем" [1].
Лично я пока ещё его не видел, правда не ожидаю увидеть в нем чего-то невероятного, скорее систематизацию практик, но могут быть нюансы.

Документ пока что не публичен и проходит стадию обсуждений, если у кого-либо из читателей есть его текст или замечания ФОИВов на него - поделитесь.

Ссылки:
[1] https://www.pnp.ru/politics/mincifry-podgotovilo-edinyy-standart-dlya-gosudarstvennykh-informsistem.html

#opengov #policy #it
А я не устаю повторять советскую поговорку: "Если в Вашей гостинице нет туалетной бумаги, пишите сразу в ЦК КПСС (с)". Оля Пархимович в @ahminfin собрала способы и адресатов обращений для граждан. Добавлю что при исчезновении данных важно писать во все госорганы которые за эти данные отвечают. Я вот жалею что когда Минобрнауки удалили данные по статистике ЕГЭ с ege.edu.ru (ныне переадресует на сайт Рособрнадзора), то мы не развернули большой общественной кампании.

А ведь если подумать, ещё несколько лет назад была доступна статистика ЕГЭ хотя бы на уровне субъектов федерации, а мы добивались открытия её хотя бы на муниципальном уровне, а лучше на уровне каждого образовательного учреждения (как это делается в других странах). А теперь нет многих, даже агргегированных данных о качестве жизни.

#opengov #opendata
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
Очень часто спрашивают, что делать с отсутствием реестра субсидий на портале «Электронного бюджета» и сокращением полей для публикации.

Вы всегда можете написать обращение в госорган и получить на него официальный ответ в течение 30 дней (чем больше обращений, тем лучше). На мой взгляд, написать можно в:

- Минфин России (https://minfin.gov.ru/ru/appeal/)
- Федеральное казначейство (https://roskazna.gov.ru/priem-obrashhenij/otpravit-obrashchenie/)
- Счетную палату РФ (https://ach.gov.ru/support/)
- Правительство РФ (http://services.government.ru/letters/)
- Генпрокуратуру РФ (https://epp.genproc.gov.ru/web/gprf/internet-reception)
- Президенту РФ (http://letters.kremlin.ru)
Парламент Австралии принял в окончательной редакции закон регулирующий ссылки на новостные сайты [1] в ответ на который Google (Alphabet) грозился отключить поиск, а Facebook превентивно заблокировали возможность публиковать новости на австралийские новостные сайты.

В итоге обе компании договорились с Правительством Австралии о "значительной финансовой поддержке" индустрии медиа в Австралии и том что обе компании пошли по пути заключения соглашений с австралийским медиа-бизнесом. Переговоры с Facebook'ом при этом шли около 11 часов, как пишет, Bloomberg.

Но, с принятием закона, компании, компании "остаются на крючке". Если Правительство Австралии в какой-то момент сочтет что Google и Facebook недостаточно поддерживают местную новостную индустрию, то оно может применить положения закона против компаний.

Теперь можно ожидать в самое ближайшее время аналогичного регулирования в других странах.

Ссылки:
[1] https://www.bloomberg.com/news/articles/2021-02-24/australia-passes-law-forcing-facebook-google-to-pay-for-news

#adtech #tech #regulation #australia
Фонд RAAIS (Великобритания) раздаёт гранты на неназванную сумму на 3-х месячные проекты по применению ИИ в целях общего блага (common good) [1]

В примерах поддержанных проектов:
- Open Climate Fix [2] - использование ИИ, открытости науки в целях уменьшения выброса парниковых газов
- OpenMined [3] - разработка этического ИИ и инструментов для разработчики этических алгоритмов

Нет требований по тому чтобы проект был от некоммерческой организации, но почти наверняка есть требования чтобы он был с открытым кодом и под свободной лицензией.

Тем кто работает с ИИ и ищет своему опыту благое применение может быть интересно.

Напомню что в мире довольно много грантов выдающихся на исследования и проекты в области ИИ. Например, гранты Microsoft [4] [5] [6], ранее существовавший проект AI Grant [7], гранты Salesforce [8] и другие.


Ссылки:
[1] https://www.raais.org/grants
[2] http://openclimatefix.org/
[3] http://www.openmined.org/
[4] https://www.microsoft.com/en-us/ai/ai-for-earth-grants
[5] https://www.microsoft.com/en-us/ai/ai-for-accessibility-grants
[6] https://venturebeat.com/2020/01/29/microsoft-launches-50-million-ai-for-health-grant-program/
[7] https://aigrant.org/
[8] https://einstein.ai/outreach/grants

#ai #research #grants
Новый жанр заметок в журналистике - это новые госприложения. РБК написали про TDM Messenger [1] выложенный и оперативно удалённый ГКУ Информационный город (юр. лицо от которого публикуются приложения Правительства Москвы, ДИТ Москвы и тд.).

Приложение оказалось разработанным ID Parterner Ltd. [2], ООО «Айди Партнер», московским крупным строительным подрядчиком, ранее не замеченном в наличии ИТ компетенций, зато с большим пакетом госконтрактов в разных регионах страны [3].

А вот контракт на разработку мессенжера найти не удалось и очень хочется понять основания на которых ГКУ Информационный город (ДИТ Москвы) его публиковало. Субконтрактом какого контракта является это приложение?

Хочется ещё провести анализ его приватности, но его слишком быстро удалили.

Ссылки:
[1] https://www.rbc.ru/technology_and_media/25/02/2021/6036607a9a7947295d9a9188
[2] https://www.id-partner.net/
[3] https://clearspending.ru/supplier/inn=7733668641&kpp=770301001

#it #government #moscow #privacy
Papers With Code [1] проект с базой из более чем 41 тысячи научных статей по машинному обучению, 3200+ наборов данных используемых в этих статьях, более чем 2000 задач по которым сгруппированы эти статьи и почти 4000 измерений эффективности решения этих задач. И все эти статьи с открытым кодом, а все эти наборы данных - открытые данные.

Проект создан сообществом в основе которого команда Facebook AI Research. Все материалы доступны под лицензией Creative Commons, данные всех разделов доступны как открытые данные [2].

Внутри проекта есть также подпроекты посвящённые астрономии, компьютерным наукам, физике, математике и статистике.

А также общедоступен исходный код с помощью которого авторы проекта извлекают результаты, ссылки на код и тд. из научных статей о машинном обучении и не только [3] и код для интеграции с этим порталом.

На проект можно посмотреть сразу с двух сторон.

С одной стороны - это развитие баз научных статей, с учётом предметной специфики и с хорошим потенциалом развития в сторону executive papers. Сейчас авторы извлекают дополнительные знания о статьях из их текста, а в перспективе статьи могут иметь ту структурированную форму когда необходимые связи с кодом и данными прописываются внутри.

С другой стороны - это похоже на проекты OpenNeuro и Galaxy, созданных как каталоги данных с расширенным набором инструментов в предметных областях (нейробилологии и генетики). А в случае Papers With Code - это алгоритмоёмкие области с интенсивным использованием данных.

Ссылки:
[1] https://paperswithcode.com
[2] https://paperswithcode.com/about
[3] https://github.com/paperswithcode

#opendata #data #ai
Open Data Charter начали работу над таксономией данных [1] которые государства должны раскрывать во время пандемий. Это документ для общественного обсуждения Data Taxonomyfor Pandemic Preparedness [2] и пример по странам южной америки и ряду других с анализом того что и как публикуется уже сейчас [3].

Это вопрос не только эпидемиологии, но и данных о закупках, госфинансировании, антипандемических мер и так далее. А дальше, вначале таксономия, потом стандарт открытости, а потом и сравнение стран по прозрачности антипандемической деятельности.

Думаю что до конца года будет новый рейтинг.

Ссылки:
[1] https://medium.com/opendatacharter/covid-19-data-cards-6b0297d9100c
[2] https://docs.google.com/document/d/1CgCSSy4m02R-4neYlKEJqADiiLuTtIDDABojvPHrbHU/edit#heading=h.bxijjukslpp1
[3] https://docs.google.com/spreadsheets/d/1NHCHy7skXnf3krs0ySrC01_DG3_lXejcCfCP0iIuTm0/edit#gid=1766531576

#opendata #opendatacharter #opengovernment
Forwarded from Инфокультура
2 марта в 18:00 приглашаем на онлайн мастер-класс «О чем говорят депутаты Госдумы? Анализ текстовых данных на Python», который состоится накануне Дня открытых данных.

Мастер-класс проведет Дмитрий Сергеев, Senior Data Scientist OURA, Руководитель курсов по машинному обучению в Otus.ru.

Вместе со спикером участники проанализируют, о чем за 20 лет говорили депутаты разных партий, как менялось содержание их выступлений по годам, что изменилось в гендерном балансе Думы последнего созыва и как это повлияло на риторику.

Данные: транскрипты всех выступлений депутатов Государственной Думы с 2000 года.

Технологии: Python, сбор данных через API, Natural Language Processing (NLP), тематическое моделирование, визуализация данных.

Требования к участникам: базового знания Python будет достаточно для понимания происходящего, но присоединяться можно и без навыков программирования.

Регистрация для участия в мастер-классе на сайте https://opendataday.ru/msk.
Тим О'Релли в колонке в The Information [1] даёт 3 новых определения данных.
Основное:
- данные это новый песок

и дополнительные:
- данные - это кремний
- данные - это оксиконтин (наркотическое средство)

Почему песок? Потому что ценность одной малой песчинки данных и ценность большого их количества различны. Ценность значительно вырастает когда они собраны вместе и перерабатываются в кремний.

Почему кремний? Потому что из кремния состоит 28% земной коры но его добыча требует огромных расходов и индустриальной инфраструктуры.

Почему оксиконтин? Потому что для тех кто эксплуатируют свой доступ к данным они подобны наркотическому привыканию.

Правда в статье есть акценты на том что несмотря на сверхдоходы основных пользователей данных нельзя жестко ограничивать это использование через требования приватности и что выгоды от обмена данными слишком велики. Тезис вполне подходит для хорошей дискуссии.

В целом это не первая попытка переосмыслить что такое данные. Слишком многим не нравится определение что данные это новая нефть или данные это новое электричество или данные это новое золото.

Возможно сравнение данных с кремнием имеет право на существование, но, я всё больше склоняюсь к тому что это та область где уже бессмысленны аналогии. Надо просто обучать природе явления - данных, а образы физического мира для них малопригодны.

Статья доступна за пэйволлом, если кто-то не сможет прочитать, напишите, выложу в её текст в чате

Ссылки:
[1] https://www.theinformation.com/articles/data-is-the-new-sand

#data
Замечательный свежий проект "Достоевский" [1] на открытых данных и с открытыми данными оформлен как удобный интерфейс над судебной статистикой [2] Судебного департамента РФ.

Данные, относительно, небольшого объёма, но собраны, обработаны, представлены в виде удобного набора данных и наглядной аналитики.

Авторы проекта ОВД Инфо [3] и Data for society [4] соблюли все все правила открытости для таких проектов: сделали аналитику (рассказали историю), опубликовали набор данных и всё под открытой лицензией Creative Commons.

Для полного счастья нехватает разьве что открытого кода, который, также опубликован [5]. Так что проект хороший со всех сторон. А для тех кто работает с правоохранительной системой постоянно это ещё и замечательный источник пищи для размышлений и продумывания действий.

Ссылки:
[1] https://beta.dostoevsky.io/ru/
[2] http://cdep.ru/index.php?id=79
[3] https://ovdinfo.org/
[4] https://d4s.io/
[5] https://github.com/goooseman/dostoevsky-website/

#opendata #projects #courts
Появилось свежее приложение ФГИС Аршин для андроид [1] от ФГУП ВНИИМС (Всероссийский научно-исследовательский институт метрологической службы — головной институт в системе Федерального агентства по техническому регулированию и метрологии) .

В приложении 9 трекеров [2] включая Amplitude и Segment по профилированию пользователей на рынке adtech, а также оно запрашивает 47 разрешений на телефоне включая работу с календарём, доступ к контактам, микрофону и камере и доступ к точному местонахождению.

Если судить по названию то теперь во ФГИС нормально включать код передачи третьим сторонам и собирать данные о контактах пользователей?

Вроде Росстандарт не правоохранители, не спецслужба, и с COVID-19 не борется. Радует только то что там число установок всего 50+ и в списке обязательных к предустановке приложений его нет.

Зато политика конфиденциальности (ссылка из профиля в Google Play) [3] "зачётная". Помимо прямого обмана "Not third-party analytics" и "The data is not shared with third parties", оно ещё и юридически ничтожно.

Это всё к вопросу о том как создаются ФГИС в России. Вот так и создаются, на коленке, с передачей данных о пользователях 3-м сторонам, запредельным доступом к устройствам пользователей и весьма невысокой культурой разработки.

Ссылки:
[1] https://play.google.com/store/apps/details?id=com.vniims.arshin
[2] https://reports.exodus-privacy.eu.org/en/reports/166597/
[3] https://drive.google.com/file/d/1DIhOvJhsBEfQzLPWDePwKcU1EbGLioII/view

#government #apps #android
Forwarded from Ksenija Orlova
Всем привет!

1-6 марта Инфокультура отметит Международный День открытых данных 2021.

Накануне Дня открытых данных, с 1 по 5 марта, проведем серию практических мастер-классов по работе с открытыми данными в онлайн. Приглашаем участвовать всех желающих 🙂

— 1 марта, 18:00, мастер-класс дата-журналиста Алекся Смагина «Вскрываем декларации. Как при помощи регулярных выражений привести Word’овскую табличку к пригодной для анализа форме».

— 2 марта, 18:00, мастер-класс дата-сайентиста Дмитрия Сергеева «О чем говорят депутаты Госдумы? Анализ текстовых данных на Python».

— 3 марта, 18:00, мастер-классы по работе с геопространственными данными и картами для новичков и профи: создание карты с помощью unfolded.ai и затем краткий обзор OS-фреймворков для сетевого анализа городской среды на примере задачи построения изохрон.

— 4 марта, 15:00, мастер-класс по поиску открытых данных от DataMasters.

— 5 марта, 16:00, мастер-класс «Российская официальная статистика: как сделать работу с данными удобнее, а данные — понятнее?».

— 5 марта, 18:00, мастер-класс «Визуализация данных в ObservableHQ». После мастер-класса состоится подведение итогов Moscow Dataviz Awards 2021 — ежегодной международной премии за достижения в области инфографики, визуализации данных и дата-арта (moscowdatavizawards.com).

Программа и регистрация: https://opendataday.ru/msk. Присоединяйтесь!
София Иванова зарегистрировавшая ИП через сервис Tinkoff получила несколько десятков, а то и сотню звонков за несколько дней [1]. Интересный вопрос "где протечка" - в сервисе банка или в ФНС ? Рассматривая Софию Иванову как собирательный образ микропредпринимателя, то почти каждый из них испытывает моменты "коммуникационной агрессии". Они возникают когда в их предприятии возникает значимое событие воспринимаемое продавцами услуг для бизнеса как триггер.

Сейчас это два таких события как:
- регистрация организации
- победа на тендере

Оба этих случая - это злоупотребление даже не открытыми, а доступными данными. Посредники получают их из ЕГРЮЛ, баз госконтрактов, сайтов торговых площадок и так далее. Они перепродают контакты тем кто использует их для холодных звонков.

Поэтому, когда Вы регистрируете ИП или ООО или иное юр. лицо, то это поток звонков от банков. Когда побеждаете на тендере то звонят бесконечное число банков и посредников выдающих банковские гарантии. И с каждым годом звонков всё больше, и с каждым годом ситуация всё хуже. Крупный и средний бизнес может указать входящий номер секретаря и ничего не делать, а ИП и микробизнес обычно не знают что такое произоёдет и указывают личные мобильные телефоны.

Но виновата в этом не открытость данных, потому что контакты берут далеко не только ЕГРЮЛ и реестра госконтрактов к примеру. Часто контакты компании выигрывающей тендер собраны заранее из десятков разных источников включая сайт и ещё десятки других источников.

Что делать? Значительно упрощать заявления о телефонном спаме и ужесточать наказание за массовый спам. И да, всё это технически вполне возможно, спам замечательно умеют отслеживать Truecaller и аналогичные продукты Яндекса и Касперского. Казалось бы что мешает ФАС России (отвечают за регулирование рекламы) и Роспотребнадзору (отвечают за регулирование рынка потребителей) и Банку России (регулируют банки) взяться за спамеров со всем пристрастием хотя в кооперации с коммерческими сервисами которые такой спам умеют ловить? Я вот не знаю что мешает, а пока самое разумное что можно сделать - это не указывать свой личный телефон если вы зарегистрировали ИП или выигрываете тендер. Лучше купите отдельную SIM карту и готовьтесь к шквалу звонков.

Ссылки:
[1] https://www.facebook.com/ivanova.sofya/posts/5455743684443717

#opendata #spam