Ivan Begtin
7.99K subscribers
1.82K photos
3 videos
101 files
4.53K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Как устроен некоммерческий сектор в России. Часть 2 [1]
Продолжение публикации на основе накопленных нами данных в проекте Открытые НКО и анализа существующих некоммерческих организаций.

В 3-й части я расскажу подробнее о том почему многие организации регистрируются как некоммерческие, а в 4-й расскажу подробнее о проблемах и особенностях расширенной деятельностной классификации НКО и о подходах к этой задаче. А также о том какие выводы можно делать на расширении информации об организациях, их бухгалтерских балансах и отчетах.

Ссылки:
[1] https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/kak-ustroen-nekommercheskii-sektor-v-rossii-chast-2-5a3a1e898139ba9e538c916b?

#opendata #openngo #opengovernment
Идея перевода госсайтов на единый ресурс и единую платформу gov.ru актуальна была всегда и то что сейчас ей озадачилось Минсвязи - это неплохо. Статья в РБК [1] обнадеживает то мы можем застать этот процесс уже в следующем году.

Но не стоит рассчитывать что он будет прост. Многие сайты госорганов уже созданы и делать единый ресурс означает покушаться на ИТ бюджеты ФОИВов. Они будут сопротивляться, некоторые обосновано, некоторые рефлекторно, но будут.

Если проект не будет курировать глава правительства лично, шансы его будут невелики.

Ссылки:
[1] https://www.rbc.ru/technology_and_media/22/12/2017/5a3a6b8a9a79470d0525805b

#opendata #opengov #govru
У КБ Стрелка вышло интересное исследование по устройству городских бюджетов региональных столиц [1].

Со многих точек зрения интересное исследование, в первую очередь тем что видна дистанция между городами лидерами по управлению городским имуществом и финансами и городами аутсайдерами.

Всегда жаль лишь что по итогам публикуются только документы исследования, а не созданные данные.

Ссылки:
[1] http://citybudget.strelka-kb.com/
#openbudgets #budget
Поздравляю всех и от себя лично и от АНО "Инфокультура" всех с наступающим Новым годом! В следующем году темы о которых я пишу - открытые данные, государство, технологии, цифровая архивация и многое другое продолжат свое развитие. Кроме открытых данных лично я много внимания буду уделять некоммерческому сектору в России, в первую очередь с точки зрения работы именно с открытыми данными. Другое направление будет - это помощь бизнесу в защите его интересов когда государство открывает или не открывает информацию. И, конечно, продолжать все наши проекты.
Интересные проекты и события уходящего года в области данных в мире
Научные данные:
- Dat [1] децентрализованный протокол обмена данными. Использует обмен данными P2P для ускоренной и удобной доставки наборов данных. Пока, в основном, используется в научном сообществе.
- Code Ocean [2] - стартап по перепроверке результатов исследований онлайн. Предоставляет платформу куда можно публиковать код и данные и предоставлять возможность воспроизводить результаты запуская код в облаке.
- Frictionless Data [3] проект Open Knowledge International по унификации метаданных и распространению CSV файлов с обязательными схемами и спецификациями.
- научные проект поддерживанием Alfred P. Sloan Foundation [4] их довольно много и с каждым годом все больше. В основном они касаются создания, визуализации и обмена научными открытыми данными.

Открытый код:
- Toapi [5] проект с открытым кодом по быстром превращению страниц сайта в API. Работает как конструктор, очень простой в использовании и стремительно набирающий популярность
- Public APIs [6] большая коллекция ссылок на общедоступные API со ссылками на документацию и все разделено по категориям
- Rawgraph [7] удобная библиотека и сервис по визуализации табличных данных

Платформы:
- Data World [8] один из немногих проектов которые реально могут стать аналогом Github для данных
- AirTable [9] являются аналогом Excel'я и конкурентом Google Spreadsheets, но с более быстрым интерфейсом, API и другими возможностями.

Ссылки:
[1] https://datproject.org/
[2] https://codeocean.com/
[3] http://frictionlessdata.io/
[4] https://sloan.org/programs/digital-technology/data-and-computational-research/platforms
[5] https://github.com/gaojiuli/toapi
[6] https://github.com/toddmotto/public-apis
[7] http://rawgraphs.io/
[8] https://data.world
[9] https://airtable.com/

#opendata #opengov
о том как меняется подход к статистике в Великобритании. Команды статистиков работают вместе с data scientist'ами над выработкой удобных инструментов доступа к статистике. Например, органы власти финансируют появление пакетов для языка R для удобной работы с официальными данными.
Forwarded from Open Data Digest
Transforming the process of producing official statistics
https://dataingovernment.blog.gov.uk/2017/11/27/transforming-the-process-of-producing-official-statistics/

In March, we blogged about our work with analysts across government to
transform the way we produce official statistics. We borrowed ideas from
software development and academia to demonstrate what this might look like. We
called the project ‘RAP’, which stands for Reproducible Analytical Pipelines.
30 января выйдет Open Budget Survey за 2017 год с очередным рейтингом открытости бюджетов стран. Не стоит ждать резких прорывов или падений открытости в России - мы там на довольно высоком уровне.
Forwarded from Open Government Digest
How Can We Bridge the Gap Between Citizens and State? Previewing the Open Budget Survey 2017
https://www.internationalbudget.org/2018/01/previewing-the-open-budget-survey-2017/

On 30 January 2018 the International Budget Partnership will release the Open
Budget Survey 2017 – the latest round of the world’s only independent and
comparable assessment of budget transparency, citizen participation, and
independent oversight institutions in the budgeting process.

The post [How Can We Bridge the Gap Between Citizens and State? Previewing the
Open Budget Survey
2017](https://www.internationalbudget.org/2018/01/previewing-the-open-budget-
survey-2017/) appeared first on [Inte
Длинные зимние праздники - это хорошая возможность не только отдохнуть, но и отдохнуть за работой. Я так мало программировал руками в последние годы, что решил за пару дней, одновременно, восстановить старый проект и сделать что-то полезное.

Возникла очень простая идея переноса подписки на RSS новости из привычного онлайн ридера, в телеграм. При этом выделив каждую категорию новостей в отдельный канал.

Поиск таких готовых ботов и сервисов ни к чему не привел, кроме того у источников информации с которыми я работаю есть маленький-большой нюанс. Очень часто они не поддерживают экспорт в RSS ленты. Экспорт новостей в RSS это такая "странная" возможность что регулярно разработчики и заказчики их работы по созданию госсайтов и не только забывают их добавить.

Именно по этой причине много лет назад я и сделал алгоритм "Скъюр" который умел и умеет обрабатывать новости с любой страницы и превращать их в RSS.

Итого, я сделал несколько новых каналов в телеграм:
* Инфокультура - https://t.me/infoculture - новости проектов Инфокультуры. С нашего сайта, Госзатрат и Открытой полиции. А в будущем и других проектов
* Open Data Digest - https://t.me/opendatadigest - канал не-русскоязычных новостей по открытым данным
* Open Government Digest - https://t.me/opengovdigest - канал не-русскоязычных новости по открытости государства
* Правительственный вестник - https://t.me/govdigest - канал для трансляции официальных новостей с сайта Правительства, Президента, ряда ФОИВов и окологосударственных мозговых центров

Изначально не было планов делать их публичными, но по здравому разумению ничего секретного в них нет. А делать репосты из каналов гораздо удобнее чем вначале получать их через читалку RSS.

Особенность этих каналов в том что работа с ними происходит через универсальный бот. Он авторизует пользователя по нику в Telegram, принимает команды на добавление лент подписки к каналам и регулярно постит в выбранные каналы собранные новости.

Ему не обязательно передавать RSS ленту, можно скормить ссылку на сайт и тогда он там вначале попробует RSS ленту найти и если не найдет то будет искать текст новостей на самой странице.

После бета тестирования бот будет открыт полностью для всех, с ограничением лишь по числу каналов и подписок.
В целом он уже готов, в нем не включено только автосбор новостей. Вернее он пока отключен.

Если кто-то хочет уже сейчас его опробовать и помочь с обратной связью - пишите мне сообщением в Telegram на https://t.me/ibegtin или в чат https://t.me/begtinchat

#news #feeds
Важный тренд последних нескольких лет - это появление команд цифровой трансформации очень похожих на команду Alpha Gov (ныне это Government Digital Services) в Великобритании.

Такие команды уже есть в Канаде, Италии, США, Великобритании, Австралии, Новой Зеландии.

То как они работают значительно отличается от того о чем говорят в рамках цифровой экономики / цифровой трансформации в России.

И вот главные отличия:
1. Открытая разработка - все эти команды работают в открытую. Их код опубликован, либо на GitHub'е, либо на собственном экземпляре GitLab, но тоже в открытом доступе. Но открытая разработка - это больше чем просто открытый код, это еще и возможность принять участие в исправлении их кода, отправлять сообщения об ошибкам и взаимодействовать с командами разработки.
2. Открытые данные по умолчанию. На открытости данных уже нет такого акцента как раньше по той причине что они уже признаются неким стандартом де-факто.
3. Простой язык (plain language) во всех документах предназначенных для граждан.
4. Единые стилевые гайды по созданию новых и обновлению имеющихся веб сайтов.
5. Публичные консультации на каждом шагу в реализации.

Все начинается с открытого исходного кода.

#opendata #opengov #digitalgov
На сайте Минфина Раздел "Открытые данные" исчез из раздела "Открытое Министерство". Осталось проверить сайты других министерств, нет ли там аналогичных изменений
В последнее время думала, что же меня смущает на странице "Открытое Министерство" на сайте МинФин России. Сегодня подтвердила догадки, что Открытые данные перестали быть их приоритетным направлением. На скриншоте вебархива от 8 июня они еще приоритетные, а 5 января их уже нет https://www.minfin.ru/ru/om/
"Мы занимались открытыми данными до того как государство начало их публиковать и продолжим когда оно прекратит" (с)

Много лет назад, в 2012 году, когда "Открытое правительство" (ОП) под руководством Михаила Абызова только формировалось и было гораздо больше перспектив того что мы называем открытостью государства, я сформулировал этот тезис, который регулярно повторял на круглых столах и встречах.

Еще тогда у меня была уверенность что мода на открытые данные в России просуществует внутри государства недолго, вернее термин останется, а вот форма его реализации может значительно исказиться.
—-
Повестка открытости

Повестка открытости как ключевая сошла на нет еще в 2013 году. С момента выпадения России из G8 "выпала" и повестка национального плана по открытости. С той поры открытые данные, стали частью, скорее общемирового феномена госуправления, не имея под собой сильной политической опоры.

Сохранилась повестка "Открытого правительства", но она приобрела свои, автохонные черты, не имеющие ничего общего с мировым Партнерством открытых правительств или же Хартией открытых данных.

Так, реформа контрольно-надзорных функций, или реформа государственного заказа - очень мало имеют отношения к открытости. При том что первое еще как-то продвигается, а второе прожило в активном режиме не более полугода.

Как, к сожалению, и многие другие инициативы, часть из которых оказались недееспособными, например, Российская общественная инициатива большая часть предложений поступивших через нее не были поддержаны.

Часть маргинализировались, например, деятельность ОП в части открытых данных. Совет по открытым данным при Правительственной комиссии свелся к довольно бессмысленным отчетным выступлениям ФОИВов и не менее малосодержательным монологам.

Часть были перехвачены, например, в формировании общественных советов повестку перехватила Общественная палата которая формирует теперь 75% каждого совета.

А темы открытости кода или понятности языка, даже не попали в повестку работы Открытого правительства в самом начале его создания. Не в последнюю очередь из-за их сложности, необходимости кропотливой работы и, невозможности получить "низковисящие фрукты".
Ближайшее будущее

Все это время открытое правительство было некой пристройкой к "классическому" Правительству Дмитрия Медведева. Через несколько месяцев в России появится новый кабинет министров и совершенно неизвестно найдется ли в нем место Открытому правительству в той форме как оно существовало с 2012 года. На мой взгляд, шансы на его сохранение исчезающе малы.

Что будет с открытыми данными, если ОП исчезнет? Повлияет ли это как-то на то с чем мы работаем этим годы?

Повлияет лишь отчасти. В действительности влияние государства на открытые данные не так уж велико. Сама природа создания государственных баз данных в последние годы такова что их сложно держать закрытыми. Они создаются изначально так чтобы ими могли пользоваться неограниченно число пользователей и это значительно влияет на открытость не связанную с наличием формальной уполномоченной структуры такой как ОП.
—-
Что будем делать мы

В самом худшем сценарии - это возврат к модели работы когда государство не публикует новых данных, но продолжает создавать сайты. Это означает извлечение и создание баз данных через web scraping, обработку веб-страниц с преобразованием их в базы данных.

Много лет назад, в 2009 году я организовывал такие мини конкурсы для разработчиков по созданию наборов данных на основе опубликованных на сайтах материалов. А сами данные публиковать на независимых негосударственных порталах данных.

В самом оптимистичном сценарии повестка открытости перейдет в повестку цифрового государства и станет ее неотъемлимой частью.

Итоговый результат будет где-то по середине и ждать нам осталось совсем недолго.

https://zen.yandex.ru/media/id/5a315e1300b3dd77beb64261/my-zanimalis-otkrytymi-dannymi-do-togo-kak-gosudarstvo-nachalo-ih-publikovat-i-prodoljim-kogda-ono-prekratit-s-5a54a0d648c85ef3503c99c2
Ранее я писал про бот который создает поток сообщений из RSS и новостей на сайтах и транслирует их в каналах. Бот наконец-то проверен в полубоевых условиях и готов для публичного тестирования.

Бот доступен тут @FeedRetranslatorBot справка по нему получается командой "/help".

Как с ним работать:
1. Если у Вас нет канала, то создаете его через клиента Telegrama. Он должен быть публичен. Например, мой канал имеет имя "begtin" и ссылку "https://t.me/begtin". Вам понадобится его имя.
2. Добавляете бота @FeedRetranslatorBot администратором в канал. Из прав ему нужны только права на публикацию постов.
3. Заходите в настройки бота и добавляете подключаете канал. Это команда "/channel [название канала]". Пример: /channel begtin
4. Далее добавляете подписки. Добавить можно через команду: "/add"
Добавление выглядит вот так: "/add begtin https://medium.com/feed/@ibegtin"
если Вы не знаете есть ли RSS лента на странице, то можно предварительно это проверить командой "/test https://medium.com/feed/@ibegtin"
5. Далее каждые полчаса робот собирает новости и раскидывает их по каналам.

Важные особенности:
- сейчас стоит ограничение на 3 канала и по 5 подписок на канал на одного пользователя. Если понадобится больше, пишите.
- боту _не обязательно_ чтобы на странице была RSS лента. Он умеет собирать новости с любой страницы где есть ссылки с датами. Пример, у ФРИИ нет RSS ленты на сайте, но со страницы http://www.iidf.ru/media/articles/ бот соберет информацию. Поддерживает 8 языков и примерно 300 видов написания дат. Не поддерживает восточные языки, иероглифы и тд. Даже не проверялся.
- сейчас бот может иногда выдавать отладочную информацию при взаимодействии, это нужно для его проверки. Но в сами каналы он ничего такого не пишет, туда идут только новости.

Это мой личный проект-хобби, я на нем поддерживаю свои навыки программирования, чтобы совсем уж не отойти от технической работы. При этом я сам его активно использую, перенеся в него все подписки из RSS ридера.

Все пожелания можно направлять мне в @begtinchat или напрямую в @ibegtin

#news #rss #feeds #bots
Обратите внимание на то как проводит найм сотрудников Canadian Digital Services.
1. Работа в start-up environment. С самого начала работа предполагает неформальную обстановку
2. Найм людей исключительно по квалификации и талантам. Нет требований к образованию, годам госслужбы, допуску и так далее. Требуется только опыт и квалификации для задач команды [1]
3. Открытый исходный код [2] включая полный код их сайта digital.canada.ca [3]

Ссылки:
[1] https://digital.canada.ca/work-with-us/
[2] https://github.com/cds-snc
[3] https://github.com/cds-snc/digital-canada-ca
Forwarded from Open Government Digest
Hiring at CDS – How we make it work in a start-up environment
http://digital.canada.ca/2018/01/09/hiring-at-cds/

There’s a lot of interest on how we are recruiting and staffing up a digital
services team that can hit the ground running and help solve service
challenges across the Government. This is why I am super excited to be writing
a blog post about our hiring practices at CDS.

We are recruiting talent from inside and outside the public service at the
grandest scale: globally, nationally and locally. We want to bring together
the best: highly skilled people who are motivated to do mission driven work
Примеры того как данные о преступлениях приводят к предсказании преступности. Алгоритм с 90% вероятностью предсказывает типы и число преступлений на определенных территориях, только на основе исторических данных полиции Сан-Франциско. Особенность в том что предсказания привязаны к почтовому индексу, времени суток и дню недели. А также доступен исходный код [1]

Ссылки:
[1] https://github.com/orlandott/Predictive_Policing

#opendata #openpolice