Ivan Begtin
7.99K subscribers
1.76K photos
3 videos
101 files
4.48K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Постепенно приближается время подводить итоги и писать о планах на следующий год.

Подвести итоги за один раз у меня не получится, слишком много разных тем, деятельности, проектов в которых участвую и я сам и моя команда.

Я могу пока точно обозначить цель на следующий год - это систематизация, интеграция и институциональное закрепление всего что делалось за многие годы. Какие то проекты будут объединяться, для каких-то привлекаться партнеры, какие-то новые проекты будут включать ранее сделанные и так далее. Самое сложное во всем этом именно в институциональном закреплении и построение долгосрочной стратегии: финансирования, постоянной деятельности и отдельных проектов. Всё это будет непросто, но давно уже пора.

Можно сказать что сейчас не время собирать камни и не время разбрасывать, а время сортировать камни, строить из них дома и заселять людьми.

Всё это будет вокруг тем открытости, данных, цифровых архивов и приватности.

#opendata #newyear
2023 год ещё не закончился, но уже время подводить итоги.

Предлагаю простую эстафету и рассказать про:
- 2 достижения в 2023 году
- 2-3 запланированных достижения/проекта/цели на 2024 год
- и одно пожелание на 2024 год.

Я не могу рассказать о многом чем занимаюсь, но об одном большом-любимом хобби переходящим в деятельность могу.

Достижения 2023 года:
- Создание общего индекса данных (https://github.com/commondataio/dataportals-registry, https://registry.commondata.io), около 9912+ порталов данных, репозиториев исследовательских данных, порталов с каталогами данных и т. д. MIT Лицензия
- Почти завершено исследование общих API, стандартов данных и практик, связанных с открытыми данными, включая DCAT, CKAN API, Dataverse API, OAI-PMH и около 20+ других.

Планируется на 2024 год:
- Запуск системы поиска данных на основе Common Data Index. Демо-версия уже завершена: проиндексировано около 6 миллионов наборов данных (начало 2024 г.).
- Обновить инструмент Metacrafter с открытым исходным кодом для автоматического определения семантических типов в индексе поисковой системы и создать облачную версию.

Пожелание на следующий год:
- Проиндексировать около 40-50 миллионов наборов данных в поисковой системе и, конечно, всем побольше мира.


Напишите в комментариях тут, или в своих телеграм каналах о своих итогах и планах, насколько работа позволяет об этом написать;)

#opendata #data #newyear #plans