Ivan Begtin

Городской совет города Нью Йорка обязал проводить обязательный "аудит на предубеждённость" (bias audit) для всех систем ИИ используемых в рекрутинге. Законопроект был внесён в 27 февраля 2020 года и принят городским советом 10 ноября 2021 года [1]. The Protocol пишет [2] что после того как он будет подписан, то с 1 января 2023 года он вступит в силу и за его нарушение предполагается гражданская ответственность.

Ссылки:
[1] https://legistar.council.nyc.gov/LegislationDetail.aspx?ID=4344524&GUID=B051915D-A9AC-451E-81F8-6596032FA3F9&Options=&Search=
[2] https://www.protocol.com/bulletins/nyc-ai-hiring-tools

#ai #ethics #audit #usa

legistar.council.nyc.gov

The New York City Council - File #: Int 1894-2020

Title: A Local Law to amend the administrative code of the city of New York, in relation to automated employment decision tools

1.7K viewsIvan Begtin, 14:28

Ivan Begtin

Census Mapper - проект по визуализации переписи США 2020 года [1], позволяет узнать подробные данные и изменения в расовом составе по каждому отдельному графству (аналог российского муниципалитета). Проект создавался Big Local News и Pitch Interactive за счёт гранта Google News Initiative.

Проект наглядный, не первый такой в мире, мне в вспоминается что в прошлом разного рода похожие проекты были в Канаде и Австралии, но это не отменяет самого факта возможности наглядной визуализации переписи.

Ссылки:
[1] https://censusmapper.biglocalnews.org

#opendata #infographics #datajournalism

censusmapper.biglocalnews.org

Census Mapper 2020

Pitch Interactive and Big Local News as part of the 2020 Census Co-op (supported by the Google News Initiative) have partnered to share an embeddable map that displays Census data at the national level, states, counties, places and census tracts. The Census…

1.5K viewsIvan Begtin, 15:24

Ivan Begtin

Полезное чтение для тех кто изучает политические эффекты использования искусственного интеллекта. В статье AI-tocracy [1], авторы Martin Beraja, Andrew Kao, David Y. Yang & Noam Yuchtman изучают зависимость между политической нестабильностью и закупками решений на базе ИИ автократическими правительствами. В фокусе, ожидаемо, Китай и с некоторыми упоминаниями России. Основной тезис который подтверждают авторы в том что государства начинают закупать ИИ в периоды социальной нестабильности и что проблемы нестабильности эти закупки не решают, хотя и расширяют и усиливают уже имеющиеся инструменты политического и социального подавления.

Статья на английском, полезная собственным анализом, большим числом примеров в приложениях и ссылками на работы в этой и близких областях.

Если перевести смысл статьи на разговорный язык, то чем чаще говорят о ИИ, тем больше государство использует ИИ для подавления политической нестабильности.

Ссылки:
[1] https://www.nber.org/papers/w29466

#ai #government #papers

1.5K viewsIvan Begtin, 16:10

Ivan Begtin

Новости цифровой архивации

1. Архивы Мемориала
Я закончил архивацию общедоступных материалов мемориала в веб-архив. Это, в общей сложности, 67 сайтов объёмом в 67 гигабайт. Полный перечень можно посмотреть по ссылке [1] осталось сохранить их на сервер. После чего материалы будут доступны вначале по запросу, а далее в открытом доступе для всех желающих, в форматах WARC.

Не архивировались соцсети, сайты где используется Ajax/API потому что веб-краулеры их не понимают, а соцсети надо ещё собрать.

Готов передать их самим Мемориаловцам, если им нужны веб-архивы их сайтов и готов буду сохранить в нашем цифровом архиве любые данные которые они готовы будут отдать. Сам я давно с ними не общался, с кем там говорить не знаю.

При том что у Мемориала, понятно, что есть большое сообщество и высокая вероятность что их архивы не исчезнут, но в таких ситуациях в зоне риска всегда что-то есть, особенно старые сайты на старых не обновлявшихся технологиях.

2. Архив Роснано

Судя по новостям [2] Роснано в предбанкротном состоянии. С точки зрения полит-экономики об этом кто-то ещё напишет, я напишу о том что Роснано много чего контентного финансировало и много какие ресурсы могут исчезнуть. Поэтому надо начинать кампанию по поиску контента Роснано для архивации и запуску архивации их онлайн ресурсов.

Если есть идеи с чего начать или может быть кто-то собирал информацию по их онлайн ресурсам, напишите мне, всё будет подвергнуто архивации.

Ссылки:
[1] https://docs.google.com/spreadsheets/d/1p6WZ975dW2CesFApFduRvjFJnOdb8hdXSI-VG41VsQg/edit?usp=sharing
[2] https://www.rusnano.com/news/20211119-rosnano-obyavlyaet-o-provedenii-vstrechi-s-kreditorami-i-krupnymi-derzhatelyami-obligatsiy/

#webarchives #archives #digitalpreservation

Google Docs

Мемориал 2021

перечень

name,url,resource_type,reason,reason_url,priority,strategy,tools,format,status
<a href="http://1937.memo.ru">1937.memo.ru</a>,сайт проекта,Требование Генпрокуратуры РФ ликвидировать Международный Мемориал,высокий,стандартная веб архивация,wpull…

1.4K viewsIvan Begtin, 16:26

Ivan Begtin

Почему открытые данные это прежде всего культура и институциональные требования и во уже вторую очередь - это технологии? Я ранее рассказывал как открытые данные в науке существуют в биоинформатике [1] и что они появляются в этой части науки в России потому что она является частью мировой науки где принципы открытости укоренились ранее.

В качестве примера, проект Роснано "Цифровое моделирование новых материалов" [2]. Там много всего разного в ней упомянуто, но лично меня интересует не мероприятия, новости и весь остальной контент, а раздел "Базы данных" [3]. Там много ссылок на отечественные базы данных (26 штук) и зарубежные (82 штуки). Так вот как думаете в чём главное отличие российских баз данных от зарубежных?

Все российские базы данных не дают возможности экспорта базы данных целиком, ни одна не опубликована под свободной лицензией или её аналогом допускающим свободное использование и большая их часть закрыты логином-паролем. При том что почти все они, как и большая часть зарубежных баз данных, созданы за бюджетное финансирование. Но разница в том что там где органы финансирующие науку понимают необходимость финансирования открытых баз данных, вводят такие требования и требуют от учёных полной доступности того что создано за счёт государственных грантов - там данные всегда доступны.

Поэтому, безусловно, открытость данных это вопрос культуры работы с данными у тех кто их создаёт, востребованности результатов основанных на этих данных и, самое главное, вопрос институциональных требований от тех кто даёт средства на подобные проекты. Пока грантодающие организации, а в России это все организации финансирующие НИРы, не примут открытость как данность, то и обмен данными между исследовательскими коллективами будет в том состоянии что он находится сейчас.

Ссылки:
[1] https://t.me/begtin/3252
[2] https://rusnano-dmm.ru
[3] https://rusnano-dmm.ru/databases

#opendata #data #openaccess

Ivan Begtin

В рубрике данные о России, не в России и в России, каталог открытых наборов данных о биоразнообразии GBIF Global Biodiversity Information Facility [1]. В каталоге более 63 тысяч наборов данных посвящённых таксономии живых существ и из них 548 наборов данных…

1.5K viewsIvan Begtin, 18:29

Ivan Begtin

К вопросу о Роснано, я поздно спохватился и не считал сигнал ухода Чубайса к тому что материалы корпорации начнут исчезать из открытого доступа. Вот два скриншота.

Один с действующего сайта rosnano.com [1], а второй версии сайта от 27 ноября 2019 года из веб архива[2]. Обратите внимание что в новой версии исчезла почти вся информация о деятельности госкорпорации. Там остались только новости, закупки и раскрытие сведения как ПАО. Иначе говоря только _обязательные_ сведения и ничего более. А всё что касается спецпроектов, проектов, дочерних компаний и так далее благополучно исчезло с нового сайта.

Опять же вопросы экономические, политические и тд. найдется кому отразить, меня волнует вопрос цифровой архивации их контента, а получается что на сайте госкомпании теперь даже нет сведений о созданных ими компаниях, сайтах, проектах и искать их надо иным образом.

Ссылки:
[1] https://www.rosnano.com
[2] https://web.archive.org/web/20191127165310/https://www.rusnano.com/

#webarchives #digitalpreservation

1.5K viewsIvan Begtin, 09:08

Ivan Begtin

Вдогонку к предыдущей новости про архивацию цифровых ресурсов Роснано [1]

Похоже что совершенно неслучайно сайт Роснано руководство организации "выпилило" из поисковых систем. Поиск в Google [2] выдает лишь одну страницу потому что в robots.txt сайта [3] указан явный запрет на индексирование.

Даже не знаю что сказать кроме как процитировать дракона из пьесы Шварца "Дракон" (фильм - "Убить Дракона").
Папа всегда говорил:"Уничтожай архивы!" [4]

Ссылки:
[1] https://t.me/begtin/3280
[2] https://www.google.com/search?q=site:rosnano.com
[3] https://www.rusnano.com/robots.txt
[4] https://www.youtube.com/watch?v=Mp5LIAoKLx8

#archives #webarchives #digitalpreservation

Ivan Begtin

1.5K viewsIvan Begtin, 09:28

Ivan Begtin

Если предыдущая история про "выпиливание" сайта из поисковых систем была про целенаправленные действия в Роснано [1], то вот ещё один пример - Федеральная пробирная палата. Учреждена указом Президента РФ в октябре 2019 года [2], в марте 2020 года [3] было принято постановление Правительства РФ с утвержденным положением.

По статусу организация соответствует ФОИВу в подчинении Минфину России. Правда, это очень странный ФОИВ, созданный на базе казённого учреждения и с закупками больше похожими на закупки казённого учреждения. Например, лазерные комплексы для нанесения оттисков государственных пробирных клейм [4] и многое другое. Общепринято что ФОИВы отвечают за госполитику в какой-то области, а не ведут собственную хозяйственную деятельность, а тут получается что создали отдельную службу, можно было с таким же успехом создать публично-правовую компанию и тд. Впрочем это лирическое отступление, вернемся к информации о них.

У Федеральной пробирной палаты есть сайт probpalata.ru [4] который очень похож на сайт органа власти, по всем признакам, но... барабанная дробь, на самом деле это часть системы документооборота. За всё время существования пробирной палаты руководство заключило лишь один ИТ договор с ООО Диасофт на 37 миллионов рублей [6] именно на создание системы электронного документоборота. Видно что сайт - это лишь "хвост" системы Directum. Видно и по меткам в коде страниц, и по оставшемуся домену directum.probpalata.ru [7]. А самое главное, видно по тому что сайт не соответствует 8-ФЗ, прям хоть в надзорный орган (прокуратуру) пиши обращение и не индексируется поисковыми системами, а если индексируется то с нюансами. Почему так?

Потому что страницы отдаются через API в зашифрованном виде и их рендеринг происходит в браузере пользователя. Типовая страница загружается через API запрос подобный этому [8], а в HTML отдаётся только меню и структура сайта.
В итоге в Google всего 19 страниц [9] проиндексировано, а в Яндекс около 650 [10], но это с учётом всех "технических" поддоменов директума и можно обратить внимание что на страницах проиндексирован не контент, а заголовок и футер.

Это всё к вопросу о том что делать органам власти которые очень хотят скрывать данные о себе, но не знают как. Вот тут +1 трюк и не обязательно вводить каптчу и иные органичения, можно просто шифровать каждую страницу.

Причём, причины, почему в Директуме так устроено я даже могу предположить - это внутрикорпоративная непубличная система не предназначенная для того чтобы быть общедоступной и индексируемой. А вот почему Федеральная пробирная палата так делает - скорее всего от технической и технологической неграмотности ответственных там лиц.

А это ещё и заодно один из многочисленных примеров того о чём я говоря как о недокументированных API предоставляемых госорганами на своих сайтах и в государственных информационных системах. Таких случаев много, такие случаи не редкость.

Ссылки:
[1] https://t.me/begtin/3282
[2] https://rg.ru/2019/10/28/putin-sozdal-federalnuiu-probirnuiu-palatu.html
[3] http://government.ru/docs/all/126873/
[4] https://spending.gov.ru/goscontracts/customers/01954000006/
[5] https://www.probpalata.ru
[6] https://spending.gov.ru/goscontracts/contracts/1970301161220000021/
[7] https://directum.probpalata.ru/
[8] https://probpalata.ru/webmvc/getarticle?PortalID=2001&SysName=main&Locale=RU
[9] https://www.google.com/search?hl=ru&q=site%3Awww.probpalata.ru
[10] https://yandex.ru/search/?text=site%3Awww.probpalata.ru&lr=11481

#opendata #opengov #websites

Яндекс

site:www.probpalata.ru

Найдётся всё

2.0K viewsIvan Begtin, 10:22

Ivan Begtin

CNews сегодня написали про сайт Роснано и исчезновение материалов с их сайта, они на меня ссылку не дают, так что я на них тоже ссылку не дам. Важнее то что им прокомментировали представители компании о том что плановая замена сайта Роснано была в августе-сентябре 2021 года и что "информация об активах «Роснано» присутствует непосредственно на сайтах портфельных компаний".

Я всё думаю как это прокомментировать, ну начну с того что перечень портфельных компаний Роснано тоже исчез с их сайта;) А то есть найти информацию об их активах стало ещё сложнее. Это, как бы раз.

С нового сайта Роснано начисто исчезли сведения об органах управления и управляющей компании ООО "УК Роснано", при том что эти сведения были ещё в июне на их предыдущем сайте [1], да и проекты ещё были доступны в июне [2]. А Это два.

Я всё это к тому что у Роснано всегда было достаточно ресурсов чтобы сохранить старый сайт под доменом типа old.rusnano.com, но вместо этого его просто снесли так что даже информации о руководстве нет. Странно что инвесторы на Мосбирже всполошились только вот-вот.

Ссылки:
[1] https://web.archive.org/web/20210613155819/https://www.rusnano.com/about/structure
[2] https://web.archive.org/web/20210506045809/https://www.rusnano.com/projects/portfolio

#webarchives #archives #digitalpreservation

web.archive.org

Структура РОСНАНО и органы управления

Деятельность компании Группы РОСНАНО - инвестирование в нанотехнологии и нанопроизводство, развитие наноиндустрии в России, инфраструктурная поддержка.

1.6K viewsIvan Begtin, 15:11

Ivan Begtin

В рубрике полезные инструменты для работы с данными:
- OpenRefine версии 3.5.0 вышел совсем недавно, один из лучших инструментов для data wrangling, точно лучший из бесплатных. Много разных улучшений, для поддержки Wikibase/Wikidata, для работы в UI и ещё многое другое.
- Autoscraper не совсем обычный инструмент автоматического скрейпинга данных на основе примеров. Вместо сложных конструкций по парсингу HTML скрейперу передаётся пример данных, а дальше он сам додумывается. Хорошая штука, я когда-то думал в этом же направлении, но шёл от понимания структуры данных, а тут от содержания.
- Developing AI-Based Solution for Web Scraping: Lessons Learned - полезная статья на ту же тему автоматизации скрейпинга данных. То что авторы используют термин AI - это, конечно, совсем неправда. Просто адаптивные алгоритмы, но и они это уже хороший прогресс.
- QuestDb - открытая СУБД с обещаниями очень хорошей скорости для хранения и обработки временных рядов. По их собственным бенчмаркам обгоняет ClickHouse
- NADA (National Data Archive) - проект Мирового Банка по публикации микроданных опросов, переписей и так далее. С открытым кодом и с поддержкой стандарта раскрытия данных DDI (Data Documentation Initiative). Используется самим Мировым банком в их базе микроданных и ещё в нескольких странах национальными службами статистики.

А также не совсем про данные:
- PubPub для тех кто интересуется новыми моделями публикации научных текстов, у проекта PubPub.org есть открытый код которым можно воспользоваться. Это не совсем про данные, но близко к открытости науки и открытости знания.

#data #tools #tech

GitHub

Release OpenRefine v3.5.0 · OpenRefine/OpenRefine

This is the first stable release of the 3.5 series. Please backup your workspace directory before installing and report any problems that you encounter.
New features

Wikidata support has been gene...

1.5K viewsIvan Begtin, 18:51

Ivan Begtin

Я, к сожалению, в это время буду читать лекцию про управление основанное на данных и большие данные в госуправлении, но свои вопросы Максуту Шадаеву передал. И хотя я и склонен кидаться в адрес Минцифры окаменелостями, но, если смотреть объективно, есть как хорошее в деятельности Министерства так и не очень.

Из хорошего:
+ поддержка open source (давно пора)
+ худо/бедно работающие госуслуги
+ Гостех как идеология (идёт криво и косо и странно иногда, но сама идея имеет долгосрочное разумное зерно)
+ начало инвентаризации государственного ИТ бардака

Из плохого
- слабая регуляторная позиция (много ляпов в законопроектах)
- усиление регулирования в части госслежки (как минимум непрепятствование усиления)
- отсутствие вопросов открытости данных и приватности в рабочей повестке не только Минцифры, но и Пр-ва в целом.

Поэтому будет интересно потом послушать ответы, ну и Тадвайзер молодцы, конечно.

#events #comments #questions

1.3K viewsIvan Begtin, 06:13

Ivan Begtin

Forwarded from TAdviser

Сегодня в 11.30 на TAdviser Summit главный редактор TAdviser Александр Левашов беседует с главой Минцифры РФ Максутом Шадаевым от лица ИТ-отрасли. Смотреть трансляцию можно после регистрации по ссылке https://summit.tadviser.ru/ Спасибо всем, кто задавал вопросы. Основные темы: гостех, open source, импортозамещение, данные, кадры, образование, льготы, а также специфические вопросы фоивов и регионов.

1.2K viewsIvan Begtin, 06:13

Ivan Begtin

В качестве напоминания новым подписчикам о том кто я и чем занимаюсь.

Я возглавляю Ассоциацию участников рынка данных АУРД (если Ваша компаниях занимается данными, то, кстати, вступайте) и АНО Инфокультура. Развиваю стартап APICrafter по доступу к API для проверки контргагентов и сейчас в рамках него создаю наибольший каталог данных в России DataCrafter.

Я много пишу онлайн про технологии в госсекторе, :
- в канале в телеграм https://t.me/begtin
- на странице в Facebook https://facebook.com/ivanbegtin
- во Вконтакте https://vk.com/begtin
- и даже в Viber (в качестве эксперимента)

Лонгриды я пишу у себя в блоге https://begtin.tech (редко) и в рассылке https://begtin.substack.com (чаще).

Темы о которых я пишу включают технологии в госсекторе, открытые данные, большие данные, этика работы с данными и ИИ, открытость государства, цифровая архивация, простой язык, понятность государства, алгоритмы и инструменты работы с данными и анализ данных.

Кроме того наша команда ведёт многие общественные проекты связанные с открытость и понятностью данных, государства, общества.

Это такие проекты как:
- Госзатраты (clearspending.ru) - открытая база госконтрактов
- Открытые НКО (openngo.ru) - база прозрачности некоммерческих организаций
- Понятный язык (plainrussian.ru) - открытый сервис оценки понятности текстов на русском языке
- Национальный цифровой архив (ruarxive.org) - проект по цифровой архивации сайтов и иных цифровых ресурсов.

До этого я состоял в нескольких общественных советах, возглавял экспертный совет при Генпрокуратуре и так далее. Вышел из них всех когда чуть более чем 2 года назад пошёл работать в подвед Счетной палаты создавая проект Госрасходы (spending.gov.ru) так что я 2 года был почти госслужащим, пока не вернулся к общественной и коммерческой деятельности с мая 2021 г.

А также веду для души в телеграм небольшой канал стихов ministryofpoems (иногда резких) специально для тех кто регулярно сталкивается с нашим государством и не знает как это описать.

#blog

1.3K viewsIvan Begtin, edited 09:07

Ivan Begtin

По поводу "реестра токсичного контента" [1] который продвигает г-н Ашманов многие уже написали, а я добавлю что, конечно, жаль что в России нет закона о лоббизме потому что у Игоря Ашманова в данном случае есть прямой конфликт интересов поскольку правильно указывать аффиляцию Игоря Ашманова как бенефициара компании Крибрум (он её основатель), а общественные позиции не более чем инструмент повышения капитализации активов.

Крибрум не то чтобы лидер отрасли мониторинга контента. У них минимум заказов [2] по 44-ФЗ, но может быть по 223-ФЗ есть, нельзя сказать точно потому что данные не раскрываются. А с другой стороны резкий рост выручки за 2019-2020 годы, например, за 2020 год она составила 379 млн руб [3], что не так уж мало, но существенно меньше чем выручка Медиалогии в 1.7 млрд руб и сравнимо Брэнд Аналитикс (ООО Палитрумлаб) в 323 млн руб.

Почему вся эта инициатива выглядит сомнительно? Потому что мир идёт по пути регулирования платформ. Зачем мониторить и составлять реестр токсичного контента когда уже принято решение о приземлении платформ на российскую юрисдикцию? Контент или соответствуют российскому законодательству, или удаляется/блокируется модераторами платформу. Нельзя быть "чуть-чуть токсичным", тут либо налево, либо направо, третьего не дано.

Ссылки:
[1] https://habr.com/ru/news/t/590589/
[2] https://clearspending.ru/supplier/inn=7731661104&kpp=773101001
[3] https://bo.nalog.ru/organizations-card/378398#balance

#registries #ashmanov

Хабр

Ашманов предложил создать реестр токсичного контента

По информации издания «Ведомости», член Совета при президенте России по развитию гражданского общества и правам человека Игорь Ашманов, а также представители общественных организаций, связанных с...

1.7K viewsIvan Begtin, 09:31

Ivan Begtin

Трансперенси Рус (признано НКО-«иностранным агентом») одни из немногих оставшихся российских НКО занимающихся прозрачностью государства и госзакупок на практике пишут про европейскую модель Integrity Pacts, когда у госконтракта появляется третья сторона, некоммерческого арбитра, отслеживающая соблюдение общественных интересов. Я знаю про эту практику, она не только в европе существует, она есть в Мексике по моделе "гражданского свидетеля", представителя общества участвующего в мониторинге исполнения госконтракта.

Она есть во многих других странах в других формах, но тут надо оговорится и что ключевое в таких моделях взаимодействия - это наличие независимых НКО и СМИ. В Евросоюзе снизили коррупцию не просто через Integrity Acts, а через то что там много НКО имеющих финансирование из независимых от правительств источников или же имеющих независимость даже при госфинансировании. В России сейчас прессинг на НКО и СМИ очень велик, настолько что общественный контроль очень сильно ограничен, в первую очередь, самоцензурой. Без снятия этого давления Integrity Pacts не заработают. Что не отменяет того что это, в целом, вполне здравая идея.

И начинаться она должна и может через включение общественников в приёмку результатов работ. Чем безжалостно сопротивляются почти все госзаказчики и исполнители по госконтрактам.

#procurement #government

1.3K viewsIvan Begtin, 11:10

Ivan Begtin

Forwarded from Трансперенси

Можно ли в России сделать госзакупки такими же прозрачными, как в Европе? (Да)

В Европейском союзе коррупция в секторе государственных закупок долгое время наносила ущерб в размере 5 млрд евро ежегодно. Чтобы снизить этот ущерб, в 2015 году секретариат Transparency International запустил проект Integrity Pacts (по-русски мы называем их Соглашениями о гражданском участии). Integrity Pact — это юридически обязывающее соглашение трех сторон: государственного заказчика, подрядчика и представителей гражданского общества (в Европейском союзе — это представители Transparency International).

С тех пор Integrity Pacts нашли применение в 11 странах Европейского союза на 18 крупных инфраструктурных проектах.

По оценке Счетной палаты, в России общий объем нарушений на госзакупках в 2020 году составил 108,7 млрд рублей (сюда включены не только коррупционные преступления, но и менее серьезные нарушения). При этом потери бюджета — не единственный вид вреда, который наносит обществу непрозрачность при госзакупках. Изолированность решений о распределении госконтрактов от общества часто становится триггером для массового недовольства.

Чтобы сделать государственные закупки прозрачнее а, значит, снизить потери общества от коррупции, мы запускаем проект Integrity Pacts в России. На первом этапе мы будем концентрироваться на закупках, связанных с благоустройством городских территорий.

Начинаем с Екатеринбурга — именно там в последние годы происходили наиболее острые конфликты по поводу благоустройства (чего стоит только история с строительством храма на месте сквера в центре города). Пилотным проектом для Соглашений может стать реконструкция Дендрологического парка-выставки в Екатеринбурге.

Самое главное: вы тоже можете принять участие в проекте, став арбитром между государственным заказчиком и частным подрядчиком.

➡️ Присоединяйтесь: https://transparency.org.ru/special/integritypacts/

transparency.org.ru

Соглашение о гражданском участии

Инструмент для снижения коррупции в инфраструктурных проектах.

1.2K viewsIvan Begtin, 11:10

Ivan Begtin

В рубрике интересное чтение в свободное время, Commonplace [1] проект от НКО Knowledge Futures посвящённый устойчивости воспроизведения знания в современном мире. Онлайн издание о таких темах как открытый доступ (open access), устойчивости открытых библиотек, реорганизации научных публикаций. Тексты все про размышления, очень оторванные от российской действительности, но хорошо задающие направления размышления именно про знания в нашем мире. Те же авторы являются создателями платформы PubPub [2] для осовременивания публикации научных работ.

В их контексте интересный проект IOI (Invest in Open Infrastructure) [3] в виде исследовательской НКО с фокусом на исследование принципов создания открытой инфраструктуры работы исследователей. Что это на практике? Это замена инфраструктуры коммерческих провайдеров, таких как Clarivate и им подобных, вначале собирающих статьи/данные/материалы от учёных, а потом предоставляющих подписку им же и за деньги. Например, IOI рассматривают существующие 10 проектов создания такой инфраструктуры [4] и многое другое.

Ещё одно интересное чтение, вернее смотрение, это большая мини-конференция Funding The Commons [5] от Protocol Labs о поиске источников финансирования для проектов имеющих общественную ценность. Protocol Labs - это ребята про криптовалюту, NFT и тому подобное. Соответственно и здесь видео в том числе о таких моделях развития общественных проектов и сборе пожертвований. Я бы предпочёл не слушать и не смотреть, а прочитать хорошую подборку статей об этом, но пока вижу мало публикаций и интересно движение мыслей. Если поиск идей в направлениях криптовалют и NFT помогут устойчивому существованию крупных общественных проектов таких как Wikipedia или Internet Archive, а также многих других, значит в этой идее есть здравое зерно.

Ссылки:
[1] https://commonplace.knowledgefutures.org/
[2] https://www.pubpub.org/
[3] https://investinopen.org
[4] https://investinopen.org/blog/costs-characteristics-oi-providers/#more-on-the-projects-and-how-we-selected-them
[5] https://www.youtube.com/watch?v=Axj8NJXnCN0

#thoughts #reading

PubPub

PubPub · Community Publishing

Collaborative Community Publishing

1.4K viewsIvan Begtin, 13:16

Ivan Begtin via @vote

Есть ли у Игоря Ашманова конфликт интересов при лоббирования "реестра токсичного контента" ?
anonymous poll

Есть, конечно, он же бизнесмен – 99
👍👍👍👍👍👍👍 79%

Я просто посмотреть ответы! – 24
👍👍 19%

Нет, конечно, он же член СПЧ – 2
▫️ 2%

👥 125 people voted so far.

1.3K viewsIvan Begtin, 13:26

Есть, конечно, он же бизнесмен – 79%

Нет, конечно, он же член СПЧ – 2%

Я просто посмотреть ответы! – 19%

Ivan Begtin

Специально для тех кто обладает цифровыми навыками и немного свободным временем, есть задачи для программистов которые можно сделать как волонтеры, можно за деньги, как захочется. Я описал их на бирже фриланса [1] и в списке задач на Github [2].

Если кратко, у нас есть общественный проект Национальный цифровой архив (ruarxive.org) [3], не очень наглядный по виду, но по смыслу - это регулярная архивация веб сайтов и иного современного цифрового контента. Обычно кампаниями по сохранению чего-то в период риска.

В последние годы есть много контента который надо, или сохранять иначе, или специальными инструментами потому что веб-краулеры это не поддерживают. Например, это социальные сети и сайты с Ajax/API. Для некоторых появляются инструменты такие как instaloader для Instagram, twarc для Twitter, apibackuper для REST API и ещё много чего.

Но есть то для чего таких инструментов нет, например:
- сообщества и чаты в телеграм (можно сохранять с десктопного клиента только)
- сообщества в VK
- файлы с Яндекс.Диска, Облака Mail.ru и других онлайн дисков
- сайты Wordpress (у них есть такая опция с API)
- сайты Sharepoint (у них тоже есть такая опция с API)

Есть желание повысить качество архивации, в первую очередь по Telegram, VK и Яндекс.Диску, как самому критичному.

Для этого нужны утилиты командной строки которые можно регулярно запускать на сервере. Если у Вас есть опыт написания таких инструментов, Вам близка открытая разработка и есть немного времени, то помощь будет неоценима. А если хочется помочь, но нет возможности сделать это бесплатно - оцените сколько такая задача (любая из перечисленных) может стоить и возможно я смогу найти на это деньги.

Хочу попробовать найти разработчиков под такие инструменты таким анонсом, ну а если не получится, то устроим хакатон по цифровой архивации и наберем на него таких задачек;)

Ссылки:
[1] https://freelance.habr.com/tasks/402049
[2] https://github.com/ruarxive/ruarxive-research/issues
[3] https://ruarxive.org

#opendata #digitalpreservation #tools

2.3K viewsIvan Begtin, edited 15:02

Ivan Begtin

За начало границы муниципального района Волжский Самарской области принята точка, расположенная в юго-западном углу лесного квартала 21 Советского лесничества Кинельского лесхоза на развилке лесных дорог (точка 1 – пересечение границ муниципальных районов Волжский, Красноярский и Кинельский Самарской области), далее граница проходит смежно границе муниципального района Кинельский Самарской области в восточном направлении по южным границам лесных кварталов 21, 22 Советского лесничества Кинельского лесхоза до юго-восточного угла квартала 22 Советского лесничества Кинельского лесхоза (точка 12), в южном направлении на расстоянии 360 м, пересекая автодорогу, идущую от поселка городского типа Новосемейкино муниципального района Красноярский Самарской области до кольца автодороги, идущей от города Самары до города Отрадного, далее в западном направлении по северной границе лесного квартала 99 Советского лесничества Кинельского лесхоза...
—
Именно так начинается самое длинное предложение современного русского языка в 9377 слов и 61 064 знака без пробелов и является это предложение приложением "Картографическое описание границ муниципального района Волжский Самарской области" к закону Самарской области №58-ГД от 25.02.2005 "Об установлении границ муниципального района Волжский Самарской области" [1].

Я писал о нём много лет назад, в декабре 2013 года и всё искал есть ли пример превосходящий этот по масштабам насилия над русским языком. Напишите, если такой знаете. Ищу новые и актуальные примеры наиболее закрученного замороченного и усложненного написания русскоязычных юридических и нормативных текстов.

Ссылки:
[1] https://www.samregion.ru/documents/laws/58-gd-ot-25-02-2005/

#plainrussian #language #russian

3.6K viewsIvan Begtin, edited 07:40

About

Blog

Apps

Platform