Ridni Dev
160 subscribers
17 photos
7 links
Кузня наших технологічних проектів: карта прізвищ, розпізнавання рукописів, каталог метричних книг та інше.
Download Telegram
Привіт, друзі!
Я бачу, що серед підписників більше дослідників свого роду, ніж архівістів, тому, розповім із самого початку, для чого ми взагалі вкладаємо стільки зусиль і часу в якийсь каталог метричних книг, щоб зробити з нього такий же каталог метричних книг. Здавалося б, із пустого – в порожнє.
Ви вже працювали з генеалогічними джерелами, здебільшого відсканованими, тому знаєте, що таке метрична книга, знаєте, що зберігаються вони за географічним принципом у мережі архівних установ, здебільшого обласних архівах. Тобто розумієте, що для знаходження запису про народження (охрещення) потрібно знати місце народження, а ще краще конкретний храм, до приходу якого належала сім'я.
Також ви знаєте, що архівні справи певного села можуть зберігатися в архівах різних областей або й країн. Тому, щоб уявити перспективи дослідження роду певного села, потрібно зібрати докупи весь масив архівних справ цього села з усіх можливих архівів. Ми в РІДНІ цей об'єм роботи загорнули у окрему послугу, яку назвали Джерельна довідка,
Для прискорення пошуку архівних справ по каталогах метричних книг різних архівів ми почали розпізнавати чи парсити PDF каталоги і укладати в табличний вигляд для зручності сортування і вибірки. Це дає нам основу таблиці, часто з помилками й неточностями, над якою потім потрібно ще декілька годин працювати: звіряти з PDF, додавати ті джерела, які знаходяться в інших описах, які ми ще не опрацювали і так далі. Саме тому, протягом останніх 4 років ми не давали цей інструмент вам, а продовжували його вдосконалювати, чистити, наповнювати. І ось, нарешті, ми змогли укласти до бази найпроблемніші в аспекті синтаксису каталоги і можемо поділитися з вами цим потужним інструментом. Він зекономить вам ті години, які раніше ви тратили на гортання 15 PDF-ок, по пів тисячі сторінок кожна.
Так піде?
Кнопка "Замовити до читального залу" додаватиме справу до Кошика. Там ви зможете також дописувати інші справи, які не входять до Зведеного каталогу метричних книг.
Каталог вже має такий вигляд. Тестуйте, будь ласка, і пишіть мені про помилки.
Ще повно баґів верстки і сміття в базі, але Каталог починає давати ту зручність, яку я забажав 4 роки тому і взявся реалізовувати. Дякую собі, що не покинув посеред дороги, не зважаючи на всі вибрики синтаксису різних архівів.
Ключовою сутністю у нашій базі ЗКМК є храм, а не поселення.
- різні архіви у каталогах називають той-самий храм по різному: Покровська, Святої Покрови, Покрови Божої матері.
- але ця проблема стосується й населених пунктів. За географічними покажчиками дуже важко звести різні написання поселення до єдиного.

Тому, замість геокодингу, ми будемо виводити оригінальне написання поселення, як вказано в каталозі, а ви зможете вибрати, які саме поселення стосуються вашого запиту.

Пишіть, як вам.
Ridni.org/sandbox-catalog
Ви ж чули про такий URL, як Mailto?
Дякуючи йому, вам достатньо буде під архівною справою натиснути кнопку "Замовити до чит. зали" і у вашому поштовому клієнті відкриється лист із заповненими: темою, адресатом і текстом. Єдине, що архіви досі вимагають надсилати замовлення у форматі PDF. Тому у вас під рукою буде посилання, де їх взяти і приатачити до листа.

Класна штука. Економить гору часу на рутині.
<a href="mailto:someone@example.com">Send email</a>
Друзі, а може спробуємо?

Якщо знайдуться сміливці, які протранскрибують хочаб декілька сторінок 1:1 - ми зможемо використати транскрипт, як навчальний матеріал для нейронної мережі. Загалом, нейронці буде достатньо десь 150-200 сторінок навчального матеріалу для подальшого автономного розпізнавання 23.000 сторінок перепису.
Але 1:1.
- Не продовжувати скорочені слова,
- не виправляти помилки.
Для зручності набору літер ять, фіта та інших - встановіть собі розкладку Іллі Бірмана.

Сам перепис знаходиться на сайті ЦДІАК, а готові транскрипти, хто скільки подужає, закидайте прямо мені в телеграм простим текстовим файлом.
Транскрибувати можна починаючи з будь-якого місця.
Вітаємо у нашому каталозі 3615 архівних справ із 242 католицьких костелів, що зберігаються у ЦДІАК.
Тестуйте і не соромтеся писати мені відгуки й пропозиції у приватні повідомлення. ;)

https://ridni.org/catalog/деражне?year=1844
Відкрита вакансія. Долучайтеся до команди, будете нам, як Рідні. 🙂
Щиро ваш, детектив Бут.

https://www.facebook.com/job_opening/359452668822963/?source=share
Скромненьке покращення на Карті Прізвищ. Ми додали блочок із посиланнями на зовнішні бази. Посилання відразу підставляють прізвище.

https://ridni.org/karta/зеленський
Доречі, при посиланні на російські бази ми перекидаємо у пошуковий рядок російський варіант прізвища. А в разі з Bad Arolsen – транслітом. На жаль, українсько-німецької транслітерації у нас немає.
Зустрічайте товаріщів !
6000 депутатів ВР УРСР з 1 по 12 скликання підключені до бази. 2983 унікальних прізвища. Пізніше охопимо цим тавром і керівництво інших гілок влади. В першу чергу – Політбюро ЦК КПУ.
Готово, 116 членів Політбюро ЦК КПУ за всі роки – в коробочці.

Яка зла іронія, бачити унікальні прізвища одночасно серед керівництва УРСР і серед репресованих. Деякі з них:
Косіор
Фрунзе
Каганович
Кон
Кіркіж
Картвелішвілі
Стус
і багато інших, менш унікальних.
Пару тижнів тому на ICTV вийшов невеличкий сюжет зі згадкою онлайн-ресурсів Рідні. І лише зараз стало зрозуміло, що саме приховувала крива google-аналітики.

Репортаж тут: https://youtu.be/Pg2hd2UvuS0
(Перепрошую за дубль.)
Чергове покращення на нашому Барометрі соціальних станів.
Тепер на картах 9.200 прізвищ відображатиметься аверс монетки, присвяченої Магдебурському праву Києва, як символу верстви міщан. За цією монеткою стоїть монументальний довідник Володимира Федорова "Киевские мещане. Кто? Когда? Где?", 2017 року на 13.000 статей. Хоча, унікальних прізвищ менше: 9.200.

Ласкаво прошу писати нам, які ще верстви чи довідники варто підключити до Барометра.
Welcome back to Карта Прізвищ ;)
Зустрічайте на нашому Каталозі карту адміністративного поділу імперій на початку ХХ століття.
Продуктивності у ваших дослідженнях!

https://ridni.org/catalog/Телешівка?year=1830