Привіт, друзі!
Я бачу, що серед підписників більше дослідників свого роду, ніж архівістів, тому, розповім із самого початку, для чого ми взагалі вкладаємо стільки зусиль і часу в якийсь каталог метричних книг, щоб зробити з нього такий же каталог метричних книг. Здавалося б, із пустого – в порожнє.
Ви вже працювали з генеалогічними джерелами, здебільшого відсканованими, тому знаєте, що таке метрична книга, знаєте, що зберігаються вони за географічним принципом у мережі архівних установ, здебільшого обласних архівах. Тобто розумієте, що для знаходження запису про народження (охрещення) потрібно знати місце народження, а ще краще конкретний храм, до приходу якого належала сім'я.
Також ви знаєте, що архівні справи певного села можуть зберігатися в архівах різних областей або й країн. Тому, щоб уявити перспективи дослідження роду певного села, потрібно зібрати докупи весь масив архівних справ цього села з усіх можливих архівів. Ми в РІДНІ цей об'єм роботи загорнули у окрему послугу, яку назвали Джерельна довідка,
Я бачу, що серед підписників більше дослідників свого роду, ніж архівістів, тому, розповім із самого початку, для чого ми взагалі вкладаємо стільки зусиль і часу в якийсь каталог метричних книг, щоб зробити з нього такий же каталог метричних книг. Здавалося б, із пустого – в порожнє.
Ви вже працювали з генеалогічними джерелами, здебільшого відсканованими, тому знаєте, що таке метрична книга, знаєте, що зберігаються вони за географічним принципом у мережі архівних установ, здебільшого обласних архівах. Тобто розумієте, що для знаходження запису про народження (охрещення) потрібно знати місце народження, а ще краще конкретний храм, до приходу якого належала сім'я.
Також ви знаєте, що архівні справи певного села можуть зберігатися в архівах різних областей або й країн. Тому, щоб уявити перспективи дослідження роду певного села, потрібно зібрати докупи весь масив архівних справ цього села з усіх можливих архівів. Ми в РІДНІ цей об'єм роботи загорнули у окрему послугу, яку назвали Джерельна довідка,
Для прискорення пошуку архівних справ по каталогах метричних книг різних архівів ми почали розпізнавати чи парсити PDF каталоги і укладати в табличний вигляд для зручності сортування і вибірки. Це дає нам основу таблиці, часто з помилками й неточностями, над якою потім потрібно ще декілька годин працювати: звіряти з PDF, додавати ті джерела, які знаходяться в інших описах, які ми ще не опрацювали і так далі. Саме тому, протягом останніх 4 років ми не давали цей інструмент вам, а продовжували його вдосконалювати, чистити, наповнювати. І ось, нарешті, ми змогли укласти до бази найпроблемніші в аспекті синтаксису каталоги і можемо поділитися з вами цим потужним інструментом. Він зекономить вам ті години, які раніше ви тратили на гортання 15 PDF-ок, по пів тисячі сторінок кожна.
Каталог вже має такий вигляд. Тестуйте, будь ласка, і пишіть мені про помилки.
Ще повно баґів верстки і сміття в базі, але Каталог починає давати ту зручність, яку я забажав 4 роки тому і взявся реалізовувати. Дякую собі, що не покинув посеред дороги, не зважаючи на всі вибрики синтаксису різних архівів.
Ще повно баґів верстки і сміття в базі, але Каталог починає давати ту зручність, яку я забажав 4 роки тому і взявся реалізовувати. Дякую собі, що не покинув посеред дороги, не зважаючи на всі вибрики синтаксису різних архівів.
Ключовою сутністю у нашій базі ЗКМК є храм, а не поселення.
- різні архіви у каталогах називають той-самий храм по різному: Покровська, Святої Покрови, Покрови Божої матері.
- але ця проблема стосується й населених пунктів. За географічними покажчиками дуже важко звести різні написання поселення до єдиного.
Тому, замість геокодингу, ми будемо виводити оригінальне написання поселення, як вказано в каталозі, а ви зможете вибрати, які саме поселення стосуються вашого запиту.
Пишіть, як вам.
Ridni.org/sandbox-catalog
- різні архіви у каталогах називають той-самий храм по різному: Покровська, Святої Покрови, Покрови Божої матері.
- але ця проблема стосується й населених пунктів. За географічними покажчиками дуже важко звести різні написання поселення до єдиного.
Тому, замість геокодингу, ми будемо виводити оригінальне написання поселення, як вказано в каталозі, а ви зможете вибрати, які саме поселення стосуються вашого запиту.
Пишіть, як вам.
Ridni.org/sandbox-catalog
Ви ж чули про такий URL, як Mailto?
Дякуючи йому, вам достатньо буде під архівною справою натиснути кнопку "Замовити до чит. зали" і у вашому поштовому клієнті відкриється лист із заповненими: темою, адресатом і текстом. Єдине, що архіви досі вимагають надсилати замовлення у форматі PDF. Тому у вас під рукою буде посилання, де їх взяти і приатачити до листа.
Класна штука. Економить гору часу на рутині.
Дякуючи йому, вам достатньо буде під архівною справою натиснути кнопку "Замовити до чит. зали" і у вашому поштовому клієнті відкриється лист із заповненими: темою, адресатом і текстом. Єдине, що архіви досі вимагають надсилати замовлення у форматі PDF. Тому у вас під рукою буде посилання, де їх взяти і приатачити до листа.
Класна штука. Економить гору часу на рутині.
Друзі, а може спробуємо?
Якщо знайдуться сміливці, які протранскрибують хочаб декілька сторінок 1:1 - ми зможемо використати транскрипт, як навчальний матеріал для нейронної мережі. Загалом, нейронці буде достатньо десь 150-200 сторінок навчального матеріалу для подальшого автономного розпізнавання 23.000 сторінок перепису.
Але 1:1.
- Не продовжувати скорочені слова,
- не виправляти помилки.
Для зручності набору літер ять, фіта та інших - встановіть собі розкладку Іллі Бірмана.
Сам перепис знаходиться на сайті ЦДІАК, а готові транскрипти, хто скільки подужає, закидайте прямо мені в телеграм простим текстовим файлом.
Транскрибувати можна починаючи з будь-якого місця.
Якщо знайдуться сміливці, які протранскрибують хочаб декілька сторінок 1:1 - ми зможемо використати транскрипт, як навчальний матеріал для нейронної мережі. Загалом, нейронці буде достатньо десь 150-200 сторінок навчального матеріалу для подальшого автономного розпізнавання 23.000 сторінок перепису.
Але 1:1.
- Не продовжувати скорочені слова,
- не виправляти помилки.
Для зручності набору літер ять, фіта та інших - встановіть собі розкладку Іллі Бірмана.
Сам перепис знаходиться на сайті ЦДІАК, а готові транскрипти, хто скільки подужає, закидайте прямо мені в телеграм простим текстовим файлом.
Транскрибувати можна починаючи з будь-якого місця.
Вітаємо у нашому каталозі 3615 архівних справ із 242 католицьких костелів, що зберігаються у ЦДІАК.
Тестуйте і не соромтеся писати мені відгуки й пропозиції у приватні повідомлення. ;)
https://ridni.org/catalog/деражне?year=1844
Тестуйте і не соромтеся писати мені відгуки й пропозиції у приватні повідомлення. ;)
https://ridni.org/catalog/деражне?year=1844
Відкрита вакансія. Долучайтеся до команди, будете нам, як Рідні. 🙂
Щиро ваш, детектив Бут.
https://www.facebook.com/job_opening/359452668822963/?source=share
Щиро ваш, детектив Бут.
https://www.facebook.com/job_opening/359452668822963/?source=share
Скромненьке покращення на Карті Прізвищ. Ми додали блочок із посиланнями на зовнішні бази. Посилання відразу підставляють прізвище.
https://ridni.org/karta/зеленський
https://ridni.org/karta/зеленський
Доречі, при посиланні на російські бази ми перекидаємо у пошуковий рядок російський варіант прізвища. А в разі з Bad Arolsen – транслітом. На жаль, українсько-німецької транслітерації у нас немає.
Пару тижнів тому на ICTV вийшов невеличкий сюжет зі згадкою онлайн-ресурсів Рідні. І лише зараз стало зрозуміло, що саме приховувала крива google-аналітики.
Репортаж тут: https://youtu.be/Pg2hd2UvuS0
(Перепрошую за дубль.)
Репортаж тут: https://youtu.be/Pg2hd2UvuS0
(Перепрошую за дубль.)
Чергове покращення на нашому Барометрі соціальних станів.
Тепер на картах 9.200 прізвищ відображатиметься аверс монетки, присвяченої Магдебурському праву Києва, як символу верстви міщан. За цією монеткою стоїть монументальний довідник Володимира Федорова "Киевские мещане. Кто? Когда? Где?", 2017 року на 13.000 статей. Хоча, унікальних прізвищ менше: 9.200.
Ласкаво прошу писати нам, які ще верстви чи довідники варто підключити до Барометра.
Welcome back to Карта Прізвищ ;)
Тепер на картах 9.200 прізвищ відображатиметься аверс монетки, присвяченої Магдебурському праву Києва, як символу верстви міщан. За цією монеткою стоїть монументальний довідник Володимира Федорова "Киевские мещане. Кто? Когда? Где?", 2017 року на 13.000 статей. Хоча, унікальних прізвищ менше: 9.200.
Ласкаво прошу писати нам, які ще верстви чи довідники варто підключити до Барометра.
Welcome back to Карта Прізвищ ;)
Зустрічайте на нашому Каталозі карту адміністративного поділу імперій на початку ХХ століття.
Продуктивності у ваших дослідженнях!
https://ridni.org/catalog/Телешівка?year=1830
Продуктивності у ваших дослідженнях!
https://ridni.org/catalog/Телешівка?year=1830