Институт русской литературы (Пушкинский Дом) РАН
667 subscribers
278 photos
4 videos
1 file
286 links
Новости и мероприятия Литературного музея Пушкинского Дома, научно-исследовательских отделов, центров, групп и лабораторий института, а также Рукописного отдела и Фонограммархива (хранилища звуковых фольклорных записей народов мира).
www.pushkinskijdom.ru
Download Telegram
​​Опубликована новая версия (2.0) датасета «Корпус русской прозы для детей и юношества».

В новой версии пополнен подкорпус художественной литературы, преимущественно текстами 1920-х гг. Сборники повестей и рассказов были разобраны на отдельные произведения. Общий объем корпуса к настоящему моменту — 2703 произведения.
Полнотекстовый поиск по новой версии корпуса доступен на сайте detcorpus.ru

#ирлиран #пушкинскийдом #лаборатория #цифровых #исследований #детская #литература #датасет
​​В Репозитории открытых данных по русской литературе и фольклору опубликован новый датасет — сеть персоналий, построенная на основании междустатейных ссылок в «Словаре русских писателей XVIII века» (1988—2010. Вып. 1—3).

Узлами сети выступают посвященные персоналиям статьи словаря, а ребрами — ссылки на другие статьи в том же словаре. Такая сеть позволяет проследить ключевые тенденции в социальном и интеллектуальном взаимодействии литераторов XVIII века. Данные без предварительной обработки можно загружать в программы для сетевого анализа при решении учебных задач.

Более внимательно рассмотреть сетевые связи литераторов из этого датасета можно с помощью интерактивного веб-приложения, построенного на данных этого датасета.
Приложение позволяет работать с отдельными узлами сети, изучать их соседей и количественные характеристики.

#ирлиран #пушкинскийдом #лабораторияцифровыхисследований #датасет #русскаялитература
​​Опубликована новая версия (2.0) датасета «Лучшие образцы русской литературы (1849–1900): антологии избранной поэзии и прозы, литературные сборники и альманахи, сборники для легкого чтения, антологии для народа, антологии для женщин».

В новой версии базы данных значительно расширен временной диапазон вошедших в нее антологий и сборников второй половины XIX в., что делает ее репрезентативным датасетом русских литературных антологий, альманахов и сборников избранной русскоязычной поэзии и прозы. Прежняя версия датасета была ограничена 1869 годом, новая же версия включает в себя литературные сборники, альманахи и антологии 1870-1900 гг., а также датасет дополнен несколькими прежде не вошедшими в его состав изданиями 1849-1869 гг.

#ирлиран #пушкинскийдом #датасет #лабораторияцифровыхисследований #русскаялитература
​​В Репозитории открытых данных по русской литературе и фольклору опубликован новый датасет в разделе Воспроизводимые данные, позволяющий воспроизвести результаты исследования Евгении Лекаревич «Домашние дела литературных персонажей», опубликованного в журнале «Детские чтения» 20(2):155-74.

Ссылка: https://dataverse.pushdom.ru/dataset.xhtml?persistentId=doi:10.31860/openlit-2022.4-R003

В работе проанализирована частотность изображения персонажей-женщин и мужчин, занятых бытовым трудом, в русской детской литературе XX-XXI вв. — на материале Корпуса русской литературы для детей и юношества (Деткорпус). Количественные выводы сделаны на основании анализа контекстов употребления глаголов, обозначающих бытовой труд.

В советской и постсоветской детской литературе так же, как и в литературе для взрослых, у авторов-мужчин значительно преобладают персонажи мужского пола, в то время как для авторов-женщин характерно несколько более эгалитарное распределение персонажей. Женские персонажи чаще изображаются за определенными видами бытовой работы авторами обоего пола. В статье с помощью тематического моделирования (LDA) выявлен круг романтических и приключенческих топосов, в рамках которых изображаются мужчины и мальчики, занятые обустройством быта.

#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​В разделе Корпуса текстов Репозитория открытых данных по русской литературе и фольклору опубликован новый датасет «Персонажи «Войны и мира» Л. Н. Толстого: вхождения в тексте, прямая речь и семантические роли».
Данные представляют собой полный текст романа, размеченный в соответствии со стандартом TEI.
Подробнее.

#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​Дорогие друзья!
В Репозитории открытых данных опубликован новый датасет «Программы по литературе для средней школы с 1919 по 1991 гг.».

Датасет представляет собой роспись произведений фольклора, русской и зарубежной литературы, вошедших в 50 школьных программ советского периода. Помимо основных метаданных (автора, источника, даты) в таблицу включены сведения о рекомендациях составителей по изучению произведений (чтение отдельных глав или отрывков, возможность выбора преподавателем и учащимися) и степени их приоритетности в программе. Хотя данные имеют ряд ограничений, они позволяют делать наблюдения относительно подходов к изучению литературы в советской школе, формировании литературного канона, роли и месте отдельных произведений. Публикация может рассматриваться как продолжение цикла данных по составу школьного литературного канона, открытого публикацией датасета «Хрестоматии Российской Империи с 1805 по 1912 гг.».

#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​Дорогие друзья!
В Репозитории открытых данных опубликован новый датасетБиблиография детской книги 1918–1984.

Датасет представляет собой библиографическую базу данных по русской детской книге XX века, приведенную в машиночитаемый табличный формат для удобства поиска и статистического анализа. База основана на 18-томном библиографическом указателе «Детская литература», составленном И. И. Старцевым и его продолжателями. В библиографию включались все книжные издания за 1918–1984 гг. на русском языке, выходившие в СССР и адресованные детям и юношеству. Для удобства обработки и анализа данных библиографические записи из указателей были разделены на отдельные поля (автор, заглавие, место издания, издательство, год, тираж и т.д.) с помощью автоматического анализатора.

#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​Дорогие друзья!
В Репозитории открытых данных опубликован новый датасет«Критика детской литературы русского зарубежья в периодических изданиях 1920–1940-х гг.».

Данные представляют собой библиографические сведения о 246 рецензиях и критических статьях о литературе для детей и детском чтении. Материалы отобраны из периодических изданий, выходивших в Европе с 1920 по 1940 гг. на русском языке. Критические статьи выявлены как в известных, многотиражных изданиях, распространяющихся по подписке по всем странам, так и в локальных изданиях, отпечатанных на ротаторе. Данные позволяют составить картину территориального распределения центров изучения детской литературы, выявить ядро изданий, вовлеченных в обсуждение проблематики, и ключевых авторов.

В комплексе с датасетом Детская книга русского зарубежья в Европе 1919-1954 гг. эта публикация позволяет создать более объемное представление о литературном процессе русского зарубежья.

#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​Дорогие друзья!
Раздел репозитория Библиографические данные пополнился датасетом Ольги Лучкиной «Авторы и произведения для детского чтения в критике 1860—1880-х гг.».

Данные представляют собой роспись изданий (фамилии литераторов и названия произведений), упомянутых в критических и педагогических статьях, обзорах, рецензиях и списках, опубликованных на страницах «Журнала Министерства народного просвещения», «Педагогического сборника», «Женского образования» в 1860—1880-х гг. Эти журналы, издаваемые или контролируемые правительственными ведомствами, стали новыми площадками для публичного обсуждения детской литературы, а рекомендательная практика — одним из ранних этапов формирования литературного канона.

Результаты анализа данных представлены в диссертации автора «Формирование канона литературы для детей в критике 1860—1880 гг.».

#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​В разделе Библиографические данные Репозитория опубликован новый датасетБытование литературных текстов в ГУЛАГе.

Группа исследователей НИУ «Высшая школа экономики» обработала крупный общедоступный корпус мемуаров и извлекла из него упоминания литературных произведений, бытовавших в советской пенитенциарной системе в 1917--1991 гг. Каждое упоминание снабжено метаданными: когда, кем, где и при каких обстоятельствах осуществлялась рецитация текста. Широкие хронологические рамки, большой объем вхождений (более 2500 единиц) и подробные метаданные делают этот датасет чрезвычайно интересным и удобным для всего спектра гуманитарных исследований. Наряду с датасетом «Программы по литературе для средней школы с 1919 по 1991 гг.» эти данные могут служить материалом для изучения процесса трансформации литературного канона в советскую эпоху.

Данные сопровождаются описанием на русском и английском языках.


#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​Дорогие друзья!
Раздел Репозитория Библиографические данные пополнился датасетом Андрея Кокорина «Литературные произведения в государственных стандартах и программах для средней школы 1998--2022 гг.»

Датасет
представляет собой роспись литературных произведений, вошедших в постсоветские государственные стандарты и программы средней школы по родной литературе, а также в кодификаторы основного и единого государственных экзаменов по литературе — то есть все официальные документы, регламентирующие школьное преподавание русской литературы.

Произведения в таблице снабжены расширенными метаданными: помимо базовых (автор, время создания, жанр) приводятся сведения об обязательности изучения автора и произведения, наличие рекомендации к углубленному изучению, сведения о возможности выбора текстов учащимися.

Вместе с уже опубликованными в Репозитории датасетами Хрестоматии Российской Империи с 1805 по 1912 гг. и Программы по литературе для средней школы с 1919 по 1991 гг. эта публикация формирует цикл, позволяющий изучать становление и трансформацию школьного литературного канона на хронологическом отрезке более чем в 200 лет.


#ирлиран #пушкинскийдом #датасет #цифровыеисследования
​​Дорогие друзья!
В Лаборатории цифровых исследований литературы и фольклора вышел новый датасет: Индекс произведений и писем А. С. Пушкина

Датасет «Индекс произведений и писем А. С. Пушкина», опубликованный в библиографическом разделе Репозитория, представляет собой сводный перечень, систематизирующий имеющиеся в распоряжении современной пушкинистики сведения о письменном наследии поэта.

Своей главной целью авторы датасета видели составление списка произведений, объединяющего все письменное наследие Пушкина, и присвоение каждому произведению уникального идентификатора (UID), позволяющего однозначно его определить. Датасет включает в себя три таблицы: oeuvre, letters и texts, — представляющие сведения о художественных и нехудожественных произведениях Пушкина, его письмах и текстах, которые написаны его рукой (выписки и записи разного содержания, официальные документы).

В основе датасета лежат переведенные в табличную форму данные «Пушкинской энциклопедии», работа над которой ведется в Институте русской литературы (Пушкинский Дом) Российской Академии наук с 2009 года. Сведения о письмах и текстах, написанных «рукою Пушкина», актуализированы в сотрудничестве с Отделом пушкиноведения и Рукописным отделом ИРЛИ РАН.

#ирлиран #пушкинскийдом #датасет #лаборатория #цифровыеисследования #пушкин
​​Дорогие друзья!
Раздел Репозитория Биографические данные пополнился датасетом Рината Бакирова и Бориса Орехова «Русско-европейские литературные связи XVIII векаx».

Датасет представляет собой сведения о литературных контактах русских и европейских писателей по данным двух справочных изданий —- «Словаря русских писателей XVIII века» и энциклопедического словаря «Русско-европейские литературные связи —- XVIII век». Упоминания писателей выделены из словарных статей и приведены в табличную машиночитаемую форму. Эти данные также агрегированы в файл, готовый к загрузке в программу сетевого анализа.

Датасет будет полезен при составлении наиболее полной картины связей писателей в русской литературе XVIII века, которая позволит наблюдать литературные и экстралитературные процессы в динамике, в том числе, с учетом литературных направлений, стилей, групп. Кроме того, датасет связан с датасетом Словарь русских писателей XVIII века: сеть персоналий за счет унифицированного обозначения перосналий, что позволяет использовать их совместно.


#ирлиран #пушкинскийдом #датасет #лаборатория #цифровыеисследования #пушкин
​​Дорогие друзья!
Корпусный раздел Репозитория Лаборатории цифровых исследований пополнился датасетом Екатерины Вожик «Корпус публикаций журнала «Современник» (1847–1866)».

Этот корпус открывает более широкие возможности для систематических цифровых и количественных исследований по материалам одного самых известных литературных журналов России. Датасет включает автоматически распознанные тексты 4686 публикаций основного содержания «Современника» и расширенные метаданные к ним. Структура таблицы метаданных задана сведениями основного авторитетного источника – указателя В. Э. Бограда (Боград В. Э. Журнал «Современник». 1847–1866: Указатель содержания. М.; Л.: ГИХЛ, 1959), которые были уточнены, реструктурированы и дополнены составительницей датасета. В частности, восстановлены опущенные Боградом указания на авторов в заглавиях статей. Данные сверены de visu по оригинальным выпускам журнала, включая пятый выпуск за 1866 г., часть тиража которого была изъята цензурой. Набор метаданных включает не только базовую информацию о публикации и ее авторе, но и сведения о датах фактического выхода журнала в свет и датах ценузрных рзрешений, принадлжености к определенному разделу журнала, адресатах посвящений и др. В отдельной таблице приведены метаданные к журнальным приложениям «Современника».

#ирлиран #пушкинскийдом #датасет #лаборатория #цифровыеисследования
Дорогие друзья!
Корпусный раздел Репозитория Лаборатории цифровых исследований пополнился датасетом «Забытые романы русских писателей из фондов Пушкинского Дома (1857-1917)».

Датасет состоит из 100 текстов романов малоизвестных русских писателей, хранящихся в фондах Института русской литературы РАН (Пушкинского Дома). Оцифрованные копии текстов автоматически распознаны и снабжены метаданными, в числе которых сведения о раскрытых псевдонимах, библиографическая информация об оцифрованном издании, а также дата первой публикации произведения.

Эта публикация вводит в научный оборот произведения из малодоступных изданий, которые почти наверняка никогда ранее не были оцифрованы. Такой материал позволит исследователям сформировать более объемное представление как о жанровых особенностях романа, так и в целом о литературе второго ряда, изданной во второй половине XIX — начале XX вв.

Вместе с «Корпусом нарративной прозы XIX в.», коллекция «забытых романов» представляет значительный срез крупных прозаических произведений XIX в. на русском языке.

#ирлиран #пушкинскийдом #датасет #лаборатория #цифровыеисследования
​​Дорогие друзья!
Корпусный раздел Репозитория Лаборатории цифровых исследований опубликовал новую версию (V2) датасета Анны Димяненко «Критика детской литературы русского зарубежья в периодических изданиях 1920–1940-х гг.»

Новая версия датасета помимо библиографических данных включает полные тексты 250-ти статей, рецензий и обзоров, посвященных книгам, изданным для детей на русском языке, детскому чтению, библиотекам и издательствам, выпускавшим литературу для детей за рубежом. Материалы отобраны из периодических изданий, выходивших в Европе с 1920 по 1940 гг. на русском языке. В библиографические данные внесен ряд уточнений и корректировок.

Данные пополнили корпус Деткорпус. Критика, интерфейс которого позволяет осуществлять комплексный поиск по текстам. Для удобства пользователей тексты эмигрантской печати объединены в отдельный подкорпус.

#ирлиран #пушкинскийдом #датасет #лаборатория #цифровыеисследования