НКРЯ Национальный корпус русского языка

13 ноября состоится пятая ежегодная конференция Яндекса о людях и технологиях в образовании

На сцене выступят исследователи, преподаватели и разработчики, которые обсудят будущее образовательной сферы.

Одной из тем обсуждения в Студии станет использование Национального корпуса русского языка в обучении. Мария Аристова — учитель русского языка, руководитель лингвистического профиля школы «Летово» и директор Летней лингвистической школы — расскажет, как НКРЯ может обогатить школьные занятия и помочь в освоении русского языка.

Регистрируйтесь по ссылке, чтобы не пропустить событие!

👍15🔥7❤4🤩2👎1

2.05K views10:08

НКРЯ Национальный корпус русского языка

Национальный корпус русского языка – не только незаменимый инструмент для научных исследований, но и полезный ресурс в школьном обучении.

Для учителей русского языка и литературы, школьников и их родителей Яндекс Образование совместно с Национальным корпусом русского языка разработали конструктор исследовательских и творческих проектов и упражнений.

Конструктор содержит как полностью разобранные примеры исследований, творческих проектов и упражнений, так и идеи для создания собственных:
— какие темы предложить ученикам,
— как внедрить исследовательскую работу в уроки,
— как собирать данные с помощью Корпуса.

Конструктор предполагает модульность: вы можете выбирать разные темы, формулировать исследовательские вопросы по-новому или менять формат представления результатов. В общей сложности конструктор включает более 45 идей и готовых проектов и заданий для уроков русского языка и литературы.

Глава об исследовательских проектах уже доступна. Главы, посвященные организации творческих проектов и составлению упражнений, будут открыты позже — мы обязательно сообщим об этом.

🔥19❤4👍4

1.67K views13:13

НКРЯ Национальный корпус русского языка

Справочно-информационному порталу «Грамота.ру» исполнилось 24 года!

Этот портал стал уникальным источником сведений о русском языке для самых разных пользователей. Его главная миссия — предоставлять актуальную и авторитетную информацию о современном русском языке, включая нормы и правила, стили и сферы использования.

Мы поздравляем коллег с этой важной датой и желаем дальнейшего развития и процветания!

На сайте «Грамота.ру» в разделе «Журнал» вы найдете новости, научно-популярные статьи, интервью с ведущими российскими лингвистами, обзоры книг, лекций и журналов, а также увлекательные тесты. Например, вы можете проверить свою грамотность и узнать, готовы ли вы к работе корректором. Задания для этого теста составлены на основе корпуса «Русская классика» НКРЯ.

Другие интересные тесты ждут вас в разделе «Публикации» на нашем сайте.

🎉32❤12🔥5🏆2🤝2

1.23K views10:33

НКРЯ Национальный корпус русского языка

Занимательное явление в поэзии — совпадение строк у разных авторов. Иногда оно происходит случайно, иногда вызвано общими мотивами, образами или культурным контекстом, а порой является намеренным заимствованием. Одним из самых известных примеров такой переклички является сочетание «самых честных правил», которое открывает известный роман А.С. Пушкина.

По воспоминаниям А. П. Керн, Пушкин услышал эту фразу на одном из её приёмов, где присутствовал И. А. Крылов. Во время игры в фанты Крылову выпало задание сидеть под столом до тех пор, пока он не сочинит басню. Именно тогда, якобы, впервые прозвучала строка «‎Осел был самых честных правил!»‎. Она так понравилась Пушкину, что он решил включить её в своё произведение, намекая таким образом на характер дяди Онегина.

Хотите проверить свою эрудицию? Попробуйте угадать (или ответить наверняка, используя поиск точных форм в Поэтическом корпусе НКРЯ), у каких авторов встречаются одинаковые строки, и откройте для себя ещё больше поэтических пересечений.

🔥14👍2

1.08K views10:32

НКРЯ Национальный корпус русского языка

У какого еще автора, кроме А.С. Пушкина, есть строка: «‎Не сотвори себе кумира»‎?

Anonymous Quiz

244 voters1.18K views10:32

НКРЯ Национальный корпус русского языка

У какого еще автора, кроме А.С. Пушкина, есть строка: «‎Придет желанная пора»‎?

Anonymous Quiz

235 voters1.39K views10:32

НКРЯ Национальный корпус русского языка

У какого еще автора, кроме Ф. И. Тютчева, есть строка: «Глас вопиющего в пустыне»‎?

Anonymous Quiz

246 voters1.42K views10:32

НКРЯ Национальный корпус русского языка

Русский МультиПАРК пополнен почти до 300 тыс. словоформ. Добавлена пьеса А.П. Чехова «‎Три сестры»‎ в постановках четырех разных театров: Государственного академического Малого театра, МХАТа им. М. Горького, Московского театра «Мастерская П. Фоменко», театра «Современник».

Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. Сопоставление разных произнесений одной и той же фразы позволяет определить, какие интонационные, структурные, фонетические, жестовые особенности этой фразы являются обязательными, воспроизводимыми всеми говорящими, а какие — уникальными или случайными.

C материалами о составе корпуса и возможностях, которые он предоставляет, вы можете ознакомиться на сайте.

❤18🔥6👍1

1.43K viewsedited 11:44

НКРЯ Национальный корпус русского языка

С главной страницы Корпуса пользователи могут перейти в раздел «‎НКРЯ в школе»‎. В нём можно найти полезные материалы и инструменты, которые помогут разнообразить, а в чем-то и облегчить преподавание гуманитарных предметов:

🔹Обучающий корпус НКРЯ,
🔹готовые упражнения по различным темам для учащихся 5-11 классов,
🔹методические материалы,
🔹конструктор исследовательских и творческих проектов и упражнений.

Подробнее об этих материалах – в карточках. Сохраняйте их и используйте НКРЯ в школе!

❤26🔥13👍4🤝2🏆1

4.25K views09:38

НКРЯ Национальный корпус русского языка

Основной корпус НКРЯ пополнен на 15 млн слов, представляющих несколько тематических коллекций: это пьесы разных эпох, официально-деловые тексты, научные журналы, естественнонаучные справочники XVIII в., массовая литература — например, как дореволюционные, так и постсоветские любовные романы, — и многое другое.

Во всех текстах корпуса автоматически снята грамматическая омонимия и добавлена разметка синтаксических отношений. Для разметки была использована обновленная версия нейросетевой модели РуБик, что позволило существенно улучшить лемматизацию слов. На тестовом наборе данных процент ошибочных лемм в корпусе снизился с 4,24% до 1,39%. Пожалуйста, сообщайте нам о встречающихся ошибках в автоматической разметке слов. Чтобы сделать это, выделите слово и во всплывающем окне нажмите «Сообщить об ошибке».

Рядом с некоторыми примерами в Корпусе появились поля синего цвета с указанием имени субъекта прямой речи (персонажа пьес или говорящего в устном тексте). Если кликнуть по этому полю, доступна разметка пола, возраста, года рождения, профессии и/или амплуа персонажа или, соответственно, говорящего.

Приведены в соответствие морфемная разметка при поиске по словообразовательным признакам и в Портрете слова. Для слов, отсутствующих в Словаре морфемного анализа НКРЯ, морфемные разборы сгенерированы при помощи нейросетевой модели. Расширен словарь и улучшена его согласованность. Слова, разборы для которых сгенерированы нейросетью, теперь тоже участвуют в поиске по словообразовательной структуре, а морфемный разбор слова доступен и в карточке слова.

🔥32❤10👍10

1.27K viewsedited 10:58

НКРЯ Национальный корпус русского языка

В Поэтический корпус добавлены тексты четырех поэтов — Вадима Шефнера, Роберта Рождественского, Льва Лосева и Марии Степановой. Объем пополнения — 200 тысяч слов, 2 тысячи текстов, 44 тысячи стихотворных строк. А всего в корпусе строк почти 3 миллиона.

В корпусе появилась возможность искать слово в начале и конце строки. Так, можно определить, что характерные поэтизмы ужель или вотще чаще встречаются в начале строчки, чем в какой-то другой позиции стиха.

❤28👍3

1.09K views11:54

НКРЯ Национальный корпус русского языка

В Параллельном корпусе НКРЯ появились новые функции, которые сделают работу с ним более удобной.

В японском языке в форме поиска на двух языках появилось поисковое поле «‎Семантика»‎. Японский стал первым иностранным языком в НКРЯ, в котором размечена семантика.

В карельском, вепсском, чувашском, хакасском корпусах расширены возможности настройки подкорпуса. Пользователи смогут отбирать тексты по жанру и типу (для всех перечисленных языков), а также по теме текста (в чувашском корпусе). Для всех параллельных корпусов доступна возможность отбирать подкорпус по количеству словоформ, что полезно при анализе текстов разного объёма.

Результаты поиска теперь можно сортировать с помощью шести новых типов сортировки: по дате создания текста на русском или иностранном языке от старых текстов к новым и наоборот, при условии, что оригиналы и переводы рассматриваются вместе или отдельно. Новые сортировки помогут быстрее находить нужную информацию и лучше структурировать данные.

👍16❤6

1.17K views12:57

НКРЯ Национальный корпус русского языка

1:24

Media is too big

VIEW IN TELEGRAM

Рады сообщить о важном обновлении формы поиска на сайте Национального корпуса русского языка! Теперь пользователи могут добавлять слова перед Словом 1, что значительно упрощает составление и редактирование сложных запросов.

Ранее добавлять слова можно было только справа от Слова 1 и последующих слов. Например, если вы искали конструкцию вида «прилагательное + местоимение + дорога», задав синтаксические отношения между этими словами, но затем решили искать вариант «союз + прилагательное + местоимение + дорога», вам пришлось бы пересобирать запрос с нуля. Теперь всё проще: достаточно нажать кнопку «+» слева от Слова 1 и указать любой признак, например «союз».

Обратите внимание: принцип расчета расстояния между словами остался неизменным. Расстояние всегда задаётся слева направо: от нового Слова 1 до исходного Слова 1, а затем — к последующим словам.

🔥26👍8🎉3⚡2❤1🙏1

1.92K views13:51

НКРЯ Национальный корпус русского языка

Чтобы лучше понять, как вы используете Национальный корпус русского языка для решения своих задач, и сделать Корпус еще удобнее и понятнее, мы запускаем исследование аудитории.

Первый этап исследования — это интервью с пользователями. Если вы применяете Корпус в работе, учебе или другой деятельности, мы будем рады услышать ваше мнение. Чтобы принять участие в интервью, заполните небольшую форму: https://forms.yandex.ru/u/675159c7f47e738d9a20e5fc/

После отправки формы наш менеджер свяжется с вами для согласования удобной даты и времени для интервью. Видеозвонок пройдет в Zoom и займет 30–40 минут.

Ваше мнение поможет нам улучшить сервис и лучше учитывать потребности наших пользователей!

🔥14👍6

1.94K viewsedited 08:39

НКРЯ Национальный корпус русского языка

Уже завтра состоится открытие Конференции, посвященной 20-летию Национального корпуса русского языка!

В течение двух дней участники мероприятия обсудят широкий круг вопросов – от корпусных методов лингвистических исследований и достоверности корпусных данных до вопросов создания корпусов и разработки пользовательского интерфейса, от применения нейросетевых моделей в подготовке корпусных данных до использования НКРЯ в преподавании гуманитарных дисциплин в университете и в школе.

Мероприятия пройдут очно в Инстиуте русского языка РАН по адресу: ул. Волхонка, 18/2.

Программу конференции можно найти на сайте института.

Предусмотрена онлайн-трансляция пленарных докладов по ссылке.

🔥28👍10❤5🙏2

2.92K views17:31

НКРЯ Национальный корпус русского языка

В Диалектный корпус добавлены новые тексты объемом примерно 100 тыс. словоупотреблений. Новые тексты представляют говоры севера (Архангельская область, Карелия, Коми), Поволжья (большая хрестоматия диалектов Нижегородской области) и юга (Смоленская, Калужская области, молокане Кавказа). В пополнение входят как записи дореволюционного времени и 30-х годов, так и материалы недавних экспедиций. Добавлено несколько сот аудио- и десять кинозаписей, на которых можно не только услышать диалект, но и увидеть, как на севере смолят лодку, а в Азербайджане разводят пчел.

🔥17❤11👎1

1.4K views09:09

НКРЯ Национальный корпус русского языка

В Региональном корпусе обновлена разметка ключевых слов в текстах. Использование ключевых слов облегчает анализ узких тематических категорий и помогает ориентироваться в текстах разных тематик.

Для разметки использовалась модель T-lite-instruct-0.1, обученная на материалах корпуса. Новые ключевые слова содержат меньше ошибок нормализации и грамматических ошибок, а также более точно описывают тематику текста. Как и раньше, одно ключевое слово может состоять из однословного ключа (похолодание, гололед) либо из двусловного сочетания (таяние снега). По однословному запросу (община) находится как точное соответствие, так и двусловные сочетания с этим словом (сельская община). Для каждого текста сгенерировано от 5 до 10 ключевых слов, которые упорядочены по значимости.

👍29

1.44K views10:04

About

Blog

Apps

Platform