13 ноября состоится пятая ежегодная конференция Яндекса о людях и технологиях в образовании
На сцене выступят исследователи, преподаватели и разработчики, которые обсудят будущее образовательной сферы.
Одной из тем обсуждения в Студии станет использование Национального корпуса русского языка в обучении. Мария Аристова — учитель русского языка, руководитель лингвистического профиля школы «Летово» и директор Летней лингвистической школы — расскажет, как НКРЯ может обогатить школьные занятия и помочь в освоении русского языка.
Регистрируйтесь по ссылке, чтобы не пропустить событие!
На сцене выступят исследователи, преподаватели и разработчики, которые обсудят будущее образовательной сферы.
Одной из тем обсуждения в Студии станет использование Национального корпуса русского языка в обучении. Мария Аристова — учитель русского языка, руководитель лингвистического профиля школы «Летово» и директор Летней лингвистической школы — расскажет, как НКРЯ может обогатить школьные занятия и помочь в освоении русского языка.
Регистрируйтесь по ссылке, чтобы не пропустить событие!
👍15🔥7❤4🤩2👎1
Национальный корпус русского языка – не только незаменимый инструмент для научных исследований, но и полезный ресурс в школьном обучении.
Для учителей русского языка и литературы, школьников и их родителей Яндекс Образование совместно с Национальным корпусом русского языка разработали конструктор исследовательских и творческих проектов и упражнений.
Конструктор содержит как полностью разобранные примеры исследований, творческих проектов и упражнений, так и идеи для создания собственных:
— какие темы предложить ученикам,
— как внедрить исследовательскую работу в уроки,
— как собирать данные с помощью Корпуса.
Конструктор предполагает модульность: вы можете выбирать разные темы, формулировать исследовательские вопросы по-новому или менять формат представления результатов. В общей сложности конструктор включает более 45 идей и готовых проектов и заданий для уроков русского языка и литературы.
Глава об исследовательских проектах уже доступна. Главы, посвященные организации творческих проектов и составлению упражнений, будут открыты позже — мы обязательно сообщим об этом.
Для учителей русского языка и литературы, школьников и их родителей Яндекс Образование совместно с Национальным корпусом русского языка разработали конструктор исследовательских и творческих проектов и упражнений.
Конструктор содержит как полностью разобранные примеры исследований, творческих проектов и упражнений, так и идеи для создания собственных:
— какие темы предложить ученикам,
— как внедрить исследовательскую работу в уроки,
— как собирать данные с помощью Корпуса.
Конструктор предполагает модульность: вы можете выбирать разные темы, формулировать исследовательские вопросы по-новому или менять формат представления результатов. В общей сложности конструктор включает более 45 идей и готовых проектов и заданий для уроков русского языка и литературы.
Глава об исследовательских проектах уже доступна. Главы, посвященные организации творческих проектов и составлению упражнений, будут открыты позже — мы обязательно сообщим об этом.
🔥19❤4👍4
Справочно-информационному порталу «Грамота.ру» исполнилось 24 года!
Этот портал стал уникальным источником сведений о русском языке для самых разных пользователей. Его главная миссия — предоставлять актуальную и авторитетную информацию о современном русском языке, включая нормы и правила, стили и сферы использования.
Мы поздравляем коллег с этой важной датой и желаем дальнейшего развития и процветания!
На сайте «Грамота.ру» в разделе «Журнал» вы найдете новости, научно-популярные статьи, интервью с ведущими российскими лингвистами, обзоры книг, лекций и журналов, а также увлекательные тесты. Например, вы можете проверить свою грамотность и узнать, готовы ли вы к работе корректором. Задания для этого теста составлены на основе корпуса «Русская классика» НКРЯ.
Другие интересные тесты ждут вас в разделе «Публикации» на нашем сайте.
Этот портал стал уникальным источником сведений о русском языке для самых разных пользователей. Его главная миссия — предоставлять актуальную и авторитетную информацию о современном русском языке, включая нормы и правила, стили и сферы использования.
Мы поздравляем коллег с этой важной датой и желаем дальнейшего развития и процветания!
На сайте «Грамота.ру» в разделе «Журнал» вы найдете новости, научно-популярные статьи, интервью с ведущими российскими лингвистами, обзоры книг, лекций и журналов, а также увлекательные тесты. Например, вы можете проверить свою грамотность и узнать, готовы ли вы к работе корректором. Задания для этого теста составлены на основе корпуса «Русская классика» НКРЯ.
Другие интересные тесты ждут вас в разделе «Публикации» на нашем сайте.
🎉32❤12🔥5🏆2🤝2
Занимательное явление в поэзии — совпадение строк у разных авторов. Иногда оно происходит случайно, иногда вызвано общими мотивами, образами или культурным контекстом, а порой является намеренным заимствованием. Одним из самых известных примеров такой переклички является сочетание «самых честных правил», которое открывает известный роман А.С. Пушкина.
По воспоминаниям А. П. Керн, Пушкин услышал эту фразу на одном из её приёмов, где присутствовал И. А. Крылов. Во время игры в фанты Крылову выпало задание сидеть под столом до тех пор, пока он не сочинит басню. Именно тогда, якобы, впервые прозвучала строка «Осел был самых честных правил!». Она так понравилась Пушкину, что он решил включить её в своё произведение, намекая таким образом на характер дяди Онегина.
Хотите проверить свою эрудицию? Попробуйте угадать (или ответить наверняка, используя поиск точных форм в Поэтическом корпусе НКРЯ), у каких авторов встречаются одинаковые строки, и откройте для себя ещё больше поэтических пересечений.
По воспоминаниям А. П. Керн, Пушкин услышал эту фразу на одном из её приёмов, где присутствовал И. А. Крылов. Во время игры в фанты Крылову выпало задание сидеть под столом до тех пор, пока он не сочинит басню. Именно тогда, якобы, впервые прозвучала строка «Осел был самых честных правил!». Она так понравилась Пушкину, что он решил включить её в своё произведение, намекая таким образом на характер дяди Онегина.
Хотите проверить свою эрудицию? Попробуйте угадать (или ответить наверняка, используя поиск точных форм в Поэтическом корпусе НКРЯ), у каких авторов встречаются одинаковые строки, и откройте для себя ещё больше поэтических пересечений.
🔥14👍2
У какого еще автора, кроме А.С. Пушкина, есть строка: «Не сотвори себе кумира»?
Anonymous Quiz
20%
М. Горький
33%
М. Ю. Лермонтов
47%
П. А. Вяземский
У какого еще автора, кроме А.С. Пушкина, есть строка: «Придет желанная пора»?
Anonymous Quiz
15%
Н. М. Языков
35%
А. Н. Плещеев
49%
А. А. Дельвиг
У какого еще автора, кроме Ф. И. Тютчева, есть строка: «Глас вопиющего в пустыне»?
Anonymous Quiz
17%
П. А. Вяземский
63%
Г. Р. Державин
20%
К. Ф. Рылеев
Русский МультиПАРК пополнен почти до 300 тыс. словоформ. Добавлена пьеса А.П. Чехова «Три сестры» в постановках четырех разных театров: Государственного академического Малого театра, МХАТа им. М. Горького, Московского театра «Мастерская П. Фоменко», театра «Современник».
Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. Сопоставление разных произнесений одной и той же фразы позволяет определить, какие интонационные, структурные, фонетические, жестовые особенности этой фразы являются обязательными, воспроизводимыми всеми говорящими, а какие — уникальными или случайными.
C материалами о составе корпуса и возможностях, которые он предоставляет, вы можете ознакомиться на сайте.
Русский МультиПАРК дает возможность сопоставительного изучения одной и той же реплики, произнесенной разными говорящими в одинаковых обстоятельствах. Сопоставление разных произнесений одной и той же фразы позволяет определить, какие интонационные, структурные, фонетические, жестовые особенности этой фразы являются обязательными, воспроизводимыми всеми говорящими, а какие — уникальными или случайными.
C материалами о составе корпуса и возможностях, которые он предоставляет, вы можете ознакомиться на сайте.
❤18🔥6👍1
С главной страницы Корпуса пользователи могут перейти в раздел «НКРЯ в школе». В нём можно найти полезные материалы и инструменты, которые помогут разнообразить, а в чем-то и облегчить преподавание гуманитарных предметов:
🔹Обучающий корпус НКРЯ,
🔹готовые упражнения по различным темам для учащихся 5-11 классов,
🔹методические материалы,
🔹конструктор исследовательских и творческих проектов и упражнений.
Подробнее об этих материалах – в карточках. Сохраняйте их и используйте НКРЯ в школе!
🔹Обучающий корпус НКРЯ,
🔹готовые упражнения по различным темам для учащихся 5-11 классов,
🔹методические материалы,
🔹конструктор исследовательских и творческих проектов и упражнений.
Подробнее об этих материалах – в карточках. Сохраняйте их и используйте НКРЯ в школе!
❤26🔥13👍4🤝2🏆1
Основной корпус НКРЯ пополнен на 15 млн слов, представляющих несколько тематических коллекций: это пьесы разных эпох, официально-деловые тексты, научные журналы, естественнонаучные справочники XVIII в., массовая литература — например, как дореволюционные, так и постсоветские любовные романы, — и многое другое.
Во всех текстах корпуса автоматически снята грамматическая омонимия и добавлена разметка синтаксических отношений. Для разметки была использована обновленная версия нейросетевой модели РуБик, что позволило существенно улучшить лемматизацию слов. На тестовом наборе данных процент ошибочных лемм в корпусе снизился с 4,24% до 1,39%. Пожалуйста, сообщайте нам о встречающихся ошибках в автоматической разметке слов. Чтобы сделать это, выделите слово и во всплывающем окне нажмите «Сообщить об ошибке».
Рядом с некоторыми примерами в Корпусе появились поля синего цвета с указанием имени субъекта прямой речи (персонажа пьес или говорящего в устном тексте). Если кликнуть по этому полю, доступна разметка пола, возраста, года рождения, профессии и/или амплуа персонажа или, соответственно, говорящего.
Приведены в соответствие морфемная разметка при поиске по словообразовательным признакам и в Портрете слова. Для слов, отсутствующих в Словаре морфемного анализа НКРЯ, морфемные разборы сгенерированы при помощи нейросетевой модели. Расширен словарь и улучшена его согласованность. Слова, разборы для которых сгенерированы нейросетью, теперь тоже участвуют в поиске по словообразовательной структуре, а морфемный разбор слова доступен и в карточке слова.
Во всех текстах корпуса автоматически снята грамматическая омонимия и добавлена разметка синтаксических отношений. Для разметки была использована обновленная версия нейросетевой модели РуБик, что позволило существенно улучшить лемматизацию слов. На тестовом наборе данных процент ошибочных лемм в корпусе снизился с 4,24% до 1,39%. Пожалуйста, сообщайте нам о встречающихся ошибках в автоматической разметке слов. Чтобы сделать это, выделите слово и во всплывающем окне нажмите «Сообщить об ошибке».
Рядом с некоторыми примерами в Корпусе появились поля синего цвета с указанием имени субъекта прямой речи (персонажа пьес или говорящего в устном тексте). Если кликнуть по этому полю, доступна разметка пола, возраста, года рождения, профессии и/или амплуа персонажа или, соответственно, говорящего.
Приведены в соответствие морфемная разметка при поиске по словообразовательным признакам и в Портрете слова. Для слов, отсутствующих в Словаре морфемного анализа НКРЯ, морфемные разборы сгенерированы при помощи нейросетевой модели. Расширен словарь и улучшена его согласованность. Слова, разборы для которых сгенерированы нейросетью, теперь тоже участвуют в поиске по словообразовательной структуре, а морфемный разбор слова доступен и в карточке слова.
🔥32❤10👍10
В Поэтический корпус добавлены тексты четырех поэтов — Вадима Шефнера, Роберта Рождественского, Льва Лосева и Марии Степановой. Объем пополнения — 200 тысяч слов, 2 тысячи текстов, 44 тысячи стихотворных строк. А всего в корпусе строк почти 3 миллиона.
В корпусе появилась возможность искать слово в начале и конце строки. Так, можно определить, что характерные поэтизмы ужель или вотще чаще встречаются в начале строчки, чем в какой-то другой позиции стиха.
В корпусе появилась возможность искать слово в начале и конце строки. Так, можно определить, что характерные поэтизмы ужель или вотще чаще встречаются в начале строчки, чем в какой-то другой позиции стиха.
❤28👍3
В Параллельном корпусе НКРЯ появились новые функции, которые сделают работу с ним более удобной.
В японском языке в форме поиска на двух языках появилось поисковое поле «Семантика». Японский стал первым иностранным языком в НКРЯ, в котором размечена семантика.
В карельском, вепсском, чувашском, хакасском корпусах расширены возможности настройки подкорпуса. Пользователи смогут отбирать тексты по жанру и типу (для всех перечисленных языков), а также по теме текста (в чувашском корпусе). Для всех параллельных корпусов доступна возможность отбирать подкорпус по количеству словоформ, что полезно при анализе текстов разного объёма.
Результаты поиска теперь можно сортировать с помощью шести новых типов сортировки: по дате создания текста на русском или иностранном языке от старых текстов к новым и наоборот, при условии, что оригиналы и переводы рассматриваются вместе или отдельно. Новые сортировки помогут быстрее находить нужную информацию и лучше структурировать данные.
В японском языке в форме поиска на двух языках появилось поисковое поле «Семантика». Японский стал первым иностранным языком в НКРЯ, в котором размечена семантика.
В карельском, вепсском, чувашском, хакасском корпусах расширены возможности настройки подкорпуса. Пользователи смогут отбирать тексты по жанру и типу (для всех перечисленных языков), а также по теме текста (в чувашском корпусе). Для всех параллельных корпусов доступна возможность отбирать подкорпус по количеству словоформ, что полезно при анализе текстов разного объёма.
Результаты поиска теперь можно сортировать с помощью шести новых типов сортировки: по дате создания текста на русском или иностранном языке от старых текстов к новым и наоборот, при условии, что оригиналы и переводы рассматриваются вместе или отдельно. Новые сортировки помогут быстрее находить нужную информацию и лучше структурировать данные.
👍16❤6
Media is too big
VIEW IN TELEGRAM
Рады сообщить о важном обновлении формы поиска на сайте Национального корпуса русского языка! Теперь пользователи могут добавлять слова перед Словом 1, что значительно упрощает составление и редактирование сложных запросов.
Ранее добавлять слова можно было только справа от Слова 1 и последующих слов. Например, если вы искали конструкцию вида «прилагательное + местоимение + дорога», задав синтаксические отношения между этими словами, но затем решили искать вариант «союз + прилагательное + местоимение + дорога», вам пришлось бы пересобирать запрос с нуля. Теперь всё проще: достаточно нажать кнопку «+» слева от Слова 1 и указать любой признак, например «союз».
Обратите внимание: принцип расчета расстояния между словами остался неизменным. Расстояние всегда задаётся слева направо: от нового Слова 1 до исходного Слова 1, а затем — к последующим словам.
Ранее добавлять слова можно было только справа от Слова 1 и последующих слов. Например, если вы искали конструкцию вида «прилагательное + местоимение + дорога», задав синтаксические отношения между этими словами, но затем решили искать вариант «союз + прилагательное + местоимение + дорога», вам пришлось бы пересобирать запрос с нуля. Теперь всё проще: достаточно нажать кнопку «+» слева от Слова 1 и указать любой признак, например «союз».
Обратите внимание: принцип расчета расстояния между словами остался неизменным. Расстояние всегда задаётся слева направо: от нового Слова 1 до исходного Слова 1, а затем — к последующим словам.
🔥26👍8🎉3⚡2❤1🙏1
Чтобы лучше понять, как вы используете Национальный корпус русского языка для решения своих задач, и сделать Корпус еще удобнее и понятнее, мы запускаем исследование аудитории.
Первый этап исследования — это интервью с пользователями. Если вы применяете Корпус в работе, учебе или другой деятельности, мы будем рады услышать ваше мнение. Чтобы принять участие в интервью, заполните небольшую форму: https://forms.yandex.ru/u/675159c7f47e738d9a20e5fc/
После отправки формы наш менеджер свяжется с вами для согласования удобной даты и времени для интервью. Видеозвонок пройдет в Zoom и займет 30–40 минут.
Ваше мнение поможет нам улучшить сервис и лучше учитывать потребности наших пользователей!
Первый этап исследования — это интервью с пользователями. Если вы применяете Корпус в работе, учебе или другой деятельности, мы будем рады услышать ваше мнение. Чтобы принять участие в интервью, заполните небольшую форму: https://forms.yandex.ru/u/675159c7f47e738d9a20e5fc/
После отправки формы наш менеджер свяжется с вами для согласования удобной даты и времени для интервью. Видеозвонок пройдет в Zoom и займет 30–40 минут.
Ваше мнение поможет нам улучшить сервис и лучше учитывать потребности наших пользователей!
🔥14👍6
Уже завтра состоится открытие Конференции, посвященной 20-летию Национального корпуса русского языка!
В течение двух дней участники мероприятия обсудят широкий круг вопросов – от корпусных методов лингвистических исследований и достоверности корпусных данных до вопросов создания корпусов и разработки пользовательского интерфейса, от применения нейросетевых моделей в подготовке корпусных данных до использования НКРЯ в преподавании гуманитарных дисциплин в университете и в школе.
Мероприятия пройдут очно в Инстиуте русского языка РАН по адресу: ул. Волхонка, 18/2.
Программу конференции можно найти на сайте института.
Предусмотрена онлайн-трансляция пленарных докладов по ссылке.
В течение двух дней участники мероприятия обсудят широкий круг вопросов – от корпусных методов лингвистических исследований и достоверности корпусных данных до вопросов создания корпусов и разработки пользовательского интерфейса, от применения нейросетевых моделей в подготовке корпусных данных до использования НКРЯ в преподавании гуманитарных дисциплин в университете и в школе.
Мероприятия пройдут очно в Инстиуте русского языка РАН по адресу: ул. Волхонка, 18/2.
Программу конференции можно найти на сайте института.
Предусмотрена онлайн-трансляция пленарных докладов по ссылке.
🔥28👍10❤5🙏2
В Диалектный корпус добавлены новые тексты объемом примерно 100 тыс. словоупотреблений. Новые тексты представляют говоры севера (Архангельская область, Карелия, Коми), Поволжья (большая хрестоматия диалектов Нижегородской области) и юга (Смоленская, Калужская области, молокане Кавказа). В пополнение входят как записи дореволюционного времени и 30-х годов, так и материалы недавних экспедиций. Добавлено несколько сот аудио- и десять кинозаписей, на которых можно не только услышать диалект, но и увидеть, как на севере смолят лодку, а в Азербайджане разводят пчел.
🔥17❤11👎1
В Региональном корпусе обновлена разметка ключевых слов в текстах. Использование ключевых слов облегчает анализ узких тематических категорий и помогает ориентироваться в текстах разных тематик.
Для разметки использовалась модель T-lite-instruct-0.1, обученная на материалах корпуса. Новые ключевые слова содержат меньше ошибок нормализации и грамматических ошибок, а также более точно описывают тематику текста. Как и раньше, одно ключевое слово может состоять из однословного ключа (похолодание, гололед) либо из двусловного сочетания (таяние снега). По однословному запросу (община) находится как точное соответствие, так и двусловные сочетания с этим словом (сельская община). Для каждого текста сгенерировано от 5 до 10 ключевых слов, которые упорядочены по значимости.
Для разметки использовалась модель T-lite-instruct-0.1, обученная на материалах корпуса. Новые ключевые слова содержат меньше ошибок нормализации и грамматических ошибок, а также более точно описывают тематику текста. Как и раньше, одно ключевое слово может состоять из однословного ключа (похолодание, гололед) либо из двусловного сочетания (таяние снега). По однословному запросу (община) находится как точное соответствие, так и двусловные сочетания с этим словом (сельская община). Для каждого текста сгенерировано от 5 до 10 ключевых слов, которые упорядочены по значимости.
👍29