Два дня прошлой недели большая делегация нашего отделения провела в разговорах с коллегами о той лингвистике, которой мы все увлекаемся и которую любим. Государственный университет просвещения принимал биенальную конференцию АПИФиПЛ, Ассоциации преподавателей и исследователей в области фундаментальной и прикладной лингвистики. От кафедры были: С.А. Бурлак, А.А. Кибрик, Ю.В. Синицына, С.Г. Татевосов, О.В. Федорова. А на круглом столе о лингвистике для школьников, который организовала наша выпускница, преподаватель Школы юного филолога В.В. Антонюк, выступила студентка магистратуры А.А. Заруднева.
❤35❤🔥11🥰8
This media is not supported in your browser
VIEW IN TELEGRAM
В этом семестре на кафедре проходят несколько новых спецкурсов, один из которых — "Функциональная семантика служебных слов". Мы задали Ирине Михайловне Кобозевой несколько вопросов о курсе. Ответы на них — в видеоинтервью.
❤21❤🔥11👍7
bill-gonzalez-driemel-makharoblidze-pinter-2025.pdf
1 MB
"И эксперимент провели, и теорию проверили"
В естественных языках встречаются две основных стратегии конъюнкции:
1) с союзом между двумя именными группами (Вася и Маша)
2) с частицей у каждого конъюнкта (и Вася, и Маша)
Небольшая группа языков позволяет совмещать обе стратегии:
az alma is és a banan is
the яблоко и2 и1 the банан и2
'яблоко и банан' (венгерский)
В ряде работах формально-семантической направленности утверждается, что на уровне семантического представления во всех случаях конъюнкции именных групп (потенциально в любом языке) присутствуют оба типа элементов. В рамках такого подхода языки отличаются лишь по тому параметру, какие элементы конъюнкции поверхностно озвучиваются.
В свежей статье (Bill et al., 2025) авторы экспериментально проверили одно из предсказаний этой теории в связи с усвоением языка. Согласно гипотезе, дети легче/быстрее усваивают конструкции с взаимооднозначным соответствием между формой и значением. Если все стратегии конъюнкции имеют единую глубинную структуру, где порой не все элементы озвучиваются, то самым «прозрачным» типом конструкций для детей должна быть та, которая приведена в венгерском примере выше, — где все элементы на месте.
В эксперименте участвовали венгерские и грузинские взрослые и дети. Им нужно было располагать пары предметов на виртуальном столе в зависимости от того, какую вербальную инструкцию они слышали. Инструкции включали в себя три типа предложений: с союзом, с парой частиц или и с тем, и с другими.
Как оказалось, никакой видимой сложности в интерпретации предложений, в которых отсутствовал либо союз, либо частицы, относительно тех, в которых было всё сразу, у детей нет. Более того, в грузинском наблюдалась обратная ситуация: дети чаще ошибались в тех инструкциях, в которых был и союз, и частицы. Попытаться примирить экспериментальные данные с теорией или предложить новую — на совести семантистов, а мы же как всегда предлагаем вам ознакомиться с полным материалом статьи самостоятельно!
#новоевлингвистике
В естественных языках встречаются две основных стратегии конъюнкции:
1) с союзом между двумя именными группами (Вася и Маша)
2) с частицей у каждого конъюнкта (и Вася, и Маша)
Небольшая группа языков позволяет совмещать обе стратегии:
az alma is és a banan is
the яблоко и2 и1 the банан и2
'яблоко и банан' (венгерский)
В ряде работах формально-семантической направленности утверждается, что на уровне семантического представления во всех случаях конъюнкции именных групп (потенциально в любом языке) присутствуют оба типа элементов. В рамках такого подхода языки отличаются лишь по тому параметру, какие элементы конъюнкции поверхностно озвучиваются.
В свежей статье (Bill et al., 2025) авторы экспериментально проверили одно из предсказаний этой теории в связи с усвоением языка. Согласно гипотезе, дети легче/быстрее усваивают конструкции с взаимооднозначным соответствием между формой и значением. Если все стратегии конъюнкции имеют единую глубинную структуру, где порой не все элементы озвучиваются, то самым «прозрачным» типом конструкций для детей должна быть та, которая приведена в венгерском примере выше, — где все элементы на месте.
В эксперименте участвовали венгерские и грузинские взрослые и дети. Им нужно было располагать пары предметов на виртуальном столе в зависимости от того, какую вербальную инструкцию они слышали. Инструкции включали в себя три типа предложений: с союзом, с парой частиц или и с тем, и с другими.
Как оказалось, никакой видимой сложности в интерпретации предложений, в которых отсутствовал либо союз, либо частицы, относительно тех, в которых было всё сразу, у детей нет. Более того, в грузинском наблюдалась обратная ситуация: дети чаще ошибались в тех инструкциях, в которых был и союз, и частицы. Попытаться примирить экспериментальные данные с теорией или предложить новую — на совести семантистов, а мы же как всегда предлагаем вам ознакомиться с полным материалом статьи самостоятельно!
#новоевлингвистике
❤30❤🔥4🔥4💊1
В следующую среду, 3 декабря, в 20:00, пройдёт коллоквиум ОТиПЛа, на котором выступит Пол Кипарски — профессор департамента лингвистики Стэнфордского университета. Ссылку на конференцию можно найти на сайте отделения, а ниже — аннотация от докладчика.
Finnish Structural Case: Myths, Facts, and a New Analysis
The Case Licensing framework (Kiparsky 2000, Wunderlich 2001, Galbraith 2022) distin- guishes between Abstract Case, which is represented at Argument Structure, and morphosyntactic case, which is represented in syntactic structure. At both levels, case is decomposed by the features [±H(ighest) R(ole)] and [±L(owest) R(ole)].
From the perspective of this approach, the apparent complexity of Finnish case stems largely from the fact that it has Differential Object Marking (DOM) at two levels: Abstract Case, where Accusative is distinguished as a marked Case from Partitive, and morphological case, where ab- stract Accusative Case is in turn mapped into nominative, accusative, genitive, and partitive.
I present a simple analysis of Finnish structural case in the Case Licensing approach, and three classes of arguments that support the analysis, and the theory on which it is based, against alternative accounts offered by Cognitive Grammar and GB/Minimalism.
1. Evidence from word order, co-ordination, and ellipsis shows that accusative objects occupy the same syntactic position as partitive objects. So accusative case is not assigned/checked by a higher Aspect head (as in Kratzer 2004, Baker 2015, 2021; Vainikka & Brattico 2014, among others).
2. Lexical semantic evidence shows that the distinction between Accusative and Partitive ob- jects is structural, and not simply a matter of telicity.
3. The four morphosyntactic realizations of abstract Accusative Case are not arbitrary, and involve neither case homonymy (Huumo 2023) nor allomorphy (Baker 2015). In the Case Licensing analysis, the featural decomposition of case and basic principles of the theory predict this mapping from first principles.
Finnish Structural Case: Myths, Facts, and a New Analysis
The Case Licensing framework (Kiparsky 2000, Wunderlich 2001, Galbraith 2022) distin- guishes between Abstract Case, which is represented at Argument Structure, and morphosyntactic case, which is represented in syntactic structure. At both levels, case is decomposed by the features [±H(ighest) R(ole)] and [±L(owest) R(ole)].
From the perspective of this approach, the apparent complexity of Finnish case stems largely from the fact that it has Differential Object Marking (DOM) at two levels: Abstract Case, where Accusative is distinguished as a marked Case from Partitive, and morphological case, where ab- stract Accusative Case is in turn mapped into nominative, accusative, genitive, and partitive.
I present a simple analysis of Finnish structural case in the Case Licensing approach, and three classes of arguments that support the analysis, and the theory on which it is based, against alternative accounts offered by Cognitive Grammar and GB/Minimalism.
1. Evidence from word order, co-ordination, and ellipsis shows that accusative objects occupy the same syntactic position as partitive objects. So accusative case is not assigned/checked by a higher Aspect head (as in Kratzer 2004, Baker 2015, 2021; Vainikka & Brattico 2014, among others).
2. Lexical semantic evidence shows that the distinction between Accusative and Partitive ob- jects is structural, and not simply a matter of telicity.
3. The four morphosyntactic realizations of abstract Accusative Case are not arbitrary, and involve neither case homonymy (Huumo 2023) nor allomorphy (Baker 2015). In the Case Licensing analysis, the featural decomposition of case and basic principles of the theory predict this mapping from first principles.
❤29🔥13❤🔥8👏4
В июне, дорогие читатели, мы познакомили вас с подборкой курсов, записанных для портала teach-in.ru преподавателями нашей кафедры. Спешим обрадовать: совсем недавно архив пополнился «Проектными задачами компьютерной лингвистики» Ксении Андреевны Студеникиной. Курс, поддержанный фондом «Интеллект», был впервые прочитан в заключительном семестре бакалавриата весной этого года. Помимо 8 лекций Ксении Андреевны, на портале выложены 3 рассказа о проектах, выполненных экс-четверокурсниками (нынешними магистрантами или выпускниками):
💻 Сравнение эффективности базовых моделей и моделей, предобученных для решения задач анализа тональности текста, при дообучении для анализа тональности именованных сущностей (М. Кравчук, Э. Ожогова, Т. Тыщишина)
🎬 Анализ аргументации в отзывах на кинофильмы (В. Борисова, И. Рабинович, А. Сербина)
🛜 RAG-система с LLMs (В. Краснобаева, П. Семенюк)
Фотоотчет со съемок в офисе Teach-in прилагается!
💻 Сравнение эффективности базовых моделей и моделей, предобученных для решения задач анализа тональности текста, при дообучении для анализа тональности именованных сущностей (М. Кравчук, Э. Ожогова, Т. Тыщишина)
🎬 Анализ аргументации в отзывах на кинофильмы (В. Борисова, И. Рабинович, А. Сербина)
🛜 RAG-система с LLMs (В. Краснобаева, П. Семенюк)
Фотоотчет со съемок в офисе Teach-in прилагается!
❤🔥35❤11🔥6🥱2🆒2😎2🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
2025 год подходит к концу, а значит, наступает время подводить лингвистические итоги и знакомиться со словами года.
Словарь Collins выбрал словом уходящего года выражение vibe coding — способ создания приложения или сайта путём описания желаемого результата искусственному интеллекту вместо написания кода вручную. Термин был популяризован Андреем Карпаты — бывшим директором по ИИ в Tesla и сооснователем OpenAI. Он употребил его, подчёркивая, что с использованием искусственного интеллекта можно сосредоточиться на творческой задумке и практически «забыть о существовании самого кода».
В шорт-лист также попали и другие интересные слова — clankers, broligraphy, aura farming, biohacking, coolcation, glaze, HENRY, micro-retirement и taskmasking — их значения можно посмотреть на сайте.
А скоро мы расскажем и о выборе других словарей.
Словарь Collins выбрал словом уходящего года выражение vibe coding — способ создания приложения или сайта путём описания желаемого результата искусственному интеллекту вместо написания кода вручную. Термин был популяризован Андреем Карпаты — бывшим директором по ИИ в Tesla и сооснователем OpenAI. Он употребил его, подчёркивая, что с использованием искусственного интеллекта можно сосредоточиться на творческой задумке и практически «забыть о существовании самого кода».
В шорт-лист также попали и другие интересные слова — clankers, broligraphy, aura farming, biohacking, coolcation, glaze, HENRY, micro-retirement и taskmasking — их значения можно посмотреть на сайте.
А скоро мы расскажем и о выборе других словарей.
❤🔥21👍3❤2💊2🥴1
Знаменитая книга Н. Хомского «Язык и мышление» (“Language and mind”) была переведена на русский язык и вышла в Советском Союзе всего через четыре года после публикации оригинала в 1968 году — в серии «Публикации ОСиПЛа» в переводе Б.Ю. Городецкого и под редакцией В.А. Звегинцева. На днях, продолжая разбирать кафедральные шкафы, мы обнаружили документ, сыгравший в этом решающую, хотя и формальную роль, — выписку из протокола заседания кафедры 23 июня 1972 года, где издание рекомендуется к печати.
❤42🔥24❤🔥5
«Есть такой жанр статьи — введение в научный оборот какого-то датасета. И даже специальный журнал для этого есть — Scientific Data. Это такое ответвление журнала Nature»
© О. И. Беляев
Сегодня в рубрике #новоевлингвистике мы расскажем о сентябрьской статье «The Indo-European Cognate Relationships dataset» из журнала «Scientific Data». Один из её авторов — доцент нашей кафедры Олег Игоревич Беляев!
В статье презентуется датасет IE-CoR (Indo-European Cognate Relationships): 89 лингвистов систематизировали слова-когнаты для 170 базовых понятий в 160 языках индоевропейской языковой семьи. Целью работы стало создание эталонного датасета для исследований эволюции индоевропейских языков автоматическими методами.
В отличие от более ранних попыток структурирования подобных данных, в этом исследовании список охваченных языков гораздо шире. Точность определений не уступает предыдущим исследованиям (например, проекту The Global Lexicostatistical Database, целью которого было собрание в единую базу списков Сводеша для языков мира: https://starlingdb.org/new100/main.htm): список почти исключает синонимию, а для заимствований создана отдельная структура данных. Кроме того, верификация данных проводится строже и с участием большого количества лингвистов.
«Одна из задач проекта — разработка более длинного списка, чем список Сводеша (110 слов — прим.): изначально стояла цель создать список из 200 слов, сейчас он насчитывает 170. Вторая задача — единообразное описание индоевропейских языков по этому списку.»
© О.И. Беляев
Так, данные дают возможность посмотреть, что исходя из этого происходит с классификацией индоевропейских языков. В сопоставимых филогенетических анализах по датасету IE-CoR исчезают артефактные длины ветвей, а оценки дат расхождения гораздо ближе соответствуют известным историям дивергенции.
Все данные проекта находятся в открытом доступе по ссылке https://github.com/lexibank/iecor, а для удобства использования был создан сайт https://iecor.clld.org/
❤🔥33❤10🥰10💊1
В следующую среду, 10 декабря, в 18:00, состоится ещё один коллоквиум ОТиПЛа, на котором выступит Донка Стериаде — фонолог и профессор департамента лингвистики и философии MIT. Ссылку на конференцию и вспомогательное чтение можно найти на сайте отделения, а ниже — аннотация к докладу.
Cyclicity generalized
This talk presents evidence for a modification of the phonological cycle, which allows it to extend naturally to the analysis of new, almost-but-not-quite cyclic patterns of stem syncretism.
The cycle is a mechanism that generates phonological similarities between certain pairs of lexically related expressions. In its original conception (Chomsky & Halle 1968), this is an inheritance device designed for the case in which a complex form (the outer cycle or Derivative) inherits its properties from an expression it immediately contains (the inner cycle, or Base). The formalization of inheritance is implemented in different ways with rules vs. constraints, but the restriction of cyclic inheritance to pairs of nested forms is shared by all frameworks. I refer to this property as C(yclic)-Containment: the Base always contains the Derivative as its immediate subconstituent.
In addition to C-Containment, cyclic inheritance has the properties of Directionality (aka Base Priority: Benua 1997); that of being able to transmit predictable properties, rule-governed properties from Base to Derivative (Steriade 2000); and that of Recursiveness, the fact that the Derivative in one pair can become the Base in another (Chomsky, Halle and Lukoff 1956).
The talk outlines evidence that has accumulated over the last 20 years showing that all these properties of the cycle, except C-Containment, are also present in other phenomena that promote stem syncretism:
i. Pseudo-cyclic inheritance: stem identity between derivatives and related words not contained within them (Steriade 2008, Steriade and Yanovich 2015, Steriade 2025).
ii. Paradigm uniformity: stem similarity between different cells in an inflectional paradigm. (Albright 2011, Kraska Szlenk 2007, Steriade 2000)
iii. Morphomes: stem identity between lexically related forms that are expected to be distinct
but to exceed a certain degree of similarity (Aronoff 1994; Steriade 2016; 2023)
Like the cycle, these patterns are directional, recursive and can refer to, and transmit, predictable properties. But they are not bound by C-Containment, which is restricted to the cycle proper.
This question I address is how to analyze the cycle and the related patterns in (i-iii) in ways that do justice to the properties they all share, while restricting C-Containment to the cycle.
I will argue that the solution is to rethink C-Containment, which restricts cyclic inheritance to nested pairs of expressions, as a violable constraint. This allows us to provide parallel analyses for all stem identity and stem distinctness phenomena, including those in (i-iii). In addition, this allows unified analyses of standard cyclic and pseudo-cyclic inheritance (item (i)) within a single system: English stress will be shown to be a case in point.
Cyclicity generalized
This talk presents evidence for a modification of the phonological cycle, which allows it to extend naturally to the analysis of new, almost-but-not-quite cyclic patterns of stem syncretism.
The cycle is a mechanism that generates phonological similarities between certain pairs of lexically related expressions. In its original conception (Chomsky & Halle 1968), this is an inheritance device designed for the case in which a complex form (the outer cycle or Derivative) inherits its properties from an expression it immediately contains (the inner cycle, or Base). The formalization of inheritance is implemented in different ways with rules vs. constraints, but the restriction of cyclic inheritance to pairs of nested forms is shared by all frameworks. I refer to this property as C(yclic)-Containment: the Base always contains the Derivative as its immediate subconstituent.
In addition to C-Containment, cyclic inheritance has the properties of Directionality (aka Base Priority: Benua 1997); that of being able to transmit predictable properties, rule-governed properties from Base to Derivative (Steriade 2000); and that of Recursiveness, the fact that the Derivative in one pair can become the Base in another (Chomsky, Halle and Lukoff 1956).
The talk outlines evidence that has accumulated over the last 20 years showing that all these properties of the cycle, except C-Containment, are also present in other phenomena that promote stem syncretism:
i. Pseudo-cyclic inheritance: stem identity between derivatives and related words not contained within them (Steriade 2008, Steriade and Yanovich 2015, Steriade 2025).
ii. Paradigm uniformity: stem similarity between different cells in an inflectional paradigm. (Albright 2011, Kraska Szlenk 2007, Steriade 2000)
iii. Morphomes: stem identity between lexically related forms that are expected to be distinct
but to exceed a certain degree of similarity (Aronoff 1994; Steriade 2016; 2023)
Like the cycle, these patterns are directional, recursive and can refer to, and transmit, predictable properties. But they are not bound by C-Containment, which is restricted to the cycle proper.
This question I address is how to analyze the cycle and the related patterns in (i-iii) in ways that do justice to the properties they all share, while restricting C-Containment to the cycle.
I will argue that the solution is to rethink C-Containment, which restricts cyclic inheritance to nested pairs of expressions, as a violable constraint. This allows us to provide parallel analyses for all stem identity and stem distinctness phenomena, including those in (i-iii). In addition, this allows unified analyses of standard cyclic and pseudo-cyclic inheritance (item (i)) within a single system: English stress will be shown to be a case in point.
❤19❤🔥5👏2
В воскресенье, 7 декабря пройдёт 19-й Московский фестиваль языков. Традиционно студенты и преподаватели нашего отделения рассказывают об интересных языках в рамках фестиваля. Вот какие презентации готовят отипляне в этом году.
Мати Рейнович Пентус, преподаватель:
Пётр Федосов, студент 4 курса:
Рина Белуччи, студентка 2 курса:
Ярослав Крупник, студент 1 курса:
Кериш Шамси, студент 1 курса:
Регистрируйтесь и приходите слушать презентации уже в воскресенье!
Мати Рейнович Пентус, преподаватель:
Я собираюсь рассказать на фестивале языков об эстонском языке. Хочу показать, что он проще, чем кажется! Жаль, что за 45 минут невозможно объяснить всю систему типов склонения. Расскажу о трёх степенях долготы и о непривычных грамматических категориях.
Пётр Федосов, студент 4 курса:
На этом фестивале я презентую два языка (и оба искусственные) — Карпофорофилюса и сольресоль.
Грамматика первого из них была опубликована в Лейпциге в 1730-х годах. Говоря об этом языке, мы будем вспоминать и о других — как естественных, так и искусственных. Так что презентацию вполне можно было бы назвать по-отипловски: «Язык Карпофорофилюса в типологическом освещении».
Название языка «сольересоль» неслучайно делится на знакомые слоги: создатель этого языка был композитором и музыкантом. Из нот (разве что с дополнительными возможностями произношения) и строятся все слова и предложения на сольресоле.
Рина Белуччи, студентка 2 курса:
Зачастую итальянцы общаются больше жестами чем словами. Это может выглядеть смешно, странно или нелепо, но это не просто экспрессивность — у каждого жеста есть свой смысл. Я планирую разобрать диалог, состоящий полностью из жестов, а также рассказать о самых смешных жестах и их значении.
Ярослав Крупник, студент 1 курса:
Расскажу о языке лакота (один из индигенных языков Северной Америки) через то, как он сам себя презентует в современном мире. Будем обсуждать фонетику и грамматику, читать аутентичные тексты, разбираться в мифологических представлениях, но на каждом шагу задавать себе вопрос: а можно ли доверять описанию языка изнутри сообщества говорящих? И чему вообще можно?
Кериш Шамси, студент 1 курса:
Мой рассказ на грядущем фестивале будет посвящён татарскому языку, в том числе его особенностям фонетики и грамматики, диалектному разнообразию, статусу и даже некоторым преимуществам, которые обретают его носители! Для меня цель — дать новые интересные знания как тем, кто хорошо знаком с тюркскими языками, так и тем, кто знает совсем немного или слышит о них впервые.
Регистрируйтесь и приходите слушать презентации уже в воскресенье!
❤17❤🔥12🙏4🦄1
Media is too big
VIEW IN TELEGRAM
Продолжаем рассказывать про спецкурсы этого семестра.
В этот раз мы задали несколько вопросов про курс «Экспериментальные подходы к теоретической семантике» его преподавателям: Сергею Георгиевичу Татевосову, Ольге Викторовне Федоровой, Петру Олеговичу Россяйкину и Марии Борисовне Панич.
Смотрите интервью и узнавайте больше про новый спецкурс!
В этот раз мы задали несколько вопросов про курс «Экспериментальные подходы к теоретической семантике» его преподавателям: Сергею Георгиевичу Татевосову, Ольге Викторовне Федоровой, Петру Олеговичу Россяйкину и Марии Борисовне Панич.
Смотрите интервью и узнавайте больше про новый спецкурс!
☃18❤13🥰10❤🔥5😁2