Лингвистика на коленке
2.12K subscribers
103 photos
1 video
5 files
383 links
Я лингвист-дилетант, изучаю романские языки, а также адепт самообучения (и зануда)

Не публикую рекламу.

Бот для отзывов и предложений: @ksenialinguistfbbot.

Первый пост: https://t.me/linguistique_sur_un_genou/4

Чат: @linguistic_dabblers
Download Telegram
Хотите, чтобы я всякие ссылки про NLP присылала сюда?
Forwarded from Spark in me (Alexander)
Araneum russicum maximum

TLDR - largest corpus for Russian Internet. Fast-text embeddings pre-trained on this corpus work best for broad internet related domains.

Pre-processed version can be downloaded from rusvectores.
Afaik, this link is not yet on their website (?)

wget http://rusvectores.org/static/rus_araneum_maxicum.txt.gz

#nlp
Мне опять написали про рекламу, поэтому пора как-то это вслух сказать.
Ребята, на этом канале нет и не будет рекламы, вп, чю и ммм. Это не заработок, это удовольствие.

Именно поэтому я никогда не стану популярным блоггером с кучей денег, а вы никогда не будете читать у меня про очередные бесполезные подборки английских слов и выражений.

Годные посты из годных каналов я репощу просто так, по любви, совершенно безвозмездно.
💚💚💚
Hier encore (Еще вчера мне было 20 лет) Шарля Азнавура — одна из самых депрессивных песен, которые я знаю.

Car mes amours sont mortes avant que d'exister
Mes amis sont partis et ne reviendront pas
Par ma faute j'ai fait le vide autour de moi
Et j'ai gâché ma vie et mes jeunes années

И все мои любови умерли, не родившись
Мои друзья покинули меня и больше не вернутся
Своими руками я сотворил вокруг себя пустыню
И я зря спустил свою жизнь и молодые годы

https://youtu.be/bHokx2L1wi4
Лаборатория нейронных сетей и глубокого обучения МФТИ открывает курс Deep Learning in Natural Language Processing. Он стартует 4 октября и будет проходить каждый четверг в 19:00 в 105 БК.

Курс проходит в формате "inverse classroom". Перед каждым семинаром нужно просмотреть лекцию и ответить на квиз. В основе программы — аналогичный курс Стэнфордского университета (cs224n). Обучение будет состоять из просмотра лекций, ответов на квизы, выполнения домашних заданий и проекта. Семинары будут посвящены обсуждению сложных моментов в лекциях, разбору квизов и домашних заданий, а также консультациям по проектам. Проведут их сотрудники лаборатории нейронных сетей и глубокого обучения Владислав Лялин и Алексей Сорокин.

Занятия будут проводиться в следующем порядке:

1. Введение в обработку естесственного языка и глубокое обучение, введение в векторные представления слов
2. Векторные представления слов: Word2vec, GloVe, FastText
3. Языковые модели, softmax crossentropy loss, однослойные нейронные сети
4. Нейронные сети и обратное распространение ошибки, методы оптимизации
5. Практические советы: проверки на градиент, переобучение, регуляризация, функции активации
6. Рекуррентные нейронные сети в применении к моделированию языка и другим задачам
7. GRU и LSTM, введение в машинный перевод
8. Сверточные нейронные сети в применении к классфикации текстов
9. Машинный перевод, attention
10. Сети с динамической памятью, контекстуальные векторные представления слов, будущее NLP

Длительность курса — 10 занятий. Курс открыт для всех желающих углубить свои знания в Deep Learning и Natural Language Processing. Занятия также будут транслироваться в режиме онлайн на Youtube-канале лаборатории (https://www.youtube.com/channel/UCJ-6K2HGA0hpQytlSM7FBVQ).

Для записи на курс необходимо заполнить форму (https://goo.gl/forms/BbUng7k3KbHK8s1t2). Оперативную информацию можно отслеживать в Телеграм-канале (https://t.me/joinchat/AAAAAEbQgIbzmzfKmMRlVw).

(Подсмотрено в слаке ODS.)
Что читать современному лингвисту/филологу?

Телеграм стал площадкой для нишевых сообществ с уникальным контентом. Мы будем рассказывать о каналах, которые читаем сами. В нашем первом обзоре — четыре канала о лингвистике, четыре канала о литературе и два — о цифровых гуманитарных исследованиях.

@linguistique_sur_un_genouЛингвистика на коленке
"Лингвист-дилетант" Ксения пишет, в основном, о компьютерной лингвистике и романских языках. Но здесь не только обзоры лучших курсов по NLP и интересные лингвистические факты, здесь ещё и истории из жизни о собеседованиях на иностранном языке, переводах и французском лингвистическом быте.

@linguisticmadnessLinguistic Madness
Канал о лингвистике и языках: ссылки, статьи, мнения, факты. Что если переделать "Иронию судьбы" на бандитский манер? Как выглядят граффити для незрячих? Что такое ирландский перфект в английском? Кто говорит на аэрском? И прочие лингвистические безумства.

@vooioxуЩербы
Увлекательные рассказы о том, откуда взялось слово "чувак", что такое гражданский брак и можно ли говорить звОнит. В общем, вся правда о русском языке, которую скрывали от нас в школе.

@word4powerWord4Power
Канал убежденного последователя святого Иеронима о переводах и лингвистике. Будни синхрониста, полезные переводчику книжки и статьи, лингвистические откровения о русском, украинском, английском и французском. Где еще вы узнаете, как делаются субтитры к фильмам и театральным постановкам и в чем разница между Yob's comma и Oxford comma?

@theodstavecО литературе и около неё
Команда этого проекта, название которого в переводе с чешского означает "абзац", делает переводы статей, эссе, рецензий и заметок мировых ресурсов о литературе, чтобы они стали доступнее русскоязычному читателю. А ещё там можно опубликовать свою литературоведческую статью.

@bookngrillКниги жарь
Канал студента первой магистратуры Creative Writing в России. Новости современной литературы, советы начинающим писателям, литературоведческий ликбез и просто образец хорошего текста.

@sashaandleoСаша и Лев
Дайджест литературных новостей со всего мира — о книжных фестивалях, экранизациях, встречах с писателями, литературных премиях.

@words_and_moneyСлова и деньги
Про книги из электронов и из бумаги, деньги из книг, книги без денег и всякое прочее. Издательства, книжные ярмарки, нелитературная сторона мира литературы. По мотивам «Слов и денег» Андре Шиффрина.

@Sense_catcherБиблиотечная крыса
Авторский канал о книгах и чтении в цифровую эпоху, "чердак цифрового литературоведа". Здесь и рассуждения о судьбах литературы и ее исследователей, и размышления о современном книгоиздании, и личные впечаления от выездных школ и курсов по Digital Humanities, и рассказы об интересных проектах в современной филологии.

@sysblokСистемный Блокъ
Канал о переходе культуры в цифру и применении технологий в гуманитарных науках и искусстве. Как лингвисты ловят маньяков и какие сны снятся нейросетям? Что скрывают от нас соцсети персонажей? Может ли искусственный интеллект залипнуть у телевизора? Системный Блокъ — это современный Вергилий, который проведет вас через девять кругов Big Data.

Хотите рассказать нам о своем любимом сообществе? Мы уже собираем продолжение. Пишите.
Что такое язык и является ли он неотъемлемым свойством человека? Почему люди создают и разрушают языки? Как связан язык с мышлением и культурой? Как видят эту связь лингвисты и представители других наук? Способна ли лингвистика обсуждать «глубокие истины»?

На эти и другие вопросы 12 ноября ответит заведующий лабораторией лингвистической конфликтологии и современных коммуникативных практик ВШЭ Максим Кронгауз. Его лекция «Рожденный говорить» открывает бесплатный курс InLiberty «Природа человека». Полная программа и регистрация на встречу:

https://www.inliberty.ru/courses/
Достаточно свободно читаю сицилийский итальянский благодаря серии Камиллери про комиссара Монтальбано. Толку от этого никакого, конечно же, нет, но утешаю себя тем, что он очень смешной — как сам итальянский, так и серия. После 12 прочитанных книг нашла, наконец, словарь перевода всех этих забавных слов на итальянский, составленный фанатами книг: обнаружила, что значения примерно 75% я уже и так знаю, потому что догадалась из контекста. С грустью вспоминаю первые книги, боюсь, что я не очень хорошо понимала сюжет из-за того, что понимала написанное с пятого на десятое, и надо, наверное, их перечитать.

Вспоминаю так же прочитанное когда-то интервью (возможно) Като Ломб (или это было в ее книге) — отправляясь в длинное путешествие на поезде, откройте книгу на незнакомом языке: сначала вы не будете понимать ни слова, но к третьему часу начнете улавливать смысл и структуру предложений. Кажется, это преувеличение: я пользовалась встроенными словарями киндла с итальянского на русский, английский и итальянский, и без этого костыля вряд ли начала бы понимать хоть что-нибудь. А улавливать смысл хочется, потому что чтение книг — это не просто экзерсис в языке, но и сюжет; меня лично очень фрустрирует невозможность понимать детали, от которых тем более в детективах много что зависит.

Словарь сицилийского итальянского:
http://www.vigata.org/dizionario/camilleri_linguaggio.html#D
Живу в Испании уже скоро 5 лет, но не работаю там и мало общаюсь с местными, и до сих пор очень недовольна своим испанским.

Я слушаю новости, свободно читаю, общаюсь по телефону с различными сервисами, слышу то, что мне говорят поверх шума в баре, но small talk и беззаботное общение мне никак не даются.

Возможно, проблема в том, что в данный период small talk и беззаботное общение не даются мне ни на каком языке, у меня очень мало физических и душевных сил на окружающих, я предпочитаю сидеть дома и работать или заниматься йогой или читать перед камином.

Из испанского общения у меня только языковой обмен с моей дорогой С., которая выучила в Барселоне русский, общение с моей преподавательницей по йоге и групповые занятия йогой, которые не доставляют мне совершенно никаких проблем с объяснениями.

Наилучшим способом решения данной проблемы было бы поступить в какой-нибудь испанский университет, где я была бы вынуждена общаться с одногруппниками и преподавателями (обучение там, куда я хочу, на английском, но я знаю, как испанцы говорят по-английски). Но на это у меня тоже нет сил, и совершенно не хочется сдавать IELTS по английскому, который для этой эпопеи необходим.

В результате я ищу на нетфликсе какой-то очередной испанский фильм и продолжаю расстраиваться.
На языки энергии не остается совсем. Я очень много читаю, совсем не читаю по-русски и по-английски, по-французски, испански и итальянски читаю много. Особенно много по-испански, перечитала «Американские боги» на испанском, например, 1491 (это монументальный труд Чарльза Манна про американских индейцев).

Смотрю сериалы по-испански, посмотрела Narcos Mexico, Fariña (это Наркос в Галисии), посмотрела Алатристе и еще какие-то дурацкие испанские фильмы.

Но на целенаправленное изучение языков сил нет.

Нетфликс, Prime и Movistar — постоянный источник контента, конечно. Попозже напишу, что могу посоветовать посмотреть там по-испански.
Неплохой обзор (учитывая то, что по учебникам я не занимаюсь и даже не представляю, как это можно делать в одиночку). Пользуюсь одной из грамматик, нравится.
Forwarded from Language Heroes (Алина Дудик)
Обзор учебников итальянского языка

Все, кто проходил поток в Language Heroes, знают, насколько важно иметь хороший учебник. Преимущество и одновременно недостаток итальянского – это то, что он очень популярен, и существует огромное количество учебников и дополнительных пособий.

В этом море учебников очень легко потеряться, поэтому в статье я хочу порекомендовать вам учебники, полюбившиеся мне, и те, по которым я была бы рада поучиться сама.

http://petitepolyglot.com/review-of-italian-textbooks/

#LanguageBloggersClub
Недавно прочитала La maravillosa historia del español, написанную Francisco Moreno Fernandez, академическим директором Института Сервантеса – в общем, история испанского языка на испанском и от испанцев.

Возможно, моя проблема в том, что я еще не очень хорошо знаю испанский, конечно, но мне эта книга показалась слабой и плохо отредактированной. Мало фактического материала, мало интересных примеров из истории языка, много абстрактных, достаточно претенциозных рассуждений на тему того, как была устроено интеллектуальное общество в Испании и Латинской Америке в ту или иную эпоху. Более всего мне не понравился язык книги, он замудренный, тяжелый и плохо согласованный. От начала до конца предложения часто было сложно добраться: это одна из тех книг, которые я заставила себя читать и сейчас все равно с трудом помню, что в ней было написано.

Испанский язык был языком Испанской империи, в которой никогда не заходило солнце, но такого распространения как французский язык или английский в Европе он не получил. Европейцы всегда смотрели на испанцев слегка свысока, даже на пике их могущества в XVII-XVIII вв. Испанский – язык Латинской Америки, как и любой язык колонизатора, получивший распространение, прежде всего, потому, что обладал огромным престижем, а, во-вторых, послужил объединяющим языком для континента, где локальных языков было великое множество. Очень интересно было читать про то, как Real Academia Española провела регуляризацию написания и грамматики языка, но про это мало было написано. Вообще, после прочтения книги вспоминаются, в основном, какие-то общие места, повторюсь, интересных частностей мало.

Не рекомендовала бы, но историй испанского языка вообще очень мало, так что можно прочитать ее хотя бы для общего развития.
Сколько до сих пор испытываю сложностей, когда пытаюсь общаться на неродном языке! Вопрос, идти ли за решением этих проблем к преподавателю, или к кому-то еще?

Очень сложно избавиться от внутреннего критика, который разносит тебя в пух и прах, как только ты открываешь рот. Ты вообще видела как ты формулируешь? А то, что ты делаешь с артиклями в французском, ты видела? А акцент? Лишний раз рот открывать не хочется, и я молчу. Молчу — значит, упускаю возможность развивать язык, говоря на нем.

И эта привычка бесконечно себя со всеми сравнивать. Я ухитряюсь сравнивать себя с носителями языка. С людьми, которые живут в стране "моего" языка десятилетиями, замужем/женаты на носителях, работают на этом языке. Но если я не могу говорить настолько чисто, разнообразно и правильно, как они, я снова молчу и рот не открываю. Перфекционизм — это болезнь.

Хуже всего сравнивать себя с любимым человеком. П. свободно, чисто, разнообразно и правильно говорит на 5 языках. Внезапно мы совместно обнаружили, что как только он заходит в помещение, я закрываю рот и больше не открываю, а с людьми разговариваю только в его отсутствие. Это связано не только с языком, но и с тем, что я чувствую себя не настолько эрудированной, образованной и свободно говорящей, как П. и другие мои собеседники.

Беседа между носителями мчится с такой скоростью, прыгает с темы на тему, что как только ты сформулируешь что-то интересное и соберешься прыгнуть внутрь, как в холодную воду, она уже унеслась в непредсказуемом направлении. Но это совершенно точно не язык, это мои внутренние комплексы, которые мешают перебивать, останавливать, просить вернуться на знакомую почву.

Нет, это очень часто так: когда у меня проблемы с общением на определенном языке, проблема тут не в языке, а моих внутренних барьерах, в препятствиях к самому акту коммуникации, на каком бы языке он не происходил.

Многие вещи, которые не получаются с языками, надо прорабатывать не со своим преподавателем, а со своим психотерапевтом. Я работаю над собой каждую неделю, и специалист у меня прекрасный, когнитивно-поведенческая психотерапия рулит, но от некоторых вещей избавиться до сих пор сложно.
Есть во французском невинное выражение du coup.

Оно означает: вот почему, и поэтому, в результате — такая причинно-следственная связка.

J'ai tombé malade et du coup je suis resté à la maison. — Заболел и в результате остался дома.

Выражение это очень разговорное и крайне популярное: когда смотрим французские каналы, то считаем, сколько раз говорящий повторил du coup — некоторые вставляют его в каждую фразу! Это такой языковой тик, слово-паразит — чаще всего встречается в речи менее образованных людей и молодежи.

Когда в четверг смотрели La Grande Librairie по France 5, мою любимую французскую программу про новинки литературы, в беседе четырех писателей за час это выражение прозвучало всего пару раз.

Я его не использую, потому что его причинно-следственная коннотация у меня полностью вытесняется другим словарным значением — внезапно, вдруг; французы же для этого используют другое, очень похожее на du coup выражение -— tout d'un coup.

Хотите сойти за своего в компании молодых французов? Вставляйте периодически в своем монологе в ключевые места du coup — не ошибетесь.