Antibarbari HSE
3.58K subscribers
1.67K photos
18 videos
19 files
850 links
Греко-латинский клуб Antibarbari Факультета гуманитарных наук Высшей школы экономики

Постоянные авторы канала — сотрудники НИУ ВШЭ Алиева О. В., Макарова И.В., Прокопов К.Е., Орехов Б.В., Крупинина П.Е.
Download Telegram
👾 В первом видео 6-го модуля, посвященного LSA, мы подготовим для анализа данные:

1️⃣ скачаем (отсюда) описания для 250 самых популярных фильмов Кинопоиска (на русском),
2️⃣ лемматизируем,
3️⃣ удалим знаки препинания и стоп-слова,
4️⃣ посчитаем частотность по фильмам,
5️⃣ составим матрицу совместной встречаемости.

Сам по себе метод достаточно хитроумный, поэтому начинаем с русскоязычного датасета, чтобы все точно было понятно. Потом обязательно применим к древним. #цифровой_понедельник
👾 В этот #цифровой_понедельник представляем вашему вниманию короткометражный фильм “Кое-что о матрицах”. Совсем без них нельзя, так что разбираемся. В планах еще составить задачки к этому уроку, но это все позже.

Маленькое уточнение: на доске я записала транспонированную B так, как это делается в R; обычно, впрочем, пишут букву t как степень: B^t.
👾 #цифровой_понедельник постепенно превращается в алгебраический: сегодня разбираемся, что такое определитель матрицы. Определитель матрицы нужен для понимания собственных векторов. Собственные векторы нужны для понимания сингулярных векторов. Сингулярные векторы нужны для понимания латентно-семантического анализа. Все пригодится, даже если сейчас неочевидно, как.
👾 Рубрика #цифровой_понедельник продолжает рисовать квадратики, и это неспроста: сегодня говорим о собственных векторах и собственных значениях, а собственные векторы — это такие векторы, которые при преобразовании матрицей остаются лежать на той же прямой, как будто их умножили на скаляр. Никуда не поворачиваются, одним словом. О том, как собственные векторы пригождаются при семантическом анализе текстов, поговорим в следующий раз.
👾 Сегодня в рубрике #цифровой_понедельник знакомимся с сингулярным разложением матрицы. Такое разложение лежит в основе латентно-семантического анализа, и сводится оно к представлению одной матрицы в виде произведения трех других, одна из которых — диагональная.
👾 На связи рубрика #цифровой_понедельник, и сегодня применяем изученный метод SVD к описаниям фильмов из “Кинопоиска”. Используем три способа:
1️⃣ функция svd() без усечения;
2️⃣ функция svd(), усечение путем индексирования матрицы с эмбеддингами;
3️⃣ усечение с использованием функции irlba().

Ищем ближайших соседей для “дарта” тремя способами и сравниваем результат. А также находим интересных соседей для слова “жемчуг”. И это вовсе не 💎, а — такой уж у нас датасет — “гамбс” и “делопроизводитель”.
👾 В рубрике #цифровой_понедельник продолжаем изучать латентно-семантический анализ, и сегодня строим эмбеддинги документов с использованием усеченного SVD. Иными словами, как бы “вкладываем” (embed) документы в единое векторное пространство для того, чтобы посчитать расстояние между ними и найти ближайшие.

Пока тренируемся на описаниях Кинопоиска, но уже скоро применим это все и к Платону и Ко. А пока наша нехитрая рекомендательная система советует тем, кто любит “Служебный роман”, посмотреть еще и “Любовь и голуби”.
👾 Рубрика #цифровой_понедельник скоро уйдет на каникулы, чтобы осенью вернуться к вам с новыми силами. Но перед этим — еще несколько видео про тематическое моделирование. Сегодня визуализируем главные компоненты для описаний Кинопоиска, чтобы с удивлением обнаружить топик про “бильбо” и “кольцо”. Что бы это могло быть? 🤔
👾 Итак, последний #цифровой_понедельник перед уходом на каникулы. В этом видео:

- загружаем диалоги Платона
- применяем скользящее окно и считаем pmi
- применяем сингулярное разложение
- считаем косинусное расстояние между векторами слов
- смотрим, какие обнаружились топики
- ищем ближайших соседей к слову “элемент” (stoicheion)

Пока все!
Пока #цифровой_понедельник на каникулах, перейдем от методов дальнего чтения к чтению пристальному. Ближайший месяц посвятим анализу нескольких фрагментов из «Федона» Платона, начав, как и полагается, с первых слов диалога.

Не новость, что Платон тщательно думал над композицией своих сочинений. Дионисий Галикарнасский сообщает, что после смерти Платона нашли дощечку с разными вариантами начала «Государства». Всех вариантов мы не знаем, но в дошедшей до нас редакции «Государства» Сократ начинает диалог с того, как он спустился (κατέβην) в Пирей, желая посмотреть (θεάσασθαι) шествие, которое показалось ему прекрасным (καλή). Такое вступление плавно вводит нас в контекст беседы, которая состоялась между Сократом и его собеседниками, но не только в этом состоит литературное мастерство Платона. Тот же подбор слов мы находим в важнейшей VII книге «Государства» (520c). Рассказав миф о пещере, Сократ добавляет, что философам нужно вновь спуститься (καταβατέον) в пещеру и привыкнуть созерцать (θεάσασθαι) тени. Философы лучше других распознают, что представляет собой каждая тень, ведь они уже созерцали правду относительно всего прекрасного (καλῶν). Эта лексическая параллель дает основание исследователям сравнить Сократа, спустившегося в Пирей, где и состоялась беседа, записанная в «Государстве», с философом, который вернулся в пещеру, чтобы поделиться истиной с остальными узниками.

Многочисленны примеры из других диалогов. На войну и на битву (πολέμου καὶ μάχης) долгие сборы — в «Горгии» этими словами Калликл приветствует Сократа, опоздавшего на речь Горгия. Нет сомнений, что этим приветствием предвосхищается словесная схватка между Сократом и Калликлом во второй части диалога: Платону не было другой надобности давать слово Калликлу, который после вступления исчезает на долгое время из диалога. Свое опоздание Сократ объясняет тем, что задержался со спутником Херефонтом на рыночной площади (ἐν ἀγορᾷ). Легко предположить, что задержали опоздавших не дела насущные, но философский диалог, для которого агора — привычное место. С самого начала риторическое искусство, которое олицетворяет Горгий, противопоставляется искусству беседы, а это и есть центральная тема диалога.

Что до «Федона», то диалог открывается беседой между Федоном, спутником Сократа, и Эхекратом, пифагорейцем из Флиунта, желающим услышать обстоятельства смерти философа:
– Сам (αὐτός), Федон, ты был под­ле Сокра­та в тот день, когда он выпил яд в тюрь­ме, или толь­ко слы­шал обо всем от кого-нибудь еще?
– Сам
(αὐτός), Эхе­крат.
Этот обмен репликами проще всего объяснить желанием Эхекрата убедиться в авторитете слов Федона, но αὐτός-тема может иметь большее значение. Именно в «Федоне» Сократ наставляет, что мы сами (αὐτοί) — это вовсе не тело, но бестелесная душа (ψυχή), бессмертие которой доказывается в диалоге. Интерпретаторы посмелее видят в двойном αὐτός намек на пифагорейскую тему диалога: традиция сообщает, что последователи Пифагора цитировали слова учителя, добавляя к ним фразу «сам сказал» (αὐτὸς ἔφα, лат. ipse dixit).

Таким образом, зачин диалога зачастую предвосхищает главные темы и ключевые образы всего сочинения. Майлс Бернит в своей работе о первых словах платоновских диалогов сравнивает эту особенность композиции со структурой оперы: в увертюре мы можем услышать лейтмотивы всего произведения, но об их значении мы узнаем лишь с ходом сюжета. Конечно, не все считают вступления и рамочные конструкции платоновских диалогов достойными внимания. Лео Штраус, успевший поучиться в Марбурге у философа-неокантианца Пауля Наторпа, вспоминает:
Наторп обыкновенно пролистывал двадцать страниц платоновского «Федра» и, добравшись до доказательства бессмертия души (245с), заявлял: «Здесь-то Платон и начинает философствовать».
Надеемся, что нам удалось показать, как Платон философствует с первых строк своих диалогов. Продолжим с «Федоном» в следующий понедельник!
Хотя рубрика #цифровой_понедельник переехала на канал RAntiquity, сегодня сделаем исключение и поделимся цифровым докладом — правда, речь там пойдет исключительно о Платоне и платоноведении.
🎉 Долгое время на нашем канале действовала рубрика #цифровой_понедельник, в которой публиковались небольшие обучающие видео по работе с языком R для антиковедов. Сегодняшний понедельник снова станет цифровым.

⚙️ Целый год команда бесстрашных антиварваров осваивала, параллельно с латынью, язык Markdown, благодаря чему мы смогли собрать интерактивный сборник упражнений к учебнику Familia Romana.

📝 Такие упражнения можно задавать на дом ученикам, когда не хочется проверять домашку, или делать motu proprio, когда нужно повторить грамматику или лексику.

Наши упражнения стараются не дублировать сборник Exercitia Latina и другие коллекции заданий к учебнику Ханса Эрберга. В основу сборника легли упражнения, составленные преподавателем Школы философии и культурологии Кириллом Прокоповым @ecceliber

🎈 Над созданием сайта в 2023-2024 учебном году трудились студенты нескольких образовательных программ НИУ ВШЭ:

Екатерина Демидова (ОП “Филология”),
Татьяна Крюкова (ОП “Античность”),
Александр Семенов (ОП “История”),
Мария Худошина (ОП “Филология”),
Денис Манаков (ОП “Философия”),
Вероника Пушкина (ОП “Филология”),
Тимур Саев (ОП “Философия”),
Ульяна Афанасьева (ОП “История”),
Мария Шелкова (ОП “Философия”).

Руководитель проекта: доцент Школы философии и культурологии Ольга Алиева @rantiquity.

За помощь в редактуре и корректуре благодарим Полину Крупинину (ОП “Доказательное развитие образования”).

💡 Интерактивная часть сайта реализована с использованием пакета checkdown для языка R. Его разработал наш коллега, доцент Школы лингвистики Георгий Мороз. Спасибо Георгию Алексеевичу за консультации и за несколько полезных функций, добавленных в пакет по нашей просьбе.

🎯 В сборнике пока 20 уроков, но мы надеемся продолжить. Также в работе древнегреческий сайт, о готовности которого мы напишем в свое время.

Поддержите нас лайками и репостами, мы тут все убились ради этого очень старались. Об опечатках, если найдете, пишите в комментариях.
Please open Telegram to view this post
VIEW IN TELEGRAM
Самый необычный проект нам недавно показали друзья по цифровой античности: греческий текст Галена о том, как вспарывать хрюшку, с переводом, врачебным комментарием и видео каждого этапа.

Авторы проекта would like to hear feedback on your experience using this guide. #цифровой_понедельник