👾 В первом видео 6-го модуля, посвященного LSA, мы подготовим для анализа данные:
1️⃣ скачаем (отсюда) описания для 250 самых популярных фильмов Кинопоиска (на русском),
2️⃣ лемматизируем,
3️⃣ удалим знаки препинания и стоп-слова,
4️⃣ посчитаем частотность по фильмам,
5️⃣ составим матрицу совместной встречаемости.
Сам по себе метод достаточно хитроумный, поэтому начинаем с русскоязычного датасета, чтобы все точно было понятно. Потом обязательно применим к древним. #цифровой_понедельник
1️⃣ скачаем (отсюда) описания для 250 самых популярных фильмов Кинопоиска (на русском),
2️⃣ лемматизируем,
3️⃣ удалим знаки препинания и стоп-слова,
4️⃣ посчитаем частотность по фильмам,
5️⃣ составим матрицу совместной встречаемости.
Сам по себе метод достаточно хитроумный, поэтому начинаем с русскоязычного датасета, чтобы все точно было понятно. Потом обязательно применим к древним. #цифровой_понедельник
VK Видео
R: Модуль 6 Урок 1. Подготовка данных для анализа: описания Кинопоиска
Источник данных: https://www.kaggle.com/datasets/alexandertesemnikov/kinopoisktop250russiandataset Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 В этот #цифровой_понедельник представляем вашему вниманию короткометражный фильм “Кое-что о матрицах”. Совсем без них нельзя, так что разбираемся. В планах еще составить задачки к этому уроку, но это все позже.
Маленькое уточнение: на доске я записала транспонированную B так, как это делается в R; обычно, впрочем, пишут букву t как степень: B^t.
Маленькое уточнение: на доске я записала транспонированную B так, как это делается в R; обычно, впрочем, пишут букву t как степень: B^t.
VK Видео
R: Модуль 6 Урок 2. Операции с матрицами: сложение и умножение, транспонирование. Диагональная матрица
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 #цифровой_понедельник постепенно превращается в алгебраический: сегодня разбираемся, что такое определитель матрицы. Определитель матрицы нужен для понимания собственных векторов. Собственные векторы нужны для понимания сингулярных векторов. Сингулярные векторы нужны для понимания латентно-семантического анализа. Все пригодится, даже если сейчас неочевидно, как.
VK Видео
R: Модуль 6 Урок 3. Линейные преобразования. Определитель матрицы. Вырожденная матрица.
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 Рубрика #цифровой_понедельник продолжает рисовать квадратики, и это неспроста: сегодня говорим о собственных векторах и собственных значениях, а собственные векторы — это такие векторы, которые при преобразовании матрицей остаются лежать на той же прямой, как будто их умножили на скаляр. Никуда не поворачиваются, одним словом. О том, как собственные векторы пригождаются при семантическом анализе текстов, поговорим в следующий раз.
VK Видео
R: Модуль 6 Урок 4. Собственные значения и собственные векторы
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 Сегодня в рубрике #цифровой_понедельник знакомимся с сингулярным разложением матрицы. Такое разложение лежит в основе латентно-семантического анализа, и сводится оно к представлению одной матрицы в виде произведения трех других, одна из которых — диагональная.
VK Видео
R: Модуль 6 Урок 5. Сингулярное разложение матрицы
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 На связи рубрика #цифровой_понедельник, и сегодня применяем изученный метод SVD к описаниям фильмов из “Кинопоиска”. Используем три способа:
1️⃣ функция
2️⃣ функция
3️⃣ усечение с использованием функции
Ищем ближайших соседей для “дарта” тремя способами и сравниваем результат. А также находим интересных соседей для слова “жемчуг”. И это вовсе не 💎, а — такой уж у нас датасет —“гамбс” и “делопроизводитель”.
1️⃣ функция
svd()
без усечения; 2️⃣ функция
svd()
, усечение путем индексирования матрицы с эмбеддингами;3️⃣ усечение с использованием функции
irlba()
.Ищем ближайших соседей для “дарта” тремя способами и сравниваем результат. А также находим интересных соседей для слова “жемчуг”. И это вовсе не 💎, а — такой уж у нас датасет —
VK Видео
R: Модуль 6 Урок 6. Эмбеддинги слов. Усеченное SVD
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 В рубрике #цифровой_понедельник продолжаем изучать латентно-семантический анализ, и сегодня строим эмбеддинги документов с использованием усеченного SVD. Иными словами, как бы “вкладываем” (embed) документы в единое векторное пространство для того, чтобы посчитать расстояние между ними и найти ближайшие.
Пока тренируемся на описаниях Кинопоиска, но уже скоро применим это все и к Платону и Ко. А пока наша нехитрая рекомендательная система советует тем, кто любит “Служебный роман”, посмотреть еще и“Любовь и голуби”.
Пока тренируемся на описаниях Кинопоиска, но уже скоро применим это все и к Платону и Ко. А пока наша нехитрая рекомендательная система советует тем, кто любит “Служебный роман”, посмотреть еще и
VK Видео
R: Модуль 6 Урок 7. Эмбеддинги документов
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 Рубрика #цифровой_понедельник скоро уйдет на каникулы, чтобы осенью вернуться к вам с новыми силами. Но перед этим — еще несколько видео про тематическое моделирование. Сегодня визуализируем главные компоненты для описаний Кинопоиска, чтобы с удивлением обнаружить топик про “бильбо” и “кольцо”. Что бы это могло быть? 🤔
VK Видео
R: Модуль 6 Урок 8. Визуализация главных компонент (топиков)
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
👾 Итак, последний #цифровой_понедельник перед уходом на каникулы. В этом видео:
- загружаем диалоги Платона
- применяем скользящее окно и считаем pmi
- применяем сингулярное разложение
- считаем косинусное расстояние между векторами слов
- смотрим, какие обнаружились топики
- ищем ближайших соседей к слову “элемент” (stoicheion)
Пока все!
- загружаем диалоги Платона
- применяем скользящее окно и считаем pmi
- применяем сингулярное разложение
- считаем косинусное расстояние между векторами слов
- смотрим, какие обнаружились топики
- ищем ближайших соседей к слову “элемент” (stoicheion)
Пока все!
VK Видео
R: Модуль 6 Урок 9. LSA на платоновском корпусе: топики и эмбеддинги слов
Видео подготовлено по результатам проекта «Цифровая античность» при поддержке фонда «Гуманитарные исследования» ФГН НИУ «Высшая школа экономики» в 2023 году.
Пока #цифровой_понедельник на каникулах, перейдем от методов дальнего чтения к чтению пристальному. Ближайший месяц посвятим анализу нескольких фрагментов из «Федона» Платона, начав, как и полагается, с первых слов диалога.
Не новость, что Платон тщательно думал над композицией своих сочинений. Дионисий Галикарнасский сообщает, что после смерти Платона нашли дощечку с разными вариантами начала «Государства». Всех вариантов мы не знаем, но в дошедшей до нас редакции «Государства» Сократ начинает диалог с того, как он спустился (κατέβην) в Пирей, желая посмотреть (θεάσασθαι) шествие, которое показалось ему прекрасным (καλή). Такое вступление плавно вводит нас в контекст беседы, которая состоялась между Сократом и его собеседниками, но не только в этом состоит литературное мастерство Платона. Тот же подбор слов мы находим в важнейшей VII книге «Государства» (520c). Рассказав миф о пещере, Сократ добавляет, что философам нужно вновь спуститься (καταβατέον) в пещеру и привыкнуть созерцать (θεάσασθαι) тени. Философы лучше других распознают, что представляет собой каждая тень, ведь они уже созерцали правду относительно всего прекрасного (καλῶν). Эта лексическая параллель дает основание исследователям сравнить Сократа, спустившегося в Пирей, где и состоялась беседа, записанная в «Государстве», с философом, который вернулся в пещеру, чтобы поделиться истиной с остальными узниками.
Многочисленны примеры из других диалогов. На войну и на битву (πολέμου καὶ μάχης) долгие сборы — в «Горгии» этими словами Калликл приветствует Сократа, опоздавшего на речь Горгия. Нет сомнений, что этим приветствием предвосхищается словесная схватка между Сократом и Калликлом во второй части диалога: Платону не было другой надобности давать слово Калликлу, который после вступления исчезает на долгое время из диалога. Свое опоздание Сократ объясняет тем, что задержался со спутником Херефонтом на рыночной площади (ἐν ἀγορᾷ). Легко предположить, что задержали опоздавших не дела насущные, но философский диалог, для которого агора — привычное место. С самого начала риторическое искусство, которое олицетворяет Горгий, противопоставляется искусству беседы, а это и есть центральная тема диалога.
Что до «Федона», то диалог открывается беседой между Федоном, спутником Сократа, и Эхекратом, пифагорейцем из Флиунта, желающим услышать обстоятельства смерти философа:
– Сам (αὐτός), Федон, ты был подле Сократа в тот день, когда он выпил яд в тюрьме, или только слышал обо всем от кого-нибудь еще?
– Сам (αὐτός), Эхекрат.
Этот обмен репликами проще всего объяснить желанием Эхекрата убедиться в авторитете слов Федона, но αὐτός-тема может иметь большее значение. Именно в «Федоне» Сократ наставляет, что мы сами (αὐτοί) — это вовсе не тело, но бестелесная душа (ψυχή), бессмертие которой доказывается в диалоге. Интерпретаторы посмелее видят в двойном αὐτός намек на пифагорейскую тему диалога: традиция сообщает, что последователи Пифагора цитировали слова учителя, добавляя к ним фразу «сам сказал» (αὐτὸς ἔφα, лат. ipse dixit).
Таким образом, зачин диалога зачастую предвосхищает главные темы и ключевые образы всего сочинения. Майлс Бернит в своей работе о первых словах платоновских диалогов сравнивает эту особенность композиции со структурой оперы: в увертюре мы можем услышать лейтмотивы всего произведения, но об их значении мы узнаем лишь с ходом сюжета. Конечно, не все считают вступления и рамочные конструкции платоновских диалогов достойными внимания. Лео Штраус, успевший поучиться в Марбурге у философа-неокантианца Пауля Наторпа, вспоминает:
Наторп обыкновенно пролистывал двадцать страниц платоновского «Федра» и, добравшись до доказательства бессмертия души (245с), заявлял: «Здесь-то Платон и начинает философствовать».
Надеемся, что нам удалось показать, как Платон философствует с первых строк своих диалогов. Продолжим с «Федоном» в следующий понедельник!
Не новость, что Платон тщательно думал над композицией своих сочинений. Дионисий Галикарнасский сообщает, что после смерти Платона нашли дощечку с разными вариантами начала «Государства». Всех вариантов мы не знаем, но в дошедшей до нас редакции «Государства» Сократ начинает диалог с того, как он спустился (κατέβην) в Пирей, желая посмотреть (θεάσασθαι) шествие, которое показалось ему прекрасным (καλή). Такое вступление плавно вводит нас в контекст беседы, которая состоялась между Сократом и его собеседниками, но не только в этом состоит литературное мастерство Платона. Тот же подбор слов мы находим в важнейшей VII книге «Государства» (520c). Рассказав миф о пещере, Сократ добавляет, что философам нужно вновь спуститься (καταβατέον) в пещеру и привыкнуть созерцать (θεάσασθαι) тени. Философы лучше других распознают, что представляет собой каждая тень, ведь они уже созерцали правду относительно всего прекрасного (καλῶν). Эта лексическая параллель дает основание исследователям сравнить Сократа, спустившегося в Пирей, где и состоялась беседа, записанная в «Государстве», с философом, который вернулся в пещеру, чтобы поделиться истиной с остальными узниками.
Многочисленны примеры из других диалогов. На войну и на битву (πολέμου καὶ μάχης) долгие сборы — в «Горгии» этими словами Калликл приветствует Сократа, опоздавшего на речь Горгия. Нет сомнений, что этим приветствием предвосхищается словесная схватка между Сократом и Калликлом во второй части диалога: Платону не было другой надобности давать слово Калликлу, который после вступления исчезает на долгое время из диалога. Свое опоздание Сократ объясняет тем, что задержался со спутником Херефонтом на рыночной площади (ἐν ἀγορᾷ). Легко предположить, что задержали опоздавших не дела насущные, но философский диалог, для которого агора — привычное место. С самого начала риторическое искусство, которое олицетворяет Горгий, противопоставляется искусству беседы, а это и есть центральная тема диалога.
Что до «Федона», то диалог открывается беседой между Федоном, спутником Сократа, и Эхекратом, пифагорейцем из Флиунта, желающим услышать обстоятельства смерти философа:
– Сам (αὐτός), Федон, ты был подле Сократа в тот день, когда он выпил яд в тюрьме, или только слышал обо всем от кого-нибудь еще?
– Сам (αὐτός), Эхекрат.
Этот обмен репликами проще всего объяснить желанием Эхекрата убедиться в авторитете слов Федона, но αὐτός-тема может иметь большее значение. Именно в «Федоне» Сократ наставляет, что мы сами (αὐτοί) — это вовсе не тело, но бестелесная душа (ψυχή), бессмертие которой доказывается в диалоге. Интерпретаторы посмелее видят в двойном αὐτός намек на пифагорейскую тему диалога: традиция сообщает, что последователи Пифагора цитировали слова учителя, добавляя к ним фразу «сам сказал» (αὐτὸς ἔφα, лат. ipse dixit).
Таким образом, зачин диалога зачастую предвосхищает главные темы и ключевые образы всего сочинения. Майлс Бернит в своей работе о первых словах платоновских диалогов сравнивает эту особенность композиции со структурой оперы: в увертюре мы можем услышать лейтмотивы всего произведения, но об их значении мы узнаем лишь с ходом сюжета. Конечно, не все считают вступления и рамочные конструкции платоновских диалогов достойными внимания. Лео Штраус, успевший поучиться в Марбурге у философа-неокантианца Пауля Наторпа, вспоминает:
Наторп обыкновенно пролистывал двадцать страниц платоновского «Федра» и, добравшись до доказательства бессмертия души (245с), заявлял: «Здесь-то Платон и начинает философствовать».
Надеемся, что нам удалось показать, как Платон философствует с первых строк своих диалогов. Продолжим с «Федоном» в следующий понедельник!
Хотя рубрика #цифровой_понедельник переехала на канал RAntiquity, сегодня сделаем исключение и поделимся цифровым докладом — правда, речь там пойдет исключительно о Платоне и платоноведении.
Екатерина Демидова (ОП “Филология”),
Татьяна Крюкова (ОП “Античность”),
Александр Семенов (ОП “История”),
Мария Худошина (ОП “Филология”),
Денис Манаков (ОП “Философия”),
Вероника Пушкина (ОП “Филология”),
Тимур Саев (ОП “Философия”),
Ульяна Афанасьева (ОП “История”),
Мария Шелкова (ОП “Философия”).
Руководитель проекта: доцент Школы философии и культурологии Ольга Алиева @rantiquity.
За помощь в редактуре и корректуре благодарим Полину Крупинину (ОП “Доказательное развитие образования”).
Поддержите нас лайками и репостами, мы
Please open Telegram to view this post
VIEW IN TELEGRAM
Самый необычный проект нам недавно показали друзья по цифровой античности: греческий текст Галена о том, как вспарывать хрюшку, с переводом, врачебным комментарием и видео каждого этапа.
Авторы проекта would like to hear feedback on your experience using this guide. #цифровой_понедельник
Авторы проекта would like to hear feedback on your experience using this guide. #цифровой_понедельник