RAntiquity
1.1K subscribers
299 photos
11 videos
5 files
553 links
Об античности на языке R и не только

@locusclassicus
Download Telegram
RAntiquity
💡 Открытие дня: у JSTOR есть интерфейс для дата-аналитиков; весь текст не отдаст, но метаданные и n-gramm'ы -- да. Если есть институциональная подписка, внутри доступны разные инструменты анализа и виртуальная лаборатория (язык  R, любим вас, спасибо). Но…
✏️ В 2020 г. Брайан Уэзерсон, профессор философии в Мичиганском университете и один из редакторов журнала Philosopher’s Imprint, провел эксперимент с использованием LDA, проанализировав ок. 32000 статей из двенадцати философских журналов, опубликованных в 1933-2013 гг., в том числе Analysis, Journal of Philosophy, Mind, Philosophical Review и др. (см. полный список в онлайн-версии книги).

Подобное исследование проведенное полностью на языке R стало возможным благодаря функционалу Data for Research, предоставляемому JSTOR.

Свои выводы автор изложил в небольшой статье в онлайн-издании Daily Nous. Важнейший из них заключается в том, что

...существует огромная разница между работами конца XIX – начала XX века, которые современные аналитические философы воспринимают всерьез, и работами, которые обычно появляются в журналах в те годы.



В период с 1915 по 1941 год практически не обсуждалась работа Бертрана Рассела «On Denoting». Долгое время не обсуждались в журналах такие фигуры, как Джордж Эдвард Мур и Готлоб Фреге. Поздние работы Витгенштейна привлекают внимание современников, но «Трактат» также остается незамеченным, а тема позитивизма «активируется» уже в контексте проблемы верификации.

Напротив, замечает исследователь, журналы начала века полны статей о различных формах идеализма, при этом в британских журналах основное внимание уделяется сознанию (mind) и метафизике, а в американских — этике и политической философии. Многие выдающиеся авторы той эпохи сегодня более или менее полностью забыты.

Шэдворт Ходжсон опубликовал три десятка работ в ведущих журналах, и в наши дни о нем редко упоминают даже вскользь.


Для тех, кто желает воспроизвести экперимент, Уэзерсон подготовил небольшой туториал. Остальные могут просто приободриться, если их не цитируют -- или почитать оживленную дискуссию под постом в Daily Nous.
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍1
Ну и совсем чтоб приободриться. "Новый метод максимумов и минимумов" (лат. Nova Methodus pro Maximis et Minimis) — первая опубликованная работа по математическому анализу. Она была опубликована Готфридом Лейбницем в немецком научном журнале «Acta Eruditorum» в октябре 1684 года. Считается рождением исчисления бесконечно малых. Смотрим на количество цитирований.
😁6💯2
Как оценить качество тематической модели? Можно использовать количественные показатели, такие как coherence score или perplexity, или прибегнуть к качественной экспертной оценке. Но встречаются и более необычные приемы.

Один из них мы нашли в работе американского DH-исследователя Камерона Блевинса, который смоделировал дневник американской акушерки XVIII в. Марты Баллард. За свою долгую и непростую жизнь (1735–1812) Баллард сделала около 10 000 дневниковых записей, в которых она рассказывает о принятых родах, о различных личных перипетиях и о многом другом. Эти записи легли в основу работы Л. Т. Ульрих «История повитухи» (1990), за которую она получила Пулитцеровскую премию.

Блевинс заметил, что свои записи Баллард нередко начинает с сообщения о погоде, и один из LDA-топиков собрал лексику, связанную с холодной погодой. Сюда вошли слова «ветер», «холод» и т.п. Измерив присутствие этой темы в разное время года, Блевинс увидел, что тема “активируется” в зимние месяцы; в то время как весной и летом Баллард больше говорит о своем саде.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
⚡️ Запись семинара «Цифровая среда» с Ольгой Алиевой – уже в сети

На отечественном поле цифровой гуманитаристики не так много исследований, связанных с философией, потому «Платоноведение в фокусе алгоритма LDA» – доклад особенно интересный. Делимся видео!

😍 Доцент Школы философии и культурологии факультета гуманитарных наук НИУ ВШЭ Ольга Алиева рассказала о методе тематического моделирования и результатах своего эксперимента на материале архива журнала «Платоновские исследования».

😍 Доцент кафедры гуманитарных дисциплин Института общественных наук РАНХиГС, старший научный сотрудник РГГУ, член редколлегии журнала «Платоновские исследования» Илья Гурьянов выступил дискутантом по докладу.

#цифроваясреда #людиdh
Please open Telegram to view this post
VIEW IN TELEGRAM
14🔥1
RAntiquity
https://youtu.be/80Dg8ybYCJA?si=JCA9Ft2mnaLRpOHF
Из домашки по курсу анализа текста на языке R родилась целая статья! Поздравляю Женю Дуненкова с этим достижением и радуюсь, как будто сама нобелевскую премию получила 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
11❤‍🔥3
Все пройдет, и печаль и радость лишь латынь не проходит нет.

Ireland S. (1976). The Computer and Its Role in Classical Research // Greece and Rome 23.1:40-54.
2
— Ну вот, я застряла. Но, как обычно, приходят на выручку регулярные… кто?
— Молитвы!
11🙏4👍1🔥1
Forwarded from Antibarbari HSE (Olga Alieva)
В 2024 году исполняется 10 лет с журналу «Платоновские исследования» — первому научному изданию в России, посвященному Платону и платоновскому наследию. Историк философии Ольга Алиева построила тематическую модель архива журнала при помощи алгоритма LDA и узнала, какие темы на протяжении этих лет интересовали платоноведов.

От автора: Самым главным выводом для меня, впрочем, стало то, что “тренды” в платоноведении создаются постоянными усилиями наших замечательных коллег. Совет очень прост: возделывай свою тему, публикуйся, и новый LDA-топик не замедлит себя ждать.

На сайт полная версия не вошла, но ее можно найти по ссылке (и там много имен).

Создателям и постоянным авторам журнала — мои поздравления!
👏8
Я придумала новую рубрику в канале: каждую субботу буду рассказывать про то, что я сейчас читаю и какой кофе я под это дело пью. Будут такие #кофейныечтения.

Пилотный пост пришелся на первую субботу нового года. В нем я немного порефлексирую о свежем исследовании Ольги Алиевой: это тематическое моделирование архива журнала «Платоновские исследования» за последние 10 лет.
4👍2🔥1
В кружке у меня батч брю на эфиопии из кофейни Rum Baba в Амстердаме. Мне обещали насыщенный вкус, даже spicy — но не скажу, что это было прям вау. Скорее, он был слегка передержанный (хотя я брала его до полудня), но хороший, классический.

Компанию фильтру составила статья о том, как можно применять текстовый анализ для исследований академических журналов. По моему скромному опыту, историки античной философии тяготеют к древовидному методу исследования. Машина [программа, код] дает возможность сломать эту линейность и иначе посмотреть на то, как мыслят авторы статей.

Меня это наталкивает на мысль о том, что текстовый анализ — это приведение мысли-древа к мысли-ризоме. Это возможно, например, благодаря алгоритму LDA:

LDA — это популярный алгоритм для построения тематических моделей, в рамках которого каждый документ рассматривается как смесь тем, а каждая тема — как смесь слов. Это позволяет документам «перекрывать» друг друга по содержанию, а не разделяться на отдельные группы — что свойственно для естественного языка.

Кажется, именно об этом пишут Делёз и Гваттари:

Все эти множества суть плоские, ибо они заполняют, оккупируют все свои измерения […] Множества определяются внешним — абстрактной линией, линией ускользания или детерриторизации, следуя которой, они меняют природу соединяясь с другими множествами.


Анализ текста дает нам карту, которая состоит не из статичных точек, но из направлений. Эта карта не фиксирует и закрепляет, но приглашает к взаимодействию и модификации. Наконец, это не сверхкодирование (как может показаться на первый взгляд), а напротив — декодирование и разборка, которая ни в коем случае не претендует на открытие истины. Она лишь показывает другие возможные конфигурации и соединения.
6🔥3💯2🤮1
Написала для IQ.HSE обзор, посвященный применению LDA в разных гуманитарных отраслях, от политической истории до литературоведения. Хозяйке на заметку.
https://iq.hse.ru/news/885865882.html
🔥191👍1
Интересная статья от Бориса Орехова об отчуждаемости знания в эпоху больших языковых моделей вышла в журнале “Историческая информатика”.

Мы живем в текстоцентричном мире, и поэтому нас так пугают нейросети. Ученый сегодня смотрит на LLM то ли с надеждой (поможет?), то ли с опасением (заменит?). Проблема это никакая не техническая, а вполне себе философская:

Нейросети прежде всего ставят перед гуманитарной наукой вопрос о том, что есть в ней помимо текста, есть ли у знаков в научном тексте референт. Возможно, что уже в ближайшем будущем наличие референта ученым-гуманитариям придется показывать и доказывать для внешнего наблюдателя.


Ответ подсказывает Платон, причем даже не в "Федре", как вы могли подумать, а в "Евтидеме”:

— Но, во имя богов, — сказал я, — если мы изучим искусство составления речей, то именно приобретение этого искусства сделает нас счастливыми? — Я этого не думаю, — отвечал Клиний, схватив мою мысль.


В духе Платона Свифт, который в статье тоже упоминается (у него, кстати, описана подобная шайтан-машина), доводит до абсурда мысль о том, что знание хранится в текстах. Но если не в текстах, то где?
6🤔2👍1
Я уже писала (и еще один текст в печати), что Дельта Берроуза с древнегреческим справляется не очень хорошо. Даже более примитивная версия Дельты (расстояние Манхэттена без стандартизации) дает большую точность классификации, а лучше всего, по моим наблюдениям, показывает себя косинусное сходство.

Но, оказывается, есть возможность обойтись и без косинусов: достаточно просто взять корень квадратный из матрицы с частотностями, а потом посчитать тот же Манхэттен. Это называется Eder’s Simple. Наблюдение об эффективности для греков принадлежит не мне.
Но я проверила на своем корпусе, все так. Хотя косинус все равно лучше 📐

В связи с этой математической чертовщиной (квадратный корень? really?) мне вспоминается серия “Смешариков” про лунного ворона. Статистика — точная наука, но главное не перепутать, в какой руке держать бубен 🪶
Please open Telegram to view this post
VIEW IN TELEGRAM
😁103🗿2👍1
На дружественном канале Antibarbari недавно стартовала рубрика, посвященная Appendix Platonica — семи небольшим текстам из платоновского корпуса, которые Диоген Лаэрций называет “бастардами”, νοθευόμενοι.

Это никудышние небольшие сократические диалоги, в основном построенные на заимствованиях из оригинальных сочинений Платона, но порой весьма остроумные. О многих из них высказывалась точка зрения, что это могут быть “школьные” тексты.

Что ж, если это так, то следует признать, что у них там был свой Порядок оформления курсовых и выпускных квалификационных работ, и этот порядок фиксировал нужный для зачета объем. Иначе как объяснить эти цифры:

«Аксиох» 2351 слов
«О справедливости» 1211 слов
«Демодок 1» 908 слов
«Демодок 2-4» 1326 слов
«О добродетели» 1299 слов
«Эриксий» 5388 слов
«Алкиона» 916 слов
«Сизиф» 1587 слов

“Эриксий” выпускается с отличием и рекомендацией на НИРС, “Аксиох” перевыполнил требования по объему, но промахнулся с жанром, “Алкиона” пусть приходит осенью, авторам “Демодока” пожелание делать чуть менее вызывающую копипасту.
🔥9😁2🥰1
Не так много в нашей песочнице поводов применить двусторонний t-test, и вот один из них, говорящий нам, что нет статистически значимой разницы между длиной книги в “Государстве” и в “Законах”. А что это значит? А бог весть.

⚠️ Будьте бдительны, пытаясь повторить этот эксперимент. Не забудьте проверить распределения на нормальность. #задачка
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👻21🙏1
Forwarded from DH CLOUD
DH Awards 2023

DH Awards 2023 - профессиональная общественная премия в Digital Humanities, действует с 2012 года. Премия не привязана к географии, языку, организации или области гуманитарных наук. Никаких финансовых призов, только честь победы и значок для вашего сайта.

Номинировать можно себя или коллег. Важно только, чтобы ресурс/статья/проект был запущен/завершен/обновлен/создан в 2023 году. Дедлайн 28 января.

Номинации этого года:
- DH для развлечения
- DH для визуализации
- DH-провал года
- короткий DH-формат: блог, статья, видео
- DH-инструмент или набор инструментов
- DH-набор данных
- DH-образование

Поделитесь ссылкой на сайт премии http://dhawards.org/dhawards2023/nominations/ или этим постом с коллегами.

Вопросы можно задавать @dinaraamirovna
🔥5
Сегодня пришли результаты студенческой оценки преподавания (СОП), из которых следует, что с первым своим курсом по программированию на R я вроде бы справилась. Спасибо, дорогие студенты, за ваши отзывы. Я их все прочитала, а некоторые даже по два раза 🧡
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥317
🧩 Задачка для тех, кому не спится

⭐️ Византийский компилятор Стобей составляет антологию, куда включает отрывки из подлинных и подложных диалогов Платона (условно подлинными будем считать все, что Трасилл включил в тетралогии; условно подложными — все, что вошло в Appendix Platonica).

⭐️ Подложные он процитировал 40 раз, а подлинные — ок. 400. Опустим цифры, которые никому не интересны.

Можно ли сказать, что есть зависимость между участием в тетралогиях и числом цитат у Стобея?

💭 Построим линейную модель, в которой зависимой переменной будет число цитат, а независимыми — группа (t = tetralogy, a = appendix) и число слов в диалоге.

☑️ На уровне значимости < 0.001 устанавливаем связь между числом слов и числом цитат.

На уровне значимости 0.05 отвергаем связь между участием в тетралогиях и числом цитат.

🌷 Многозначительный вывод: не важно, кто ты, важно, сколько ты нагнал знаков. #задачка

Идем спать в осознании того, что полночи потрачены на полную фигню и забивание цифирек в эксель.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
В пятницу 2 февраля в 12.20-12.40 по Москве буду здесь с докладом “Возможна ли цифровая история философии?”. Спойлер: кажется, нет.

Нужна регистрация. Тайминг не предполагает дискуссии, а поспорить хотелось бы — можно, например, в комментариях под этим постом по итогам доклада. Мне бы даже хотелось услышать, что я не права.

upd. Скажем так, я даже сознательно заостряю, потому что мне кажется, что темпы внедрения этого всего в наши программы и планы опережают темпы осмысления. последствия для отрасли могут быть серьезны, но никто сейчас всерьез не думает — какими именно
10🔥2
RAntiquity
В пятницу 2 февраля в 12.20-12.40 по Москве буду здесь с докладом “Возможна ли цифровая история философии?”. Спойлер: кажется, нет. Нужна регистрация. Тайминг не предполагает дискуссии, а поспорить хотелось бы — можно, например, в комментариях под этим постом…
Обещанная запись доклада. В последовавшей дискуссии Полина Колозариди охарактеризовала мое выступление как “хорошо фундированный алармизм”, и мне бы хотелось верить, что некоторый фундамент там действительно есть. Не претендую на визионерство, но историкам философии будет непросто вписаться в “цифровой поворот”, а те, кто впишутся, возможно, выйдут с полосы препятствий уже не историками философии.
❤‍🔥17👍32