RAntiquity
Продолжая историю преподобного Мортона, упомяну о его (написанной в соавторстве) книге It’s Greek to the Computer (1971 г.). Несколько глав там посвящены Платону. Авторы приходят к удивительным выводам: первые 300 предложений «Тимея», весь «Критий», две…
Как и обещала, докладываю о результатах. В общем, все спокойно, живем. Это не Спевсипп написал половину платоновского корпуса. Скорее он творил под именем Исократа 😂
👍8🔥5😁3🦄1
RAntiquity
В статье “Untangling Our Past: Languages, Trees, Splits and Networks” создатели алгоритма NeighborNet объясняют, как правильно интерпретировать такой граф на примере дерева германских языков. Конфликтующие сигналы передаются за счет “ретикулярной структуры”…
Сделаю zoom in, чтобы было лучше видно разрезы.
1) Красным перерезан пенек, на котором сидят диалоги и близкая к ним по стилистике диатриба: Лукиан, Эпиктет, Платон, сократические диалоги Ксенофонта.
2) Зеленым подрублен философский пенек, к которому почему-то примкнул Гален с “Естественными способностями”. Несократический Ксенофонт и исторический Плутарх сюда не входят, он расположились ближе к историкам.
3) Желтый срез хорошо показывает уровень, на котором авторский сигнал Ксенофонта перекрывает жанровый — но сюда же прилипает Аристид с одной из “Священных речей”, в которой подробно рассказывает, как у него болел живот и поэтому он не мылся. Почему так, сказать пока не могу. Но видно, что он особняком ото всех со своими болячками.
Матрицы смешений на основе тех же данных в целом подтверждают такую картину.
Там, где у автора есть своя ветка — смешений в моих экспериментах было мало, но они возрастали там, где на графе видно перепонки: например, между Аристотелем и Плотином.
1) Красным перерезан пенек, на котором сидят диалоги и близкая к ним по стилистике диатриба: Лукиан, Эпиктет, Платон, сократические диалоги Ксенофонта.
2) Зеленым подрублен философский пенек, к которому почему-то примкнул Гален с “Естественными способностями”. Несократический Ксенофонт и исторический Плутарх сюда не входят, он расположились ближе к историкам.
3) Желтый срез хорошо показывает уровень, на котором авторский сигнал Ксенофонта перекрывает жанровый — но сюда же прилипает Аристид с одной из “Священных речей”, в которой подробно рассказывает, как у него болел живот и поэтому он не мылся. Почему так, сказать пока не могу. Но видно, что он особняком ото всех со своими болячками.
Матрицы смешений на основе тех же данных в целом подтверждают такую картину.
Там, где у автора есть своя ветка — смешений в моих экспериментах было мало, но они возрастали там, где на графе видно перепонки: например, между Аристотелем и Плотином.
👍10❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Пререквизит к курсу по векторной семантике / количественной стилистике / you name it. Кто знает правильный ответ, ставьте 🐳 Кто хочет узнать решение, ставьте 🔥
upd. кажется, с моей подписью получилось несмешно, а я смеюсь второй день, ну простите
upd. кажется, с моей подписью получилось несмешно, а я смеюсь второй день, ну простите
🐳13🔥5🤣3🌚1
Forwarded from Гуманитарии в цифре
Зачем цифровые гуманитарии собирают данные о прошлом, настоящем и будущем? Как эти данные смогут помочь понять мир вокруг нас?
Напоминаем о том, что уже сегодня в 13:00 по Москве/ 17:00 по Красноярску можно будет присоединиться к первой лекции курса НИУ ВШЭ «Количественные методы в гуманитарных науках: критическое введение». Доцент МГУ, руководитель Института цифровых гуманитарных исследований СФУ Андрей Володин расскажет о данных, датаизме и о том, как это все осмыслить современному гуманитарию.
→ Подключиться
Иллюстрация: Kandinsky 3.0 (промпт: data around us)
#criticaldh #курсы
Напоминаем о том, что уже сегодня в 13:00 по Москве/ 17:00 по Красноярску можно будет присоединиться к первой лекции курса НИУ ВШЭ «Количественные методы в гуманитарных науках: критическое введение». Доцент МГУ, руководитель Института цифровых гуманитарных исследований СФУ Андрей Володин расскажет о данных, датаизме и о том, как это все осмыслить современному гуманитарию.
→ Подключиться
Иллюстрация: Kandinsky 3.0 (промпт: data around us)
#criticaldh #курсы
✍5❤4🔥1
Публикуем первую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (2024, НИУ ВШЭ).
Лекцию о данных в гуманитарных науках прочел к.и.н., доцент кафедры исторической информатики исторического факультета МГУ, руководитель Института цифровых гуманитарных исследований СФУ Андрей Юрьевич Володин.
Встречу провели руководитель магистерской программы НИУ ВШЭ "Цифровые методы в гуманитарных науках" Борис Орехов и доцент Школы философии и культурологии НИУ ВШЭ Ольга Алиева @rantiquity.
В ближайшее время поделимся анонсом следующей лекции, оставайтесь с нами.
#criticaldh #курсы
Лекцию о данных в гуманитарных науках прочел к.и.н., доцент кафедры исторической информатики исторического факультета МГУ, руководитель Института цифровых гуманитарных исследований СФУ Андрей Юрьевич Володин.
Встречу провели руководитель магистерской программы НИУ ВШЭ "Цифровые методы в гуманитарных науках" Борис Орехов и доцент Школы философии и культурологии НИУ ВШЭ Ольга Алиева @rantiquity.
В ближайшее время поделимся анонсом следующей лекции, оставайтесь с нами.
#criticaldh #курсы
YouTube
А.Ю. Володин (МГУ, СФУ). Данные вокруг гуманитария: найти, собрать, исследовать!
Первая лекция курса "Количественные методы в гуманитарных науках: критическое введение" (2024, НИУ ВШЭ). Сайт курса: http://criticaldh.ru/
❤11🔥4
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🔥5👍3
Forwarded from Vox mediaevistae
В Nature Reviews Methods Primers вышел обзор количественных методов анализа текста (там даже есть пара слов о том, как методы гуманитариев, вроде тематического моделирования, могут пригодиться биологам; обычно бывает наоборот). Мне кажется, это отличный текст, чтобы составить общее представление о поле, прежде чем понять, куда углубляться. Предлагаю присмотреться к нему, например, тем, кто собирался поступать в закрывшуюся магистратуру по медиевистике в Вышке: программа по DH-то пока в относительном порядке
Nature
Quantitative text analysis
Nature Reviews Methods Primers - Quantitative text analysis is a range of computational methods to analyse text data statistically and mathematically. In this Primer, Kristoffer Nielbo et al....
❤7
Публикуем вторую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (НИУ ВШЭ).
Лекцию о построении ландшафта области знаний прочел к.ф.н., доцент Школы лингвистики НИУ ВШЭ, заведующий Международной лаборатории языковой конвергенции Георгий Алексеевич Мороз.
Встречу провела доцент Школы философии и культурологии, преподаватель магистерской программы "Цифровые методы в гуманитарных науках" Ольга Алиева @rantiquity .
Пользуемся случаем напомнить, что завтра (14 апреля) на Дне открытых дверей ФГН представит 19 магистерских программ, открытых для поступления в 2024 году, в том числе будет представлена программа ЦМГН (12:00-12:20). Зарегистрироваться можно по ссылке.
Подробнее о магистратуре расскажем завтра на ДОД. Также в ближайшее время поделимся анонсом следующей лекции курса "Количественные методы в гуманитарных науках". Оставайтесь на связи.
#criticaldh #курсы #магистратура
Лекцию о построении ландшафта области знаний прочел к.ф.н., доцент Школы лингвистики НИУ ВШЭ, заведующий Международной лаборатории языковой конвергенции Георгий Алексеевич Мороз.
Встречу провела доцент Школы философии и культурологии, преподаватель магистерской программы "Цифровые методы в гуманитарных науках" Ольга Алиева @rantiquity .
Пользуемся случаем напомнить, что завтра (14 апреля) на Дне открытых дверей ФГН представит 19 магистерских программ, открытых для поступления в 2024 году, в том числе будет представлена программа ЦМГН (12:00-12:20). Зарегистрироваться можно по ссылке.
Чтобы поступить в эту магистратуру, не нужно уметь программировать. Мы учим питону, R и анализу данных, ключевым инструментам наук о данных в применении к гуманитарным объектам, прежде всего к тексту. Наша магистратура -- это способ радикально расширить взгляд на гуманитарные науки и понять многое в том, как функционируют современные методы анализа данных. На бюджетные места могут претендовать все те, кто не обучался раньше в магистратуре.
Подробнее о магистратуре расскажем завтра на ДОД. Также в ближайшее время поделимся анонсом следующей лекции курса "Количественные методы в гуманитарных науках". Оставайтесь на связи.
#criticaldh #курсы #магистратура
YouTube
Г.А. Мороз (НИУ ВШЭ). Построение ландшафта области знаний
Вторая лекция курса "Количественные методы в гуманитарных науках: критическое введение" (2024, НИУ ВШЭ). Сайт курса: http://criticaldh.ru/
❤8🔥4👏1
Forwarded from sonja, a kick ass young lady
На семинаре в восемь утра пошутила, что аналитические философы читают только статьи друг друга, а книжки не читают. И кажется, кого-то ненароком обидела, a thousand pardons.
Но в каждой шутке, как известно, только доля шутки. Есть такой исследователь Eugenio Petrovich, который занимается DH в философии, а именно — исследует социальные сети внутри аналитической философии, анализируя рубрику «Благодарности» в статьях. Казалось бы — в условной континентальной философии тоже есть такие благодарности, однако он отмечает, что
А еще мне сейчас коллега, который парижанит на конференции по философии сознания, написал:
Ну и — что называется — где я не права? Пояснение: пост шуточный, всех люблю (просто кого-то чуть больше ).
Но в каждой шутке, как известно, только доля шутки. Есть такой исследователь Eugenio Petrovich, который занимается DH в философии, а именно — исследует социальные сети внутри аналитической философии, анализируя рубрику «Благодарности» в статьях. Казалось бы — в условной континентальной философии тоже есть такие благодарности, однако он отмечает, что
…analytic philosophy is taken here as a representative of humanities areas, at least from the viewpoint of authorship practices. Since multiple authorship is relatively uncommon in analytic philosophy like in other humanities fields, co-authorship analysis is likely to be scarcely useful to trace its social structures. At the same time, serials have become a common publication outlet for analytic philosophers (Levy, 2003). Therefore, focusing on journal articles allows gathering a representative sample of the field. From this point of view, collecting data from standard databases is easier for analytic philosophy than for other philosophical traditions whose communicative practices rely more on books or collections.
А еще мне сейчас коллега, который парижанит на конференции по философии сознания, написал:
докладчица цитирует беньямина — кажется, это первое упоминание континентальщины за 4 дня конфы; а убер аналитическая профессорка гуглит беньямина передо мной.
Ну и — что называется — где я не права? Пояснение: пост шуточный, всех люблю (
SpringerLink
Acknowledgments-based networks for mapping the social structure of research fields. A case study on recent analytic philosophy
Synthese - In the last decades, research in science mapping has delivered several powerful techniques, based on citation or textual analysis, for charting the intellectual organization of research...
❤7👍2🔥2😁2
Forwarded from Цифровой филолог (Даня Скоринкин)
5 коллекций данных для цифрового гуманитария
Интернет набит данными, но очень немногие датасеты сделаны гуманитариями и для гуманитариев. Собрал пять чисто гуманитарных источников данных, которые хорошо использовать в курсе анализа данных или программирования на DH-программах.
🎭 1. DraCor — корпуса и датасеты вокруг драматических текстов (с уклоном в network analysis, но не только). Один из очень немногих проектов, сумевших на базе “гуманитарного” стандарта TEI построить классную экосистему гуманитарных данных. Самые приятные данные дракора — это метаданные для каждого корпуса, которые вы можете скачать прямо на страничке корпуса, например, вот табличка для русского корпуса: https://dracor.org/api/v1/corpora/rus/metadata/csv Тут и классические метаданые вроде дат написания и публикации, и сетевые вроде плотности социальной сети в пьесе, и например соотношение мужской и женской речи…
Еще для каждой отдельной пьесы можно скачать сетевые данные (в gexf/csv/gml), речь персонажей, сценические ремарки… Ну и полную разметку в TEI, из которой все эти данные произрастают.
✒️ 2. Репозиторий открытых данных по русской литературе и фольклору — проект Цифровой лабы Пушкинского дома (ИРЛИ РАН), где цифровые филологи и не только публикуют датасеты и (иногда) код к своим исследованиям. Своего рода гуманитарный papers with code. Вот, например, данные и код к статье Кирилла Маслинского о том, какие животные чаще встречаются в каких жанрах детской литературе.
А еще там публикует новые датасеты сам ПушДом. Многие из них называются очень романтично. Скажем, Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)… Датасет с таким названием нужно обрабатывать под звуки романса “Отцвели уж давно хризантемы в саду”🍂
📚 3. European Literary Text Collection (ELTeC) — корпуса европейских романов, собранные с прицелом на репрезентативность и сопоставимость друг с другом. Целью было найти для каждой европейской литературы по 100 романов в диапазоне 1840-1920, чтобы они покрывали период более-менее равномерно, чтобы были представлены не только писатели-мужчины, чтобы бли длиной не менее 10000 слов и т.д. Не для всех корпусов это удалось, а русский корпус там совсем странный, но тем не менее — одна из немногих попыток сделать датасет, пригодный для “компаративистики” by design.
🏛 4. Госкаталог Музейного фонда РФ —свалка датасет по всему, что оцифровано во всех музеях России. Не так часто в нашей области можно найти наборы данных, где записей не тысячи, но миллионы. Качество очень разное, репрезентативность тоже под вопросом, но жемчужин в этом океане данных тоже море. Одну я здесь уже описывал.
🗺 5. Геоданные DHCLOUD. Тут лежат литературные карты в geojson, сделанные студентами гуманитарного факультета Вышки под руководством Бориса Орехова. Картографированы самые разные тексты: от маршрута Афанасия Никитина и до Приключений Капитана Врунгеля ⛵🐳
Интернет набит данными, но очень немногие датасеты сделаны гуманитариями и для гуманитариев. Собрал пять чисто гуманитарных источников данных, которые хорошо использовать в курсе анализа данных или программирования на DH-программах.
🎭 1. DraCor — корпуса и датасеты вокруг драматических текстов (с уклоном в network analysis, но не только). Один из очень немногих проектов, сумевших на базе “гуманитарного” стандарта TEI построить классную экосистему гуманитарных данных. Самые приятные данные дракора — это метаданные для каждого корпуса, которые вы можете скачать прямо на страничке корпуса, например, вот табличка для русского корпуса: https://dracor.org/api/v1/corpora/rus/metadata/csv Тут и классические метаданые вроде дат написания и публикации, и сетевые вроде плотности социальной сети в пьесе, и например соотношение мужской и женской речи…
Еще для каждой отдельной пьесы можно скачать сетевые данные (в gexf/csv/gml), речь персонажей, сценические ремарки… Ну и полную разметку в TEI, из которой все эти данные произрастают.
✒️ 2. Репозиторий открытых данных по русской литературе и фольклору — проект Цифровой лабы Пушкинского дома (ИРЛИ РАН), где цифровые филологи и не только публикуют датасеты и (иногда) код к своим исследованиям. Своего рода гуманитарный papers with code. Вот, например, данные и код к статье Кирилла Маслинского о том, какие животные чаще встречаются в каких жанрах детской литературе.
А еще там публикует новые датасеты сам ПушДом. Многие из них называются очень романтично. Скажем, Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)… Датасет с таким названием нужно обрабатывать под звуки романса “Отцвели уж давно хризантемы в саду”🍂
📚 3. European Literary Text Collection (ELTeC) — корпуса европейских романов, собранные с прицелом на репрезентативность и сопоставимость друг с другом. Целью было найти для каждой европейской литературы по 100 романов в диапазоне 1840-1920, чтобы они покрывали период более-менее равномерно, чтобы были представлены не только писатели-мужчины, чтобы бли длиной не менее 10000 слов и т.д. Не для всех корпусов это удалось, а русский корпус там совсем странный, но тем не менее — одна из немногих попыток сделать датасет, пригодный для “компаративистики” by design.
🏛 4. Госкаталог Музейного фонда РФ —
🗺 5. Геоданные DHCLOUD. Тут лежат литературные карты в geojson, сделанные студентами гуманитарного факультета Вышки под руководством Бориса Орехова. Картографированы самые разные тексты: от маршрута Афанасия Никитина и до Приключений Капитана Врунгеля ⛵🐳
dracor.org
DraCor – Open Infrastructure for Drama Analysis
DraCor, the Drama Corpora Project, is an open infrastructure that enables computational analysis of more than 4,000 dramatic texts from Greco-Roman antiquity to the 20th century, encoded in TEI and organised in different corpora. DraCor revolves around an…
❤10🔥3
Forwarded from Antibarbari HSE (Olga Alieva)
Екатерина Демидова (ОП “Филология”),
Татьяна Крюкова (ОП “Античность”),
Александр Семенов (ОП “История”),
Мария Худошина (ОП “Филология”),
Денис Манаков (ОП “Философия”),
Вероника Пушкина (ОП “Филология”),
Тимур Саев (ОП “Философия”),
Ульяна Афанасьева (ОП “История”),
Мария Шелкова (ОП “Философия”).
Руководитель проекта: доцент Школы философии и культурологии Ольга Алиева @rantiquity.
За помощь в редактуре и корректуре благодарим Полину Крупинину (ОП “Доказательное развитие образования”).
Поддержите нас лайками и репостами, мы
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥7🔥7❤3👏1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤4🔥1
Как правильно спрятать чатжипити в вашей курсовой. Советует умная собачка Соня.
YouTube
Умная собачка Соня. Мультфильм (1991)
Рисованный мультфильм о забавной собачке Соне, которая, попадая в сложные ситуации, делала для себя поучительные выводы.
В одном городе жила-была маленькая, но очень умная собачка Соня. У нее был хозяин, которого завали Иван Иванович Королев. Наверное…
В одном городе жила-была маленькая, но очень умная собачка Соня. У нее был хозяин, которого завали Иван Иванович Королев. Наверное…
😁6🐳4❤3🌚1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥5👍4🥰1🍓1💘1
"Цифровой поворот" для гуманитарных наук: вызов или проблема? Что скрывается за "цифровым поворотом" в гуманитарных науках? Могут ли цифровые технологии полностью изменить наши представления о "ремесле историка"? Отличается ли квантитативная история от цифровой? Об этом и о многом другом мы поговорим в очередном выпуске нашего подкаста.
Please open Telegram to view this post
VIEW IN TELEGRAM
Яндекс Музыка
Нужна ли гуманитариям "цифра"? Исторические иссл...
❤11👍4💘4🤗1
Вместе с Иваном Бибиловым — соруководителем программы прикладного анализа данных (ПАНДАН), директором Прикладного центра машинного обучения, анализа данных и статистики (ПЦ МАСТ) в ЕУСПб — смотрим с высоты на стремительно меняющийся ландшафт технических инструментов.
Языки программирования становятся более декларативными и высокоуровневыми, что делает их доступными для широкого круга пользователей. Кроме того, машина уже способна «понимать» не только письменную, но и устную речь, и преобразовывать ее в необходимую функцию. Значит ли это, что концепция «второй (т.е. цифровой) грамотности» устарела? Уже сегодня для решения многих задач достаточно написать промпт на привычном нам языке — так зачем вообще программировать?
Встречу провела доцент Школы философии и культурологии, преподаватель магистерской программы "Цифровые методы в гуманитарных науках" Ольга Алиева @rantiquity .
Скоро вернемся с анонсом следующей лекции.
#criticaldh #курсы #магистратура
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
И.В. Бибилов (ЕУСПб). Избранные главы информатики. Исследовательский мультитул
Третья лекция курса "Количественные методы в гуманитарных науках: критическое введение" (2024, НИУ ВШЭ). Сайт курса: http://criticaldh.ru/
❤10❤🔥4🔥2👾2
Можно просто угадывать. Это очень сложно.
Можно смотреть подсказки. Это очень легко.
А можно скачать весь датасет в формате csv и посчитать lege artis. Это очень правильно 🤓
Please open Telegram to view this post
VIEW IN TELEGRAM
agricolamz.github.io
Следующая остановка: Библиотека им. …
❤9