RAntiquity – Telegram

RAntiquity

1.1K subscribers

298 photos

11 videos

5 files

552 links

Об античности на языке R и не только

@locusclassicus

Download Telegram

About

Blog

Apps

Platform

1.1K subscribers

Интересное наблюдение про округление в R. На практике часто не так важно, как происходит округление, главное, чтобы это было последовательно. Но если нужно именно математическое округление, то вот есть полезный пакетик scrutiny. Позволяет идти вверх или вниз…

Вот кстати интересное объяснение. В духе Зеноновых апорий вполне, про бесконечную делимость.

The logic behind the round to even rule is that we are trying to represent an underlying continuous value and if x comes from a truly continuous distribution, then the probability that x==2.5 is 0 and the 2.5 was probably already rounded once from any values between 2.45 and 2.54999999999999

И еще они советуют просто умножить на 10^n, посчитать, а потом разделить обратно. Но наверняка есть какое-то объяснение с точки зрения эволюционной биологии, почему так никто не делает.

upd. Т.е. логика такая. В мире бесконечной делимости все неопределенно. И округлять тоже надо неопределенно, иногда в большую сторону, иногда в меньшую. Получится как раз примерно как “есть” (хотя глагол “быть” в мире бесконечной делимости, конечно, не работает — привет “текучникам” из “Теэтета”). Очень изящно.

Rounding in R: Common Data Wrangling Frustrations and Workarounds in R, Julia, and Python

Maths, Rounding, Decimals! Enter the messy world of rounding in R and other languages.

👍1

467 viewsOlga Alieva, edited 13:01

Пока вы думали, не построить ли социальную сеть из “Людей Платона”, тама уже все сделали. Эксель для желающих поиграть с датасетом прилагается по ссылке. #network #сети #платон

Решила вернуться к гарвардскому датасету о людях Сократа, хочу его использовать для “сетевых” глав курса по R, которые я сейчас перерабатываю.

C удивлением обнаружила, что датасет достаточно неряшливый.

- неоднобразно оформлены ссылки на некоторые источники (например, диалог "Менон" упоминается то как Meno, то как M.).

- не очень хорошо продумана онтология отношений с Сократом: inner circle, friends, students и даже просто philosophers смешались в кучу; это неизбежно, конечно, но непонятно, почему Аристипп и, например, Антисфен — в разных категориях.

- Есть прямые ошибки и опечатки. Например, Менексен II (сын Сократа) связан с Ктесиппом — это явно ошибка, должен быть Менексен I.

- В “Федоне” нет не только стражника и сердобольного прислужника, у которых по реплике, но и Платона; допустим, о нем говорится как об отсутствующем, но при этом другие отсутствующие люди (Эвен) все же в данных есть;

- Немного огорчает, что для ребер нет никаких атрибутов, которые бы обозначали характер связи персонажей между собой, а не только с Сократом; интересно при этом, что в статье по мотивам датасета (пример из Ксенофонта) эти атрибуты упомянуты, то есть изначально они где-то собирались. Возможно, их просто решили не публиковать.

Посмотрим, что получится из этого соорудить.

research-bulletin.chs.harvard.edu

The Social Network of Socrates – Research Bulletin

Dedicated to the work of fellows at the Center for Hellenic Studies

🔥11❤1🤔1

513 viewsOlga Alieva, edited 20:20

Я тут завела плейлист с занятиями по R у магистров, пока там первые две записи, это четыре пары. Так что желающие могут идти вместе с нами: https://vk.com/video/playlist/91786643_1 Курс, с одной стороны, опирается на то, что я делала в прошлом году, но за…

➖ Плохая новость в том, что часть занятия #tar2024 по ggplot вчера не записалась из-за разного полтергейста.

➕ Но в этом есть плюс: по ходу занятия поняла, что несколько сюжетов можно изложить более элегантно, буду переделывать.

➖

➖

➖

➖

➖

➖

➕ Хорошая новость в том, что пакет ggcheck действительно позволяет автоматически проверять графики, и я только что настроила 8 разных тестов.

➖ Но есть и минус: он не умеет проверять шрифты и шкалы.

➖

➖

➖

➖

➖

➖

➖ Плохая новость в том, что датасет с людьми Сократа все же никуда не годится. О чем я напишу потом подробнее, потому что это очень поучительная истории для всех, кто собирает данные.

➕ Хорошая новость в том, что вместо людей Сократа для сетевого анализа я нашла Тюдоров.

➖

➖

➖

➖

➖

➖

Это все новости из мира бинарных оппозиций.

Please open Telegram to view this post

VIEW IN TELEGRAM

rstudio.github.io

Inspect ggplot2 Plots for Automated Grading in Learning Exercises

ggcheck provides functions that inspect ggplot2 objects
to make it easier for teachers to check that student plots meet
expectations. Designed primarily for automated grading via gradethis
in interactive learnr tutorials.

❤5👍2

455 viewsOlga Alieva, edited 07:33

Вообще я уже в стопицотый раз (sexcenties, как говорит мой любимый Штальбаум) перерабатываю первые уроки курса, хотя последние еще и не начинала. Все это напоминает известный мем про недорисованную лошадь. Возникает закономерный вопрос: кто же рисует лошадь с хвоста?

🥰9❤2👍1😁1💔1

516 viewsOlga Alieva, edited 07:44

Вероятно, многие уже знают про прекрасный проект Orbis, позволяющий рассчитать (в днях и в денариях) пусть из города А в город Б в Римской империи. https://orbis.stanford.edu/

Например, в летний день из Кесарии Каппадокийской в Константинополь ехать ~~на ослике~~ 25 дней, почти 1000 км. Ни моря, ни рек на маршруте, пыльно и грустно.

Самое приятное, что для этого проекта все данные есть в открытом доступе: их можно забрать по ссылке и использовать для пространственного / сетевого анализа (что я и намерена сделать в ближайшее время) в рамках проекта ~~“помоги ежику найти свой домик”~~ “помоги епископу добраться до собора”

purl.stanford.edu

ORBIS (v2) Network Edge and Node Tables

ORBIS is a multimodal, seasonally variable transportation network model available at orbis.stanford.edu. The model provides for practically unlimited permutations by allowing users to limit modes, ...

👏7👍3

2.55K viewsOlga Alieva, edited 15:59

Вероятно, многие уже знают про прекрасный проект Orbis, позволяющий рассчитать (в днях и в денариях) пусть из города А в город Б в Римской империи. https://orbis.stanford.edu/ Например, в летний день из Кесарии Каппадокийской в Константинополь ехать на…

❤8

477 viewsOlga Alieva, 16:00

Вероятно, многие уже знают про прекрасный проект Orbis, позволяющий рассчитать (в днях и в денариях) пусть из города А в город Б в Римской империи. https://orbis.stanford.edu/ Например, в летний день из Кесарии Каппадокийской в Константинополь ехать на…

За проезд не забываем передавать! — У Лондиниума остановите, пожалуйста!

данные: orbis
графика: ggplot
палитра: brutal

#цифровые_этюды #spatial_data

❤8

598 viewsOlga Alieva, edited 14:37

За проезд не забываем передавать! — У Лондиниума остановите, пожалуйста! данные: orbis графика: ggplot палитра: brutal #цифровые_этюды #spatial_data

кстати, после нескольких дней возни с картографическими проекциями, должна сказать, что вместе с дарвином пусть тогда уж забирают круглую землю. я согласна на плоскую 🐢🐘🐘🐘

😁16

456 viewsOlga Alieva, edited 14:37

Сегодня читали Эразма под руководством Мары Тимощук @thalatta_thalassa. Это был прекрасный семинар на живой латыни, но пост не об этом.

Есть такой датасет “Словарь русских писателей XVIII века: сеть персоналий” Это прекрасный датасет, подготовленный Борисом Ореховым @nevmenandr, но пост тоже не об этом.

Там собраны междустатейные ссылки в Словаре русских писателей XVIII века (1988–2010. Вып. 1–3). Узлами сети выступают посвященные персоналиям статьи словаря, а ребрами — ссылки на другие статьи в том же словаре. Но сейчас речь не об этом.

И вот, там 780 персоналий, и все они друг с другом как-то связаны. Но есть две странные изолированные пары.

Стало мне интересно, что это за несчастные, на которых ни одна статья не ссылается и их статьи тоже ни с кем не связаны.

Оказалось, что один из них -- Иоганн-Вернер Паузе, переводчик Эразма и Яна Коменского на русский. Вот о нем я и хотела написать.

❤15😁4

574 viewsOlga Alieva, edited 19:07

Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров.

данные: римские амфитеатры
графика: tmap

#цифровые_этюды #spatial_data

👍4

518 viewsOlga Alieva, 15:57

Forwarded from HSE R Meet Up

Всем привет!

Мы рады сообщить о запуске проекта HSE R Meet Up! Это пространство для обмена знаниями и опытом в мире анализа данных с использованием языка R. Наша цель — создать сообщество, где каждый сможет углубить свои навыки в data science, обсудить прикладные вопросы и новинки из этой области, а также найти единомышленников.

🔍 Что вас ждет?
- Мастер-классы от экспертов по разным методам анализа данных.
- Совместное решение и обсуждение реальных кейсов.
- Возможность делиться своими проектами и получать обратную связь.

Мы встречаемся как в очном формате, так и онлайн в Москве, Санкт-Петербурге и Перми.

В этом Telegram-канале мы будем публиковать анонсы мероприятий и всю актуальную информацию.

Let's RMeetUp ~ 🚀

❤9❤‍🔥4👍1

532 viewsOlga Alieva, 19:39

library(imager)
img <- load.image("https://upload.wikimedia.org/wikipedia/commons/thumb/a/ae/Aristotle_Altemps_Inv8575.jpg/1024px-Aristotle_Altemps_Inv8575.jpg")


# цветовые каналы
ar.red <- img
G(ar.red) <- 0
B(ar.red) <- 0

ar.blue <- img
R(ar.blue) <- 0
G(ar.blue) <- 0

ar.green <- img
R(ar.green) <- 0
B(ar.green) <- 0

ar.yellow <- img
B(ar.yellow) <- 0


library(purrr)
par(mfrow = c(2,2))
walk(list(ar.red, ar.blue, ar.green, ar.yellow), plot, 
     axes=FALSE)

#images #цифровые_этюды

👾5🔥3

580 viewsOlga Alieva, edited 03:41

Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров. данные: римские амфитеатры графика: tmap #цифровые_этюды #spatial_data

В общем, объяснение нашлось, и это не ошибка в сборе данных.

By comparison with the West, there are far fewer purpose-built amphitheaters known in the eastern Roman provinces. This has been traditionally explained by the idea that the Greek East was more “civilized” than Italy and the Western Provinces, and therefore would not have indulged in the kind of blood sports these structures accommodated.

Греки не любили, значит, мордобой, им новые сезоны нетфликс не заходили. Уважаю.

'Amphitheater' published in 'Encyclopedia of Global Archaeology'

❤8😁5👍3🕊1

637 viewsOlga Alieva, edited 13:38

Forwarded from Antibarbari HSE (полина крупинина)

📘В свежем выпуске журнала "Философия. Журнал Высшей школы экономики" вышла статья нашего редактора Ольги Алиевой "Pseudoplatonica: блеск и нищета стилометрии”.

🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?

🔎Почему количественные методы атрибуции авторства не могут достоверно установить, какие тексты считать подлинными?

🔎Достаточно ли "аномальной" статистики для того, чтобы усомниться в авторстве диалога?

Обо всем этом✨с картинками✨читайте по ссылке.

❤‍🔥10

641 viewsOlga Alieva, 06:26

Antibarbari HSE

📘В свежем выпуске журнала "Философия. Журнал Высшей школы экономики" вышла статья нашего редактора Ольги Алиевой "Pseudoplatonica: блеск и нищета стилометрии”. 🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?…

Я очень довольна этим текстом. Он емкий и внятный. Будет еще один в серии, как только я доведу до ума курс по R.

Antibarbari HSE

⚡ В свежих "Платоновских исследованиях" читайте статью Ольги Алиевой "Новая количественная модель Платоновского корпуса 1: Pseudoplatonica: проблемы происхождения и датировки"

Под влиянием филологической критики XIX в. диалоги из числа dubia и spuria долгое…

❤10🔥4

791 viewsOlga Alieva, 06:32

Отличный ресурс. Есть греческий и латынь, включая средневековье.

The CLARIN infrastructure offers access to 76 historical corpora, covering almost all of the languages spoken in countries that are either members or observers in CLARIN ERIC. In the vast majority of cases, the corpora can be directly downloaded from the national repositories or queried through easy-to-use online search environments. They are also richly tagged and mostly available under public licences.

❤8

702 viewsOlga Alieva, 07:24

Отличный ресурс. Есть греческий и латынь, включая средневековье. The CLARIN infrastructure offers access to 76 historical corpora, covering almost all of the languages spoken in countries that are either members or observers in CLARIN ERIC. In the vast…

Оказалось при этом, что латинский корпус от II до н.э. до XX н.э. хранится там в формате “вертикальный корпус”, странная история для хранения корпусов в Sketch Engine. Это и не html, и не xml, и вообще не пойми что, что безболезненно прочитать в R не получится.

Так что суббота проходит в попытке написать сложный парсер, который превратит эту штуковину на 13 млн токенов в дружелюбный тиббл. Есть даже парочка идей, как его потом использовать.

Our metadata cover author, title of the work, genre (prose or poetry), era, date of the work (when available), and century. The oldest text in our corpus are the Senatus consulta de Baccanalibus (186 B. C.), and the most recent one is Dominus Iesus (2000), by the Vatican Congregation for the Doctrine of the Faith.

🤯3❤1👍1

744 viewsOlga Alieva, edited 12:46

Недавно обратила внимание, что в замечательной, в общем-то, книжке Эмиля нашего Хвитфельдта и Джулии нашей Силги (про машинное обучение для текстовых данных) выражение let’s встречается в среднем 1-3 раза на разворот.

Давайте построим нашу первую линейную модель! Давайте добавим токенизацию в препроцессор! Давайте изменим штрафные коэффициенты гребневой регрессии!

Давайте! Мне все это очень нравится. Последний раз я читала книжки с таким количеством призывов к действию, когда дети были маленькие, и их литература постоянно побуждала нас всех спеть песенку! похлопать в ладошки! помочь ежику добраться до домика!

Теперь мне 40 лет, и такое чувство, что я на месте младенца. Куда нажать, чтобы включилась поощрительная музыка?

🥰18❤7🔥5👍1

629 viewsOlga Alieva, edited 12:19

Forwarded from Antibarbari HSE (Olga Alieva)

🪩 15 октября в НГУ состоится “Школа молодого антиковеда”.

🪲 Для получения онлайн-ссылки на подключение необходимо заранее зарегистрироваться здесь.

💎 Для участия в дистанционном мастер-классе О. В. Алиевой необходимо заранее установить R & RStudio (или зарегистрироваться в облаке Posit). Инструкция, как это сделать, здесь.

🦕 Будем рады видеть друзей-антиковедов, молодых и не очень!

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥12❤‍🔥2❤1

586 viewsOlga Alieva, 13:21

Очень интересный эксперимент (2023) по датировке греческих документальных папирусов с использованием регрессионных методов (GitHub).

Многое скажет сердцу эллиниста табличка, в которой приведены правила нормализации греческого текста.

Результат неплохой, надо бы попробовать повторить.

🔥7👏2

691 viewsOlga Alieva, edited 17:09

Не совсем моя тема, но интересно как пример использования нейросетей в антиковедении. Автоматическая классификация римских монет (код, модель, датасет по ссылке). Красивое.

P.S. Вот здесь группа товарищей тоже классифицирует римские монетки и делится данными, но там что-то связанное с теорией игр.

🔥13👏1

684 viewsOlga Alieva, 05:17