Forwarded from ⅁ garage.digital
Веб-скрейпинг — это техники, позволяющие автоматически выгрузить контент с чужих сайтов. Медиа-художник и активист Сэм Лавин написал Манифест скрейпизма — то есть сбора данных как художественной и активисткой практики, а не инструмента слежки и контроля.
В каком-то смысле интернет был создан для скрейпинга. В 90-х все сайты были статичными HTML-страницами, и сервер просто передавал копию страницы на пользовательский компьютер. При этом у протокола HTTP, через который происходила эта передача, не существовало индекса всех веб-страниц — но зато можно было делать перекрестные гиперссылки. Первые алгоритмы для скрейпинга, или краулеры, просто переходили по этим ссылкам и сохраняли содержимое каждой страницы; примерно так устроены, например, поисковые движки типа Google.
С развитием интернета сайты из статичных страниц превратились в базы данных. Пользователи могут обращаться к ним посредством внешних интерфейсов, но доступа ко всем данным у них нет. И в этом есть своеобразная ирония, пишет Лавин, ведь зачастую в этих базах данных хранятся данные о нас самих. У соцсетей есть подробное досье на каждого пользователя — включая даже данные о паттернах пользовательского поведения. Как часто вы берете такси в Uber? Чьи сториз вам нравятся больше всего в Instagram? Чем больше платформы знают о нас, тем с большей успешностью они коммодифицируют наш повседневный опыт — и тем больше на нас зарабатывают.
Скрейпизм — это деприватизация данных, которые забрали себе корпорации. Существуют всевозможные способы обмануть интерфейсы, защищающие корпоративные данные — и выкачать их, чтобы снова сделать общим достоянием. Информация, как писала МакКензи Уорк, не знает дефицита — его искусственно создают власть имущие. Цель скрейпизма — этот дефицит снова уничтожить, восстановив естественное состояние информационных потоков.
Лавин выделяет три типа скрейпизма:
/1/ политическая интервенция — например, его проект, в котором боты кликали на рекламу в новостях, связанных с изменениями климата, чтобы искусственно повысить их видимость и монетизируемость
/2/ публичный архив — просто украсть файлы из закрытой базы данных и выложить в открытый доступ (любой пиратский сервис — например, Library Genesis)
/3/ активированный архив — не только сбор данных, но еще и обучение нейросетей на них. Государства используют такие техники для «предсказания» преступлений; Лавин же в другом своем проекте предлагает использовать то же самое против «белых воротничков» для предсказания финансовых преступлений. Пусть наиболее защищенные слои населения почувствуют, каково это.
Мы оставляем следы, которые корпорации и государства используют против нас. Но власть имущие, как напоминает Лавин, тоже оставляют следы — и их можно использовать против них.
В каком-то смысле интернет был создан для скрейпинга. В 90-х все сайты были статичными HTML-страницами, и сервер просто передавал копию страницы на пользовательский компьютер. При этом у протокола HTTP, через который происходила эта передача, не существовало индекса всех веб-страниц — но зато можно было делать перекрестные гиперссылки. Первые алгоритмы для скрейпинга, или краулеры, просто переходили по этим ссылкам и сохраняли содержимое каждой страницы; примерно так устроены, например, поисковые движки типа Google.
С развитием интернета сайты из статичных страниц превратились в базы данных. Пользователи могут обращаться к ним посредством внешних интерфейсов, но доступа ко всем данным у них нет. И в этом есть своеобразная ирония, пишет Лавин, ведь зачастую в этих базах данных хранятся данные о нас самих. У соцсетей есть подробное досье на каждого пользователя — включая даже данные о паттернах пользовательского поведения. Как часто вы берете такси в Uber? Чьи сториз вам нравятся больше всего в Instagram? Чем больше платформы знают о нас, тем с большей успешностью они коммодифицируют наш повседневный опыт — и тем больше на нас зарабатывают.
Скрейпизм — это деприватизация данных, которые забрали себе корпорации. Существуют всевозможные способы обмануть интерфейсы, защищающие корпоративные данные — и выкачать их, чтобы снова сделать общим достоянием. Информация, как писала МакКензи Уорк, не знает дефицита — его искусственно создают власть имущие. Цель скрейпизма — этот дефицит снова уничтожить, восстановив естественное состояние информационных потоков.
Лавин выделяет три типа скрейпизма:
/1/ политическая интервенция — например, его проект, в котором боты кликали на рекламу в новостях, связанных с изменениями климата, чтобы искусственно повысить их видимость и монетизируемость
/2/ публичный архив — просто украсть файлы из закрытой базы данных и выложить в открытый доступ (любой пиратский сервис — например, Library Genesis)
/3/ активированный архив — не только сбор данных, но еще и обучение нейросетей на них. Государства используют такие техники для «предсказания» преступлений; Лавин же в другом своем проекте предлагает использовать то же самое против «белых воротничков» для предсказания финансовых преступлений. Пусть наиболее защищенные слои населения почувствуют, каково это.
Мы оставляем следы, которые корпорации и государства используют против нас. Но власть имущие, как напоминает Лавин, тоже оставляют следы — и их можно использовать против них.
🤔2❤🔥1
Forwarded from Центр STS
🦾 Reddit, биохакеры и этнография пользователей
На следующей неделе, 24 и 25 февраля, в рамках совместного цикла ЕУСПб и Ельцин-центра «Наука и технологии: за или против?» состоятся сразу две заключительные лекции научного сотрудника Центра STS, Кирилла Петрова.
Сегодня сложно найти сферы, не затронутые развитием технонауки. Особенно чувствительные трансформации связаны с технологическими инновациями, которые непосредственно затрагивают человеческие представления о самом себе. Например, криозаморозка ооцитов показывает, как трудно сегодня провести границу между человеческим телом и лабораторией, а открытия в нейрофизиологии ставят под сомнение свободу воли. Это вызывает опасения, что технологии могут стать инструментом «порабощения» человека. Подобная мифология порождает движения сопротивления, объединенные стремлением «взломать» и заново приручить существующие технологии. Одним из наиболее известных направлений в этом ряду являются «биохакеры».
На первой лекции, рассмотрев кейс пользователей устройств микрополяризации мозга на платформе Reddit, мы попытаемся выяснить, как устроено сообщество биохакеров, как их деятельность пересекается работой профессиональных ученых, и зачем им вообще нужен улучшенный мозг.
🕖 24 февраля, 18:00
📍 Ельцин-центр, Образовательный центр
🎟️ Регистрация
На следующей неделе, 24 и 25 февраля, в рамках совместного цикла ЕУСПб и Ельцин-центра «Наука и технологии: за или против?» состоятся сразу две заключительные лекции научного сотрудника Центра STS, Кирилла Петрова.
Сегодня сложно найти сферы, не затронутые развитием технонауки. Особенно чувствительные трансформации связаны с технологическими инновациями, которые непосредственно затрагивают человеческие представления о самом себе. Например, криозаморозка ооцитов показывает, как трудно сегодня провести границу между человеческим телом и лабораторией, а открытия в нейрофизиологии ставят под сомнение свободу воли. Это вызывает опасения, что технологии могут стать инструментом «порабощения» человека. Подобная мифология порождает движения сопротивления, объединенные стремлением «взломать» и заново приручить существующие технологии. Одним из наиболее известных направлений в этом ряду являются «биохакеры».
На первой лекции, рассмотрев кейс пользователей устройств микрополяризации мозга на платформе Reddit, мы попытаемся выяснить, как устроено сообщество биохакеров, как их деятельность пересекается работой профессиональных ученых, и зачем им вообще нужен улучшенный мозг.
🕖 24 февраля, 18:00
📍 Ельцин-центр, Образовательный центр
🎟️ Регистрация
Ельцин Центр
Кирилл Петров. Этнография пользователей: как участники сообщества reddit улучшают свой мозг
Третья лекция совместного цикла Ельцин Центра и ЕУСПб «Наука и технологии: за или против?»
🔥1
Forwarded from Netflix в сфере образования
Сегодня был в музее с аудиогидом — снова задумался про клиентский опыт. Культура не образование, но близко
Вся выставка — 2 небольших зала про изделия из стекла (угадайте город!). Экспонаты в витрине, рассматривать вроде бы можно со всех сторон. Всего 19 точек аудиогида, самих экспонатов чуть больше. И литографии, развешанные по стенам
Тема прикольная, а экспонаты крутые
Но аудиогид сделан на отвали
🚫 3 минуты посетителя маринуют приветственной речью прямо у входной двери
🚫 у каждого экспоната также нужно проводить до 5 минут, стоя на месте
🚫 аудиогид часто пересказывает текст экспликации. Читать это быстрее, чем слушать
Я не знаю контекста создания выставки. Не знаю сроков и задач
Но что я бы хотел как посетитель
✅ аудиогид толкает к действиям: изучить с разных сторон под разными углами, присмотреться к деталям
✅ в продолжение — аудиогид задаёт динамику. Посетитель не безучастный слушатель, он работает с пространством
✅ аудиогид даёт уникальную информацию. Причём, не только вербально — саунд-дизайн и звуковые эффекты эпохи в помощь
Критиковать легко. И в музеях я всегда вспоминаю лучшие примеры выставок. Но блин, всегда обидно за нераскрытый потенциал
Вся выставка — 2 небольших зала про изделия из стекла (угадайте город!). Экспонаты в витрине, рассматривать вроде бы можно со всех сторон. Всего 19 точек аудиогида, самих экспонатов чуть больше. И литографии, развешанные по стенам
Тема прикольная, а экспонаты крутые
Но аудиогид сделан на отвали
Я не знаю контекста создания выставки. Не знаю сроков и задач
Но что я бы хотел как посетитель
Критиковать легко. И в музеях я всегда вспоминаю лучшие примеры выставок. Но блин, всегда обидно за нераскрытый потенциал
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
просто годный текст про эйай и чтение
https://d37zoqglehb9o7.cloudfront.net/uploads/2020/09/001_Aesthetics-of-New-AI.pdf
https://d37zoqglehb9o7.cloudfront.net/uploads/2020/09/001_Aesthetics-of-New-AI.pdf
Forwarded from настенька и графики
Прислали очень интересный инструмент – InfraNodus, в котором можно строить сети по текстам. Не бесплатно, но первый раз вижу, чтобы по сырому тексту строили такие вещи без программирования.
Например, на картинке визуализаций текстов по запросу “data visualization tools” в гугле.
Про текстовый анализ: раз, два, три и неплохая подборка тулов для текстового анализа
Например, на картинке визуализаций текстов по запросу “data visualization tools” в гугле.
Про текстовый анализ: раз, два, три и неплохая подборка тулов для текстового анализа
❤4💘1
Forwarded from БЛОКНОТ ФИЛОСОФА
Конференция пройдет с 18 по 21 апреля в Шанинке. Общая тема «Векторов» этого года — «Преодолевая границы». Поиски истины и решений научных проблем невозможны без расширения граней реальности, преодоления, которое позволяет воображать и мыслить будущее, проверять пригодность старых методов и испытывать новые технологии для актуализации картины мира внутри и за пределами академии.
На конференции будут представлены секции по шести тематическим направлениям:
#callforpapers #дляпортфолио
Please open Telegram to view this post
VIEW IN TELEGRAM
II научная конференция "Свет и тени цифровой реальности"
Наши коллеги из Перми запустили open call для DH-специалистов и всех, кто исследует автономию современной техники.
К обсуждению предлагаются следующие темы:
📺 искусственный интеллект как соавтор;
📺 телесность искусственных органов;
📺 виртуальная реальность как отражение общества.
В конференции можно участвовать офлайн и онлайн. Лучшие доклады будут рекомендованы для публикации в журнале «Вестник Пермского университета. Философия. Психология. Социология».
Требуется регистрация по ссылке.
Дедлайн заявок: 1 марта 2024.
Дата конференции: 22 марта 2024 года
Подробности и детали — в письме по ссылке.
Также с вопросами можно обратиться к организатору:
Внутских Александр Юрьевич,
телефон: 8-922-301-7459 .
почта: avnut@inbox.ru
Приходите обсудить свои наработки с друзьями DH-центра!
Наши коллеги из Перми запустили open call для DH-специалистов и всех, кто исследует автономию современной техники.
К обсуждению предлагаются следующие темы:
В конференции можно участвовать офлайн и онлайн. Лучшие доклады будут рекомендованы для публикации в журнале «Вестник Пермского университета. Философия. Психология. Социология».
Требуется регистрация по ссылке.
Дедлайн заявок: 1 марта 2024.
Дата конференции: 22 марта 2024 года
Подробности и детали — в письме по ссылке.
Также с вопросами можно обратиться к организатору:
Внутских Александр Юрьевич,
телефон: 8-922-301-7459 .
почта: avnut@inbox.ru
Приходите обсудить свои наработки с друзьями DH-центра!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3
Философская студенческая конференция в СПбГУ 1–2 марта
В пятницу и субботу пройдёт конференция «Философия как традиция и ценность». Коллеги в СПБГУ так же, как и мы, критически изучают антропоцен и новые отношения с техникой.
Вас ждут 90 докладов молодых учёных со всей России, а также три выступления специалистов в междисциплинарной философии: профессора кафедры философии науки и техники Л.В. Шиповаловой, доцента кафедры философской антропологии И.Ю. Ларионова и профессора кафедры логики Е.Н. Лисанюк.
В конце второго дня конференции на большой Студенческой Ярмарке пройдёт нетворкинг с коллегами-философами. Там можно будет поучаствовать в конкурсе на лучшую сверхинтерпретацию. Будет весело!
♾ Когда: 1-2 марта, пятница-суббота.
♾ Где: Менделеевская линия, 5
♾ Программа — в анонсе по ссылке.
♾ Регистрация — через виджет ВКонтакте.
В пятницу и субботу пройдёт конференция «Философия как традиция и ценность». Коллеги в СПБГУ так же, как и мы, критически изучают антропоцен и новые отношения с техникой.
Вас ждут 90 докладов молодых учёных со всей России, а также три выступления специалистов в междисциплинарной философии: профессора кафедры философии науки и техники Л.В. Шиповаловой, доцента кафедры философской антропологии И.Ю. Ларионова и профессора кафедры логики Е.Н. Лисанюк.
В конце второго дня конференции на большой Студенческой Ярмарке пройдёт нетворкинг с коллегами-философами. Там можно будет поучаствовать в конкурсе на лучшую сверхинтерпретацию. Будет весело!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6✍1🐳1
Два канала о конференциях 📎
Мы наблюдаем за публикациями в каналах Философская афиша Петербурга и Философская афиша Москвы.
В них можно узнать актуальную информацию о ридинг-группах, семинарах, лекциях, киноклубах, опен-коллах на конференции, причем не только философской тематики, но и исторической, культурологической и STS. Через канал вы познакомитесь с новыми площадками для собственных мероприятий и выступлений.
📌 Философская афиша также сотрудничает с конференцией DH-центра «Гуманитарные проблемы актуальных наук: цифровая дисциплина и проект», которая пройдет 15–17 апреля. Успейте подать свои тезисы до 1 марта и следите за новыми опен-коллами в афише!
Мы наблюдаем за публикациями в каналах Философская афиша Петербурга и Философская афиша Москвы.
В них можно узнать актуальную информацию о ридинг-группах, семинарах, лекциях, киноклубах, опен-коллах на конференции, причем не только философской тематики, но и исторической, культурологической и STS. Через канал вы познакомитесь с новыми площадками для собственных мероприятий и выступлений.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Forwarded from Центр STS
🔛 Call for Papers: Векторы-2024
С 18 по 21 апреля в Шанинке пройдет ежегодная международная научная конференция «Векторы-2024».
Общая тема «Векторов» этого года — «Преодолевая границы». Поиски истины и решений научных проблем
не возможны без расширения граней реальности, преодоления, которое позволяет воображать и мыслить будущее, проверять пригодность старых методов и испытывать новые технологии для актуализации картины мира внутри и за пределами академии. Общая тема является рамочной для конференции: она не определяет содержания отдельных секций,
но устанавливает общий интеллектуальный вектор дискуссии.
Для регистрации доступно большое количество секций, затрагивающих в том числе проблемное поле STS:
- Бес/порядки текста;
- Game studies;
- Антропология воображения;
- Образовательная урбанистика;
- Энвайронментализм и экокритицизм;
- (Критичекие) исследования животных.
Это лишь малый список того, что может заинтресовать!
❗️Дедлайн подачи заявок на конференцию — 19 марта
С 18 по 21 апреля в Шанинке пройдет ежегодная международная научная конференция «Векторы-2024».
Общая тема «Векторов» этого года — «Преодолевая границы». Поиски истины и решений научных проблем
не возможны без расширения граней реальности, преодоления, которое позволяет воображать и мыслить будущее, проверять пригодность старых методов и испытывать новые технологии для актуализации картины мира внутри и за пределами академии. Общая тема является рамочной для конференции: она не определяет содержания отдельных секций,
но устанавливает общий интеллектуальный вектор дискуссии.
Для регистрации доступно большое количество секций, затрагивающих в том числе проблемное поле STS:
- Бес/порядки текста;
- Game studies;
- Антропология воображения;
- Образовательная урбанистика;
- Энвайронментализм и экокритицизм;
- (Критичекие) исследования животных.
Это лишь малый список того, что может заинтресовать!
❗️Дедлайн подачи заявок на конференцию — 19 марта
❤1
В Европейском университете ПАНДАН проводит воркшоп, присоединяйтесь к нам офлайн и онлайн 7 марта 17.00 ⭐️
Существует множество теорий о том, что заставляет человека смеяться. Компьютерные методы помогают заглянуть в природу смеха через сбор большого количества данных из социальных сетей, а также через анализ корпусов и экспериментальных данных.
На нашей мастерской вы узнаете, какие теории комического по-прежнему актуальны и как их пытаются верифицировать компьютерными методами. А затем на практике вы познакомитесь с результатами двух экспериментов и сможете сами поработать с их данными при помощи языка программирования Python.
Мастерскую проводит кандидат филологических наук, магистр прикладной информатики Елена Михалькова.
Программу и регистрацию на мероприятие вы найдете по ссылке ниже.
Существует множество теорий о том, что заставляет человека смеяться. Компьютерные методы помогают заглянуть в природу смеха через сбор большого количества данных из социальных сетей, а также через анализ корпусов и экспериментальных данных.
На нашей мастерской вы узнаете, какие теории комического по-прежнему актуальны и как их пытаются верифицировать компьютерными методами. А затем на практике вы познакомитесь с результатами двух экспериментов и сможете сами поработать с их данными при помощи языка программирования Python.
Мастерскую проводит кандидат филологических наук, магистр прикладной информатики Елена Михалькова.
Программу и регистрацию на мероприятие вы найдете по ссылке ниже.
EUSP
Открытый воркшоп ПАНДАНа «Data Science и природа комического»
Существует множество теорий о том, что заставляет человека смеяться. Компьютерные методы помогают заглянуть в природу смеха через сбор большого количества данных из социальных сетей, а также через анализ корпусов и экспериментальных данных.
Update. 07.03.2024.…
Update. 07.03.2024.…
❤5
Forwarded from ⅁ garage.digital
Мы открываем набор на мастерскую по креативному программированию «Процедурный мир. От случайных блужданий к коллективному разуму»! Ее проведут основатели архитектурной лаборатории SA Lab — Степан Кухарский и Алина Черейская.
Всего будет 6 занятий по полтора часа, каждое из которых раскрывает один из подходов в процедурном дизайне — это когда проектирование происходит не вручную, а с использованием алгоритмов. Сначала участники научатся основам HTML, CSS и JavaScript — и смогут создать собственную интерактивную веб-страницу; а затем они будут осваивать элементы библиотеки p5.js, предназначенной специально для креативного кодинга.
При этом занятия построены по тематическому принципу — они не просто дают сухие технические знания, но раскрывают самые важные элементы сетевой визуальности: случайность, шум, стая, нейроэстетика. На каждом из этих этапов нужно выполнять практические задания: ведущие объясняют самые важные математические концепции на практике. Среди них: псевдослучайность, шум Кена Перлина, методы агентного моделирования и математическое моделирование социальных процесов. А закончится мастерская презентацией итоговых проектов участников: полученных знаний будет достаточно, чтобы сделать что-то свое.
Для участия в курсе опыт программирования не нужен (все расскажут с нуля). Более подробную программу можно посмотреть на нашем сайте. Приходите к нам на занятия — они пройдут в Zoom и на платформе Koodia. Стоимость курса — 12 000 рублей, а абонемент можно купить тут.
Всего будет 6 занятий по полтора часа, каждое из которых раскрывает один из подходов в процедурном дизайне — это когда проектирование происходит не вручную, а с использованием алгоритмов. Сначала участники научатся основам HTML, CSS и JavaScript — и смогут создать собственную интерактивную веб-страницу; а затем они будут осваивать элементы библиотеки p5.js, предназначенной специально для креативного кодинга.
При этом занятия построены по тематическому принципу — они не просто дают сухие технические знания, но раскрывают самые важные элементы сетевой визуальности: случайность, шум, стая, нейроэстетика. На каждом из этих этапов нужно выполнять практические задания: ведущие объясняют самые важные математические концепции на практике. Среди них: псевдослучайность, шум Кена Перлина, методы агентного моделирования и математическое моделирование социальных процесов. А закончится мастерская презентацией итоговых проектов участников: полученных знаний будет достаточно, чтобы сделать что-то свое.
Для участия в курсе опыт программирования не нужен (все расскажут с нуля). Более подробную программу можно посмотреть на нашем сайте. Приходите к нам на занятия — они пройдут в Zoom и на платформе Koodia. Стоимость курса — 12 000 рублей, а абонемент можно купить тут.
❤3
Forwarded from Векторы
Организаторы «Векторов» вместе с Центром практической философии «Стасис» и телеграм-каналом «Тиндер для академиков» организуют круглый стол, посвященный академическим исследованиям новых интимностей, переизобретению любви и дискурсивному порядку близостей.
В круглом столе примут участие
Когда? 15 марта в 18:30
Где? Европейский университет в Санкт-Петербурге и онлайн
Зарегистрируйтесь, если хотите принять участие
За оформление афиши благодарим Наталью Лебедеву
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4❤🔥2🦄1
Forwarded from Anna Kozlova
Друзья, рады поделиться новостью о том, что 20-21 апреля 2024 г. в стенах Европейского университета пройдет первый воркшоп по обработке естественного языка (NLP) «Изучение языкового разнообразия литературных премий». Об инструментах работы с NLP и области их применения расскажут приглашенные эксперты: Эдуард Клышинский (НИУ ВШЭ), Вероника Зыкова (НИУ ВШЭ), Яна Сосновская (ЕУ СПб), Александр Вильховенко (ЕУ СПб).
На основе массива литературных произведений команды участников под руководством кураторов будут работать над своими проектами, первые результаты которых представят во второй день мероприятия. По итогам воркшопа планируется публикация проектов участников.
Ссылка на регистрацию и больше информации о воркшопе по ссылке. Принимаем заявки на участие до 3 апреля включительно, остаемся на связи!
На основе массива литературных произведений команды участников под руководством кураторов будут работать над своими проектами, первые результаты которых представят во второй день мероприятия. По итогам воркшопа планируется публикация проектов участников.
Ссылка на регистрацию и больше информации о воркшопе по ссылке. Принимаем заявки на участие до 3 апреля включительно, остаемся на связи!
❤1
Forwarded from Хард-РОП (Наталья Фенина)
Мы готовы объявить спикеров на ближайшую встречу, на которой поговорим о субъектности студента:
Дата: 5 апреля
Время: 16-00
Ссылка в зум
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
коллеги поделились:
опен-колл для художников на участие в новом выставочном проекте «ИИ: и? Нейронные сети и творческий процесс»
принимают: объекты искусства и дизайна, компьютерные программы
и приложения, звуковые проекты, концепции и тексты, DIY устройства
и технологии, видео (в том числе документацию), инсталляции, смешанные медиа, а также социальные проекты и бизнес-стартапы.
🌚 подать заявку можно до 28 апреля!
https://kholmy.vzmoscow.ru/opencall
опен-колл для художников на участие в новом выставочном проекте «ИИ: и? Нейронные сети и творческий процесс»
принимают: объекты искусства и дизайна, компьютерные программы
и приложения, звуковые проекты, концепции и тексты, DIY устройства
и технологии, видео (в том числе документацию), инсталляции, смешанные медиа, а также социальные проекты и бизнес-стартапы.
https://kholmy.vzmoscow.ru/opencall
Please open Telegram to view this post
VIEW IN TELEGRAM
kholmy.vzmoscow.ru
Open Сall
Участие в выставке «ОльФактор: Ароматы и обоняние в современном искусстве»
❤5
на будущей неделе, сразу после конференции по DH в Петербурге, — перемещаемся в Москву на конференцию «Векторы». она пройдёт в Шанинке с 18 по 21 апреля
в программу «Векторов 2024» вошла 31 секция, посвященные социальным и политическим наукам, философии и антропологии, истории и культурологии, психологии и юриспруденции, а также современным критическим теориям.
подробности о секциях можно найти на сайте конференции.
особо отметим темы 18–19 апреля — Бес/порядки текста: контексты и практики академического письма. расписание этих двух дней — тут.
до встречи в Москве 😎
в программу «Векторов 2024» вошла 31 секция, посвященные социальным и политическим наукам, философии и антропологии, истории и культурологии, психологии и юриспруденции, а также современным критическим теориям.
подробности о секциях можно найти на сайте конференции.
особо отметим темы 18–19 апреля — Бес/порядки текста: контексты и практики академического письма. расписание этих двух дней — тут.
до встречи в Москве 😎
❤7
Forwarded from Цифровой филолог (Даня Скоринкин)
5 коллекций данных для цифрового гуманитария
Интернет набит данными, но очень немногие датасеты сделаны гуманитариями и для гуманитариев. Собрал пять чисто гуманитарных источников данных, которые хорошо использовать в курсе анализа данных или программирования на DH-программах.
🎭 1. DraCor — корпуса и датасеты вокруг драматических текстов (с уклоном в network analysis, но не только). Один из очень немногих проектов, сумевших на базе “гуманитарного” стандарта TEI построить классную экосистему гуманитарных данных. Самые приятные данные дракора — это метаданные для каждого корпуса, которые вы можете скачать прямо на страничке корпуса, например, вот табличка для русского корпуса: https://dracor.org/api/v1/corpora/rus/metadata/csv Тут и классические метаданые вроде дат написания и публикации, и сетевые вроде плотности социальной сети в пьесе, и например соотношение мужской и женской речи…
Еще для каждой отдельной пьесы можно скачать сетевые данные (в gexf/csv/gml), речь персонажей, сценические ремарки… Ну и полную разметку в TEI, из которой все эти данные произрастают.
✒️ 2. Репозиторий открытых данных по русской литературе и фольклору — проект Цифровой лабы Пушкинского дома (ИРЛИ РАН), где цифровые филологи и не только публикуют датасеты и (иногда) код к своим исследованиям. Своего рода гуманитарный papers with code. Вот, например, данные и код к статье Кирилла Маслинского о том, какие животные чаще встречаются в каких жанрах детской литературе.
А еще там публикует новые датасеты сам ПушДом. Многие из них называются очень романтично. Скажем, Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)… Датасет с таким названием нужно обрабатывать под звуки романса “Отцвели уж давно хризантемы в саду”🍂
📚 3. European Literary Text Collection (ELTeC) — корпуса европейских романов, собранные с прицелом на репрезентативность и сопоставимость друг с другом. Целью было найти для каждой европейской литературы по 100 романов в диапазоне 1840-1920, чтобы они покрывали период более-менее равномерно, чтобы были представлены не только писатели-мужчины, чтобы бли длиной не менее 10000 слов и т.д. Не для всех корпусов это удалось, а русский корпус там совсем странный, но тем не менее — одна из немногих попыток сделать датасет, пригодный для “компаративистики” by design.
🏛 4. Госкаталог Музейного фонда РФ —свалка датасет по всему, что оцифровано во всех музеях России. Не так часто в нашей области можно найти наборы данных, где записей не тысячи, но миллионы. Качество очень разное, репрезентативность тоже под вопросом, но жемчужин в этом океане данных тоже море. Одну я здесь уже описывал.
🗺 5. Геоданные DHCLOUD. Тут лежат литературные карты в geojson, сделанные студентами гуманитарного факультета Вышки под руководством Бориса Орехова. Картографированы самые разные тексты: от маршрута Афанасия Никитина и до Приключений Капитана Врунгеля ⛵🐳
Интернет набит данными, но очень немногие датасеты сделаны гуманитариями и для гуманитариев. Собрал пять чисто гуманитарных источников данных, которые хорошо использовать в курсе анализа данных или программирования на DH-программах.
🎭 1. DraCor — корпуса и датасеты вокруг драматических текстов (с уклоном в network analysis, но не только). Один из очень немногих проектов, сумевших на базе “гуманитарного” стандарта TEI построить классную экосистему гуманитарных данных. Самые приятные данные дракора — это метаданные для каждого корпуса, которые вы можете скачать прямо на страничке корпуса, например, вот табличка для русского корпуса: https://dracor.org/api/v1/corpora/rus/metadata/csv Тут и классические метаданые вроде дат написания и публикации, и сетевые вроде плотности социальной сети в пьесе, и например соотношение мужской и женской речи…
Еще для каждой отдельной пьесы можно скачать сетевые данные (в gexf/csv/gml), речь персонажей, сценические ремарки… Ну и полную разметку в TEI, из которой все эти данные произрастают.
✒️ 2. Репозиторий открытых данных по русской литературе и фольклору — проект Цифровой лабы Пушкинского дома (ИРЛИ РАН), где цифровые филологи и не только публикуют датасеты и (иногда) код к своим исследованиям. Своего рода гуманитарный papers with code. Вот, например, данные и код к статье Кирилла Маслинского о том, какие животные чаще встречаются в каких жанрах детской литературе.
А еще там публикует новые датасеты сам ПушДом. Многие из них называются очень романтично. Скажем, Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)… Датасет с таким названием нужно обрабатывать под звуки романса “Отцвели уж давно хризантемы в саду”🍂
📚 3. European Literary Text Collection (ELTeC) — корпуса европейских романов, собранные с прицелом на репрезентативность и сопоставимость друг с другом. Целью было найти для каждой европейской литературы по 100 романов в диапазоне 1840-1920, чтобы они покрывали период более-менее равномерно, чтобы были представлены не только писатели-мужчины, чтобы бли длиной не менее 10000 слов и т.д. Не для всех корпусов это удалось, а русский корпус там совсем странный, но тем не менее — одна из немногих попыток сделать датасет, пригодный для “компаративистики” by design.
🏛 4. Госкаталог Музейного фонда РФ —
🗺 5. Геоданные DHCLOUD. Тут лежат литературные карты в geojson, сделанные студентами гуманитарного факультета Вышки под руководством Бориса Орехова. Картографированы самые разные тексты: от маршрута Афанасия Никитина и до Приключений Капитана Врунгеля ⛵🐳
dracor.org
DraCor – Open Infrastructure for Drama Analysis
DraCor, the Drama Corpora Project, is an open infrastructure that enables computational analysis of more than 4,000 dramatic texts from Greco-Roman antiquity to the 20th century, encoded in TEI and organised in different corpora. DraCor revolves around an…
❤1