Пылающий алгоритм
131 subscribers
46 photos
3 files
51 links
Канал о цифровых технологиях в образовании, научной жизни, работе в академии и материнстве. Пишу о том, как технологии (не)влияют, что происходит в мире науки и как все это уживается с человеческим.
Download Telegram
Потрясающий отпуск у меня: ребенка с утра отвела в садик после 9, за день один созвон, в четверг преподаю, надо готовиться.

Очень завидую людям, которые могут обрубить хвосты и ничего не делать n дней, полноценно отдыхая. Для меня это абсолютно нереальная ситуация, ибо и человек-травматик внутри меня прям требует работу (а в академии и в айти таких много, таким рады), и материнство не подразумевает выходных, и мы знаем, что Алиса- в стране ответственности.

Но в пятницу я коварно собираюсь отдохнуть. 🍂
В годовщину Великой Октябрьской социалистической Революции я не буду сокрушаться о домах и пароходах, но вспомню о по-настоящему важных вещах.

Мужчина на фото- мой прадед, неграмотный сибирский казак Георгий Петрович Дорогов. Мальчик на его руках- мой папа, Владимир. В будущем папа станет к.х.н, автором изобретений, выучит 17 языков, причем 4 из них будут «в активе», включая сложнейший венгерский. Пример одновременно и спекулятивный, и статистически иллюстративный: в сельской местности Степного края, где жили Дороговы, до революции было меньше 15% грамотных.

Экстенсивный рост системы образования был бы невозможен в другой стране, в других обстоятельствах, в другой системе социальных и экономических отношений, какие либо аналогии до сих пор не просматриваются.
Поэтому 7 ноября сегодня преобретает символическое значение для тех, кто ищет пути для выхода из «новых темных веков», в которые мы проваливаемся.
19
Пылающий алгоритм
Потрясающий отпуск у меня: ребенка с утра отвела в садик после 9, за день один созвон, в четверг преподаю, надо готовиться. Очень завидую людям, которые могут обрубить хвосты и ничего не делать n дней, полноценно отдыхая. Для меня это абсолютно нереальная…
update:
отдыхать, конечно, ни у кого не получилось. Гоняла по делам здоровья и ремонта, работала во имя дедлайнов. Хотя муж и отвел мальца в садик, и забрал! И это то, что во взрослой жизни называется «отдых»
👍2
Обещала описать опыт поиска данных об образовании через Dateno. Dateno (https://dateno.io) – развивающийся специализированный реестр наборов открытых данных, который регулярно пополняется новыми датасетами, дает широкие возможности для поиска, и в принципе довольно бодрый проект, разрабатываемый Иваном Бегтиным, экспертом в области открытых данных (@begtin).
С нашими дорогими educational data ("прости! не знаю, как перевести") есть сразу несколько нюансов:
1. Путаница данных об образовании и образовательных данных. Это не смертельно, если мы сразу задаемся вопросами о том, что же содержится в имеющихся датасетах.
2. Мало количество данных/датасетов при их большой содержательной фрагментарности (по чуть-чуть, но о многом, но по чуть-чуть)
3. Агрегирование и отсутствие доступа к гранулированным данным: все мы знаем, что 10 штук как среднее число компьютеров на школы региона, дает нам содержательно примерно ничего.

Есть и практическое соображение, диктуемое перспективами и тенденциями опубличивания данных в/об образовании в условиях распространения подходов открытой науки: нужны инструменты, позволяющие малой кровью отслеживать изменения в этой области и подтверждать/опровергать тренды. Пока данные в образовании редко становятся объектом управления, источником принятия решений, а имеющиеся наработки из других областей проникают со скрипом. Данные в образовании чувствительные, именно это часто мешает популяризации работы с ними. Ну, и есть некоторый карго-культ (не везде и не всегда).

### Что такое Dateno и как начать работу?

Dateno (https://dateno.io) уже содержит информацию о 19 миллионах датасетов и предоставляет понятный API для работы с ними.
1️⃣ Зарегистрируйтесь на платформе.
2️⃣ Получите токен для работы с API.
3️⃣ Используйте API (браузер, OpenRefine, старые добрые скрипты на Python/R).

### Мой эксперимент: поиск данных с ключевым словом "educational data"_*

Я залогинилась, быстро нашла свой токен, а потом запросила данные о датасетах, содержащих "educational data" в заголовке. Я рисковала, потому что датасеты из других областей тоже могут быть с такими словами, имея под собой просто учебные данные для отработки методов анализа.
Вот что удалось найти:

- Количество датасетов: 61.
- В основном, данные являются академическими/исследовательскими, то есть, датасеты распространяются как обязательства исследователей по опубличиванию результатов.
- К вопросу о том, насколько тщательно надо подходить к формулировке поискового запроса: многое из выдачи имеет мало отношения к образованию, например, мне прилетел датасет об эмигрантах в Хельсинки.
- Страны: большинство наборов данных (27) — из Восточной Азии (оно и понятно, основные датасеты из Японии), 9 — глобальные, 8 - Северная Америка.
- Форматы: .сsv (8), .json — 6, но есть и экзотика в лице .arff (текстовый формат ASCII, никогда с ним не сталкивалась).

### Потенциал Dateno для образовательных исследований

Dateno оказался полезным инструментом. Однако при работе с образовательными датасетами важно учитывать перечисленные выше нюансы. Интересно посмотреть, как представлены статистические наблюдения об образовании, и как можно прекратить пользоваться хранилищем Института статистики ЮНЕСКО. Пока не разобралась, можно ли ставить фильтр на количество записей/единиц анализа в датасете, вот это было полезно.

Гипотеза о потенциале Dateno для анализа данных вокруг образования подтвердилась. Это хороший инструмент для того, понять, как датафицирована та или иная сфера исследований образования.
🔥5
Интересное от Тани Крихтовой. Мы пока растем до детских комнат в Вышке, хотя, конечно, сценарий использовани представить сложно при наличии садика.
Forwarded from Академический декрет через границы (T.)
Ну вот, жаловалась, что мой суперсемейный университет отказался от детской комнаты. А сейчас вроде в правительстве засуетились по этому поводу и началось некоторое движение. С одной стороны приятно, но с другой получается, что слушали не студентов и сотрудников, а тех, кто сверху.
Потомок свалился с неведомой заразой (то ли зубы, то ли еще что-то, не менее интересное), мне пришлось отменить лекции, взять больничный и в полной мере насладиться многовекторным чувством стерео-вины.

У нас, благодаря садику и ремонтным выходным, уже давно не было такого времяпровождения, чтобы я не бежала никуда, не думала над статьей/проектом/грантом, а просто смотрела бы, как Вова дает себя послушать, как он рисует на полу и на обоях, как закутывается в одеяло и засыпает. И сразу как-то прошедшие два года проявляются в другом свете: сумела ли я прожить в полной мере материнство, так ли надо было бежать из декрета, стоила ли того моя самореализация, не пропустила ли я невозвратное?

Дает ли бешенный темп академии место чему-то другому? (а ведь мне есть, с чем сравнить академию). И не поэтому ли сей зоопарк из слоновой кости обезлюдивает?
4👍2💔2
Попалась в рассылке тех-блогера Гергея Ороса прохладная история [1] про то, как он записывал свою первую аудио-книгу [2]. Получилось полноценное руководство для «юношей, обдумывающих житье». Многое нам в силу санкций не грозит, но есть масса интересных деталей.

Перво-наперво поразило, что технические аудио-книги имеют право на существование. Мне бы было сложно на слух отследить многие нюансы, нужна наглядность, но раз такие книги существуют, значит, это кому-то нужно. Удивило, что для аудиокниги тоже нужен ISBN. Я, конечно, выпускала научные книги, с тонкостями получения этого идентификатора знакома, но всегда считала, что это для печатных/электронных книг. Ан нет.

Позабавило, что Гергей решил обратиться к профессиональному рассказчику (там есть выкладки, почему, доверяйте профессионалам!)– и неожиданный эффект состоял в том, что рассказчик отловил несколько ошибок в уже отредактированной книге. Как тут не поверить в силу чтения вслух, к чему нас призывают все редакторы?

Просмотрела раздел IT аудио в Яндекс Книгах: что ж, похоже, что жанр аудиокниг по этой теме не такой уж и маргинальный.

[1] https://newsletter.pragmaticengineer.com/p/software-engineers-guidebook-audiobook?utm_source=post-email-title&publication_id=458709&post_id=152922587&utm_campaign=email-post-title&isFreemail=true&r=1ogry1&triedRedirect=true&utm_medium=email
[2] https://www.engguidebook.com
🔥3
Захватывающее чтение на ночь от математика Александра Дьяконова: в каком роддоме родится больше мальчиков в процентном соотношении? В большом или в маленьком?

https://alexanderdyakonov.wordpress.com/2018/01/26/задачка-где-рождается-больше-мальчик/

Прекрасный пример рассуждения о модельной и реальной картинах мира, которые мы так часто пытаемся выцедить из данных. Казалось бы, простая задачка на теорвер разбивается о свой контекст, в данном случае о том, как выглядит система родовспоможения. У нас это еще и укрупнение роддомов, что делает цель поиска данных под условия задачи недостижимой (не будет города с двумя роддомами, большим и маленьким, скорее, будут города с двумя большими перинатальными центрами).
Позавчера: пришел дескреджект на статью. Ни единой слезинки не выкатилось из моих глаз (про соавторшу не скажу, но думаю, что она тоже не плакала). Работаем дальше.
Вчера: на позитиве закончили курс про данные защитой проектов, но судьба его расширения пока туманна. В идеале хотелось бы “продать” (не люблю это слово) идею курса для развития data-driven decision making, потому что мало, где учат работе с данными многоаспектно и в русле выстроенной индустриальной методологии, а не в контексте стат. анализа. Но – работаем дальше.
Сегодня: пришел отказ по финансированию группы. Работаем дальше.

Ждем, что будет завтра и далее. “Подыхай – а пшеничку сей”. Работаем дальше.
👍32
Раз я в вынужденном отпуске, то воспользовалась возможностью сгонять на выставку “Передвижники” в новом корпусе Третьяковки.
И не пожалела. Произошла встреча с знакомым.

У деда моего был альбом передвижников, и он любил сажать нас за него и обсуждать картины. Живопись передвижников, такая безыскусная на первый взгляд, таила за собой массу контекстов и массу деталей. Выискивать их было нашим любимым занятием. Почему у Куинджи светятся березы? Почему так иконописна вдова в “Всюду жизнь”? Где на самом деле была стрелецкая казнь и почему у Сурикова она была у Кремля? Сколько покоев (от “покой”) в “Над вечным покоем”? И мог ли кто-то так же растворить русский воздух в итальянских масляных красках, как это сделал сын раввина Левитан? Дед, комсомолец 30х, выкинувший в свое время крестик, повешенный на него священником Амфилохием Горизонтовым, под конец жизни вернувшись разве что к эрзянскому язычеству, так и не находил ответы, но учил находить вопросы.

В таких обсуждениях настраивался декодер в голове, позволяющий переводить двумерное изображение в многомерную емкую реальность, где плещется соленая вода, тянется к детскому гробику алый тюльпан, горят сафьяновые сапоги на умирающем царевиче Иване. Где за каждой деталью множество событий и множество причин. И дальше- множество следствий. Не уверена, что такой декодер в моей голове в итоге появился, но попытки были, были.
9
Новости популяризации обхода блокировок: мама (67), раннее совершенно не замеченная в компьютерной грамотности, демонстрирует явное знакомство и понимание средств для обеспечения удаленного защищенного подключения.

О Таненбаум, о Таненбаум!
🔥5
Недавно я узнала, что у моркови корневая система может достигать 2 метров в глубину, так как корни – это тоненькие ниточки, которые идут от видимой нам части, стержневидного корнеплода. Но без них морковь – не морковь.

В конце года принято вспоминать успехи, но мне кажется, что не менее важно вспомнить фейлы/неудачные попытки, потому что они и есть та невидимая, но важная часть корневой системы, без которой не получается морковки-достижений (хирша, цитирований, признания, статей, защит, курсов, грантов, проектов, нужное вычеркнуть).

1. В этом году я прошла через 10 реджектов 3 статей суммарно, одна (после 10го деск реджекта) в итоге напечатана. Но смогла бы я в итоге дойти до публикации в Q1 и заметки о моем исследовании в «Коммерсанте», увлекшись замером роста морковки?

2. Я суммарно писала/участвовала в написании 12 заявок на финансирование и коммерческих предложений. Кое-что в лучших традициях «давайте уж после майских» так и осталось под сукном. Это жрет ресурс (эмоциональный, временной, процессорный) ужасно. Где-то имеет место наша любимая бюрократия. Но получилось бы у меня наращивать мускулатуру и ярость для новых попыток добычи горького научного хлебушка?

3. Еще год назад я переживала, что, несмотря на общую хайповость моих тем, студентов на КР/ВКР ко мне идет мало и это происходило, эээ, довольно формально. Нельзя не упомянуть, что процедуры подачи на темы, беседы с потенциальными студентами – все это также ело временной ресурс. Попутно я набила несколько шишек типичных научников. В этом году ситуация кардинально поменялась, появились и студенты, и дипломники, и потенциальные диссертанты, причем все с актуальными и интересными темами, да и я им не совсем бесполезна. Я радуюсь их маленьким рубежам и победам, и у меня чувство, что растет что-то важное. Но стало бы это возможным без моих попыток понять, чего я хочу от научного руководства?

Не всегда усилия уходят в пустоту/ песок/ бесплодную каменистую почву. Это надо помнить, выбирая место для расшибания лба.
7👍2
Очарование старины глубокой, гравюры с младенцами в антенатальный период в руководстве по хирургии 17 века и аналогичных книгах примерно той же эпохи.

https://publicdomainreview.org/essay/picturing-pregnancy-in-early-modern-europe/

Конечно же, мы видим маленьких взрослых, а как иначе? Особенно порадовали “шагающие” из утробы младенцы.

Такие иллюстрации нам много добавляют к пониманию того, как менялось в обществе представление о детях, в том числе о нерожденных.
👍3
По ТГ разошлась табличка из отчета по грамотности взрослых PIAAC (Programme for the International Assessment of Adult Competencies),
так как под новый год были обнародованы результаты анализа данных, собранных в 2022/23 гг [1]. Тут надо отметить, что в самом исследовании зашито достаточно много инструментов, позволяющих сопоставить данные, собранные в разных странах. Грамотность взрослых оценивается в трех ключевых областях: грамотность чтения, математическая грамотность и решение задач в технологически насыщенной среде. Как мы видим, все имеет отношение к работе с информацией. Выборка исследования обязательно включает в себя квоты на респондентов с разным уровнем образования (школьное, профессиональное) и разных возрастных категорий. Сам отчет и всякие детали лежат там же, а мне интересно проанализировать ситуацию в ключе развития ИИ и его влияния на образование.

1. В ряде стран выявлено снижение хотя бы по одному виду оцениваемых компетенций по сравнению с предыдущим раундом исследования. С поправкой на то, что где-то были необычные паттерны прохождения исследования, прежде чем делать выводы в духе “все пропало”, довольно интересно оценить причины. И я не думаю, что пассивное или ведомое использование инструментов ИИ как-то поможет взрослым лучше читать и считать. Если мы говорим про информационную среду, то одна из причин может лежать в количестве и качестве контента, производимого на родном языке, и в работе с ним. Но она будет не универсальна. Ждем новых и глубоких исследований.

2. Сам факт получения высшего образования не означает прирост в базовых компетенциях. Наблюдается и колоссальный разрыв в результатах работы систем высшего образования разных стран. Вывод о сохраняющейся несогласованности навыков и уровня ЗП не удивляет: высококвалифицированные низкооплачиваемые сотрудники всегда в цене. Изменения на рынке труда вследствие автоматизации и ИИизации только подстегнут такой запрос.

3. Эффект семьи сохраняется и для взрослых тоже: даже подросшие дети образованных родителей более компетентны. Я люблю говорить о том, что влияние семьи на то, как дети используют цифровые технологии, значительно. То же самое применимо к новым инструментам ИИ. И это будет еще одним фактором нарастания разрыва навыков, только теперь и между семьями.

Ну, и маленькая ремарка: кто не может читать, тому сложно писать, письмо как средство мышления и оттачивания мышления становится элитарным (а было ли иначе?). PIAAC навыки письма не оценивает, но базу для размышлений дает.


[1] https://www.oecd.org/en/publications/do-adults-have-the-skills-they-need-to-thrive-in-a-changing-world_b263dc5d-en.html
👍2🤓2
ЯЩИК С УСАМИ

В рассылке сообщества визуализаторов данных Nightingale попалась заметка [1] с призывом осторожнее относиться к «ящику с усами» (он же усиковая диаграмма, он же диаграмма размаха), а еще лучше, прекратить их использовать. Не успели мы освоить этот навык чтения коробочек с палочками и квартилями, как настает момент отказаться от них. Вот какие аргументы приводит автор статьи:

⛔️Бремя прокаченного навыка чтения такого графика. Положа руку на сердце, надо сделать и описать десятки подобных графиков, прежде чем научишься их читать на автомате. А теперь давайте поймем, всегда ли наша ЦА это умеет.

⛔️У ящика с усами много атрибутов для интерпретации, но они могут быть избыточны. Это к вопросу о том, что нет универсальных визуализаций, понятных абсолютно всем. Например, сложно считать такую диаграмму, не понимая концепции квартилей. Но всегда ли они нужны?
⛔️ Ящик с усами, являя собой удобный инструмент для простого поиска аномалий в данных, может вводить в заблуждение. Как вам, например, два одинаковых ящика для различающихся по своим характеристикам выборки?

Статья 2021 года, и с тех пор не похоже, что был взят курс на де-ящиковизацию [2]. Но в контексте грамотности работы с данными и визуализациями, это весьма полезное чтение, дающее материал для размышлений. Например о том, что любая визуализация- это «улица с двусторонним движением», где грамотность предьявления встречается с грамотностью восприятия такого предьявления.

[1] https://nightingaledvs.com/ive-stopped-using-box-plots-should-you/
[2] https://pmc.ncbi.nlm.nih.gov/articles/PMC5854218/
👍31
Минутка цифровой грамотности: изучаю программу Недели Данных, которую проводят американские университеты, а там! Семинар с волнующим названием «Survival Skills: Using Computers for Scholarly Research»

💪💪💪,
как говорится.
👍2
Черепашки и датасеты в мире ИИшеньки

Сегодня побывала на интересном семинаре Ивана Бегтина https://t.me/begtin про цифровую гуманитаристику и дата-инженерию http://dhri.ru/projects/sreda/, получилась живая и острая дискуссия о границах/целях использования цифровых данных в гуманитарных науках, о нужных навыках и инструментах, о том, какие подходы из дата-емких областей могут быть использованы.

Меня, конечно же, интересовало, как делать проекты с школьниками, потому что долгий и сложный этап сбора и препроцессинга данных может расхолодить кого угодно, и при этом где еще нарабатывать важные цифровые, когнитивные и метакогнитивные навыки, как не в такой исследовательской деятельности? Что-то похожее мы пытаемся сделать сейчас в рамках камчатской «Траектории», и сбор небольших данных оказался поистине непростым.

Иван подтвердил мою догадку о том, что в школьных проектах (а вернее, в проектах, выполняемых силами детей, давайте не будем цепляться к институциям) важнее всего переходить к самому продукту- значимому классному результату совместной деятельности.

А, значит, черепашки Паперта живы и никуда не денутся.
3
Рано утром на рассвете я иду к своей ракете проводить занятие с камчатскими учителями. Сегодня было занятие про цифровой сторителлинг и про то, как такие задания давать учащимся на разных предметах. Немного коснулись генеративного ИИ, обсудили оценивание цифровых историй и, в особенности, оценивание использования ИИ учащимися. И вот здесь получается целая шкала критериев:
можно закрыть глаза и не учитывать вклад ИИ. Не было и не было.
можно оценить сам факт использования ИИ (раскадровка, план работы, сценарий, изображения и др).
можно оценить качество и доработку/переработу учеником результа генерации.
А можно просить итоговый продукт сопровождать краткой рефлексией: чему я научился, чему я научил нейросеть, чему нейросеть научила меня. Последнее понятно в свете конструктивистских педагогических подходов и в свете того, что пытаются сделать разработчики того же Deepmind, создавая LearnLM-Tutor: (приоритет процесса над продуктом).
#рабочее #иишеннька
🎄2
Праздник у девчат и не только.

Главу в монографию подавали мы еще в 2021м. Потом понятно что. Потом издательство отозвало монографию. Потом подумало и решило в другую серию. Потом весь долгий процесс переподписывания бумажек. И вот, сейчас отпруфридила.

#рабочее
🫡4
Штош: месяц еще закончился, а у меня уже результаты по переработке кофе в научное знание.

1. Подалась на три конференции
2. Мои подопечные подались на две конференции (горжусь!)
3. Выступила на целом одном внутреннем семинаре, получив ценный фидбек.
4. Подалась в один журнал (пока абстракт, а там видно будет).
5. Написала 3к строчек кода (понимаю, гордиться нечем).
6. Сходила в телевизор
7. Записала три видеоролика в студии. И три занятия дома.

И, определенно, было что-то еще, но что? Вычитывание гранок? Поиск денег? Что-то еще?
2👍2🔥1