Мастерская ТекстАн открыла набор на летнюю школу 2025, посвященную анализу текстовых даных.
Прием заявок до 25 мая по ссылке: https://nabor.letnyayashkola.org
Прием заявок до 25 мая по ссылке: https://nabor.letnyayashkola.org
🔥5
Forwarded from Мастерская ТекстАн - Летняя школа
Привет!
Мы - мастерская анализа текстовых данных, также известная как ТекстАн, и мы рады сообщить, что в 2025 году мы проводимся с 2 по 17 июля в рамках Летней школы. Вне зависимости от того, были ли вы на ЛШ уже или нет, у вас могут быть вопросы по поводу того, что из себя представляет именно наша мастерская, поэтому вот ответы на самые, возможно, частотные вопросы.
Кто мы и откуда?
Люди, делающие эту мастерскую, в основном либо из НИУ ВШЭ в Москве, либо из Европейского университета в Питере. Мы уже проводили такую мастерскую и ранее, и в этом году программа будет схожей, но, конечно же, с некоторыми изменениями относительно прошлых лет. Сама Летняя школа существует уже намного больше и рассказывать про неё намного сложней, поэтому почитать про неё можно здесь.
Как проходит мастерская?
Главный вопрос даже не "как", а "где". В лесу. Онлайн-версии не планируется. Летняя школа проводится на турбазе в Тверской области: жить планируется в палатках, а учиться - в деревянных домиках. Интернет есть, но с перебоями. Душ по расписанию, еда из общего кана, проверки МЧС за счёт заведения.
Когда примерно будет проходить мастерская?
Программа будет проходить с 2 по 17 июля, где второго будет въезд, а семнадцатого - выезд. Программа рассчитана на две недели (дальше в лесу уже становится трудновато жить без чистой одежды)
Какая примерно программа?
В целом тематика будет вращаться вокруг автоматической обработки естественного языка: языковые модели, визуализация, анализ тональности и извлечение именованных сущностей, и, конечно же, старые добрые машобуч с нейросетями (без этого сложно понять, как работают наши инструменты). Более подробную программу мы покажем позже.
Сколько это стоит?
Должны предупредить - это не совсем бесплатно. Летняя школа живёт на добровольные пожертвования участников, и минимальная рекомендуемая сумма пожертвований - 800 рублей в день. Получается около 12000 за все две недели. Как по мне, стоит того.
Как проходит отбор?
Отбор у нас проходит в два этапа: текстовое задание и беседа-созвон. Первое - чтобы определить, насколько вы хорошо подкованы с точки зрения знаний, второе - чтобы определить, насколько вам подходят условия жизни в палатке, работы в команде, учёбы в лесу и ежей в шитояме.
Надо ли что-нибудь подготовить?
На нашу мастерскую мы берём со знанием Питона и интересом к компьютерной лингвистике (возможно, с базовыми знаниями оной). Обычно этого вполне хватает. Гуглить, кстати, во время решения задач мы не запрещаем, но ради бога, не списывайте.
Что по дедлайнам?
Отбор вот-вот начнётся (по планам должен на этой неделе). Отборочного задания пока нет, но заявки можно подавать и без этого. Как только задание будет выложено, мы обязательно дадим вам знать. Четких дат пока нет, но обычно отбор длится до конца мая, потом около недели мы проверяем задания и устанавливаем количество прошедших первый этап, а затем неделю проводим интервью и определяем финальный состав участников к началу-середине июня. К сожалению, поскольку проект волонтёрский, от форс-мажоров и задержек по срокам мы не застрахованы, но если что случится, будем обязательно предупреждать.
А по коммуникации?
У нас есть сайт, но основным способом коммуникации является Телеграм и в частности этот канал. Здесь удобнее всего быстро делиться новостями и получать фидбэк, чего не предусматривает тот же сайт. Обязательно подпишитесь, если хотите быть в курсе дел.
Что нового по сравнению с прошлым годом?
Вы просили, ждали и надеялись - и вот оно! Теперь у нас два трека - базовый и продвинутый. На базовом треке мы ждём тех, кто знает основы Питона, но ещё только готовится окунуться в мир NLP, а на продвинутом - тех, кто уже имеет какие-то знания и там, и там, и хочет продвинуться дальше.
Спасибо, что прочли до конца, и увидимся на ЛШ! (Надеюсь.)
Мы - мастерская анализа текстовых данных, также известная как ТекстАн, и мы рады сообщить, что в 2025 году мы проводимся с 2 по 17 июля в рамках Летней школы. Вне зависимости от того, были ли вы на ЛШ уже или нет, у вас могут быть вопросы по поводу того, что из себя представляет именно наша мастерская, поэтому вот ответы на самые, возможно, частотные вопросы.
Кто мы и откуда?
Люди, делающие эту мастерскую, в основном либо из НИУ ВШЭ в Москве, либо из Европейского университета в Питере. Мы уже проводили такую мастерскую и ранее, и в этом году программа будет схожей, но, конечно же, с некоторыми изменениями относительно прошлых лет. Сама Летняя школа существует уже намного больше и рассказывать про неё намного сложней, поэтому почитать про неё можно здесь.
Как проходит мастерская?
Главный вопрос даже не "как", а "где". В лесу. Онлайн-версии не планируется. Летняя школа проводится на турбазе в Тверской области: жить планируется в палатках, а учиться - в деревянных домиках. Интернет есть, но с перебоями. Душ по расписанию, еда из общего кана, проверки МЧС за счёт заведения.
Когда примерно будет проходить мастерская?
Программа будет проходить с 2 по 17 июля, где второго будет въезд, а семнадцатого - выезд. Программа рассчитана на две недели (дальше в лесу уже становится трудновато жить без чистой одежды)
Какая примерно программа?
В целом тематика будет вращаться вокруг автоматической обработки естественного языка: языковые модели, визуализация, анализ тональности и извлечение именованных сущностей, и, конечно же, старые добрые машобуч с нейросетями (без этого сложно понять, как работают наши инструменты). Более подробную программу мы покажем позже.
Сколько это стоит?
Должны предупредить - это не совсем бесплатно. Летняя школа живёт на добровольные пожертвования участников, и минимальная рекомендуемая сумма пожертвований - 800 рублей в день. Получается около 12000 за все две недели. Как по мне, стоит того.
Как проходит отбор?
Отбор у нас проходит в два этапа: текстовое задание и беседа-созвон. Первое - чтобы определить, насколько вы хорошо подкованы с точки зрения знаний, второе - чтобы определить, насколько вам подходят условия жизни в палатке, работы в команде, учёбы в лесу и ежей в шитояме.
Надо ли что-нибудь подготовить?
На нашу мастерскую мы берём со знанием Питона и интересом к компьютерной лингвистике (возможно, с базовыми знаниями оной). Обычно этого вполне хватает. Гуглить, кстати, во время решения задач мы не запрещаем, но ради бога, не списывайте.
Что по дедлайнам?
Отбор вот-вот начнётся (по планам должен на этой неделе). Отборочного задания пока нет, но заявки можно подавать и без этого. Как только задание будет выложено, мы обязательно дадим вам знать. Четких дат пока нет, но обычно отбор длится до конца мая, потом около недели мы проверяем задания и устанавливаем количество прошедших первый этап, а затем неделю проводим интервью и определяем финальный состав участников к началу-середине июня. К сожалению, поскольку проект волонтёрский, от форс-мажоров и задержек по срокам мы не застрахованы, но если что случится, будем обязательно предупреждать.
А по коммуникации?
У нас есть сайт, но основным способом коммуникации является Телеграм и в частности этот канал. Здесь удобнее всего быстро делиться новостями и получать фидбэк, чего не предусматривает тот же сайт. Обязательно подпишитесь, если хотите быть в курсе дел.
Что нового по сравнению с прошлым годом?
Вы просили, ждали и надеялись - и вот оно! Теперь у нас два трека - базовый и продвинутый. На базовом треке мы ждём тех, кто знает основы Питона, но ещё только готовится окунуться в мир NLP, а на продвинутом - тех, кто уже имеет какие-то знания и там, и там, и хочет продвинуться дальше.
Спасибо, что прочли до конца, и увидимся на ЛШ! (Надеюсь.)
Летняя школа
Летняя школа — проект, собирающий на протяжении 15 лет людей, желающих учить и учиться.
❤5🔥5
Mathematica опубликовали отчет impact-отчет за 2024 год. Отчет содержит три блока лучших практик: данные, программы, эффекты, - среди которых:
1. Фонд равенства заработной платы для сотрудников сферы дошкольного образования, который с 2022 года увеличил предложение труда воспитателей примерно на 7%. Это увеличение привело к созданию почти 1500 дополнительных мест в детских садах в округе, где реализовывалась инициатива. Дополнительные выплаты и льготы фонда способствовали улучшению набора и удержания воспитателей. Пример альтернативного подхода к решению задач по росту заработных плат работников образования, которые в том числе декларировались в майских указах в России.
2. Оценка влияния профилактических программ, таких как программа домашних визитов социальных служб по укреплению родительских навыков (Nurturing Skills for Families), программы интеграции и развития рабочей силы (Workforce Innovation and Opportunity Act (WIOA) на снижение количества случаев по лишению родительских прав, изъятию детей из семей. Программы показали эффективность за счёт снижения затрат на изъятие детей и организацию опеки ($30 000–$50 000 на одного ребенка в год). Оценка стала возможно в результате инициатив по объединению данных различных федеральных ведомств.
3. Программа поддержки людей с психическими заболеваниями (Transitions to Community Living) и их инклюзии, которая обеспечила жилье и трудоустройство для более чем 5000 человек в штате, где реализуется инициатива, и сократила социальные расходы почти в 3 раза в отношении категории граждан с психическими заболеваниями, повысив их благосостояние и уровень социальной интеграции.
Подробнее о других кейсах - в отчете
________________
* Mathematica — исследовательская организация (Принстон, штат Нью-Джерси), которая специализируется на предоставлении данных, аналитики и решений на основе фактических данных для оптимизации программ и политики в области общественного благополучия. Интересный факт о Mathematica: в 1986 году сотрудники выкупили компанию у её корпоративного владельца, сделав Mathematica полностью принадлежащей сотрудникам (employee-owned company).
@evidencespace
1. Фонд равенства заработной платы для сотрудников сферы дошкольного образования, который с 2022 года увеличил предложение труда воспитателей примерно на 7%. Это увеличение привело к созданию почти 1500 дополнительных мест в детских садах в округе, где реализовывалась инициатива. Дополнительные выплаты и льготы фонда способствовали улучшению набора и удержания воспитателей. Пример альтернативного подхода к решению задач по росту заработных плат работников образования, которые в том числе декларировались в майских указах в России.
2. Оценка влияния профилактических программ, таких как программа домашних визитов социальных служб по укреплению родительских навыков (Nurturing Skills for Families), программы интеграции и развития рабочей силы (Workforce Innovation and Opportunity Act (WIOA) на снижение количества случаев по лишению родительских прав, изъятию детей из семей. Программы показали эффективность за счёт снижения затрат на изъятие детей и организацию опеки ($30 000–$50 000 на одного ребенка в год). Оценка стала возможно в результате инициатив по объединению данных различных федеральных ведомств.
3. Программа поддержки людей с психическими заболеваниями (Transitions to Community Living) и их инклюзии, которая обеспечила жилье и трудоустройство для более чем 5000 человек в штате, где реализуется инициатива, и сократила социальные расходы почти в 3 раза в отношении категории граждан с психическими заболеваниями, повысив их благосостояние и уровень социальной интеграции.
Подробнее о других кейсах - в отчете
________________
* Mathematica — исследовательская организация (Принстон, штат Нью-Джерси), которая специализируется на предоставлении данных, аналитики и решений на основе фактических данных для оптимизации программ и политики в области общественного благополучия. Интересный факт о Mathematica: в 1986 году сотрудники выкупили компанию у её корпоративного владельца, сделав Mathematica полностью принадлежащей сотрудникам (employee-owned company).
@evidencespace
👍9❤3👨💻2
Forwarded from Канал влияния
Разрывная регрессия (Regression Discontinuity Design, RDD) — часто использующийся, интуитивный и красивый инструмент в экономике. Это мощный квазиэкспериментальный метод, который помогает оценить эффект воздействия, если оно работает неслучайно, а по правилу, связанному с превышением порога какой-то величиной (cutoff-based treatment assignment) (Thistlethwaite, Campbell, 1960)
Например: округа с бедностью выше 20% получают грант — сравниваем тех, кто чуть выше и чуть ниже этого порога, и делаем выводы
В конце апреля вышел препринт, в котором Давид Ван Дейк (University of Michigan) предложил новую версию RDD, которая работает с распределениями в качестве исхода (Van Dijcke, 2025). Он назвал её R3D — Regression Discontinuity Design with Distribution-Valued Outcomes (разрывная регрессия с разрывом для распределений)
В статье автор показывает, как с помощью R3D можно измерить влияние победы Демократической партии на распределение доходов в американских штатах. Выясняется: доходы у верхней части населения снижаются, у нижней — нет изменений (см. график в посте). Классическая история: равенство растёт, эффективность — нет (Okun, 1975)
Также Давид Ван Дейк разработал R-пакет R3D
🔗 Исследование: arXiv
🔗 Документация пакета: Github и Pkgdown
📖 Если же вы только начинаете свое знакомство с разрывной регрессией, то очень рекомендуем отличные гайды от Матиаса Каттанео (Princeton University) и соавторов: базовый (Cattaneo, Idrobo, Titiunik, 2020) и расширения (Cattaneo, Idrobo, Titiunik, 2024), а также целую страницу, посвященную RDD, с разными материалами и софтом для ваших исследований
🔗 Реализация метода от Давида Ван Дейка в виде пакета DiSCos доступна на R и Stata
#канал_обозревает
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10
Forwarded from Tatyana Cherkashina
Какими будут обследования населения к 2030 году в исполнении Росстата?
До января 2027 г. будет «разработан и внесен в Правительство Российской Федерации проект федерального закона, предусматривающий использование административных данных в качестве источника сведений о населении при проведении федерального статистического наблюдения населения».
До декабря 2027 г. будут проведены пилотные федеральные статистические наблюдения населения в цифровом формате.
До декабря 2028 г. произойдёт «переход на цифровой формат проведения федеральных статистических наблюдений населения, включая формирование системы стимулирования участия населения в цифровых опросах». С декабря 2028 г. «Федеральные статистические наблюдения населения в населенных пунктах с обеспечением широкополосного доступа к информационно- телекоммуникационной сети "Интернет" проводятся преимущественно в цифровом формате».
К 2030 году
– более половины вопросов анкет при обследованиях населения будут предзаполнены с использованием административных данных;
– три четверти домашних хозяйств (Т.Ч.: надо полагать, из выборки) будут «проходить обследование с использованием личных кабинетов на цифровых платформах органов публичной власти»;
– главной функцией привлекаемых интервьюеров станет «не собственно сбор первичных статистических данных, а контроль полноты учета населения и качества обследования».
Также нас ожидает
Стратегия развития системы государственной статистики и Росстата до 2030 года
План мероприятий по реализации Стратегии развития системы государственной статистики и Росстата до 2030 года
До января 2027 г. будет «разработан и внесен в Правительство Российской Федерации проект федерального закона, предусматривающий использование административных данных в качестве источника сведений о населении при проведении федерального статистического наблюдения населения».
До декабря 2027 г. будут проведены пилотные федеральные статистические наблюдения населения в цифровом формате.
До декабря 2028 г. произойдёт «переход на цифровой формат проведения федеральных статистических наблюдений населения, включая формирование системы стимулирования участия населения в цифровых опросах». С декабря 2028 г. «Федеральные статистические наблюдения населения в населенных пунктах с обеспечением широкополосного доступа к информационно- телекоммуникационной сети "Интернет" проводятся преимущественно в цифровом формате».
К 2030 году
– более половины вопросов анкет при обследованиях населения будут предзаполнены с использованием административных данных;
– три четверти домашних хозяйств (Т.Ч.: надо полагать, из выборки) будут «проходить обследование с использованием личных кабинетов на цифровых платформах органов публичной власти»;
– главной функцией привлекаемых интервьюеров станет «не собственно сбор первичных статистических данных, а контроль полноты учета населения и качества обследования».
Также нас ожидает
«… публикация официальной статистической информации на уровне населенных пунктов, в том числе опорных;
расширение состава статистических показателей, собираемых и публикуемых на уровне населенных пунктов».
Стратегия развития системы государственной статистики и Росстата до 2030 года
План мероприятий по реализации Стратегии развития системы государственной статистики и Росстата до 2030 года
government.ru
Правительство утвердило план мероприятий по реализации Стратегии развития системы государственной статистики и Росстата до 2030…
Распоряжение от 30 апреля 2025 года №1083-р
👍4
Forwarded from Канал влияния
Аннотация:
Речь пойдёт о современных подходах к оценке причинных эффектов в наблюдаемых данных: от идентификации параметров до статистического вывода. Обсуждаются различия между классическими методами и новыми техниками с использованием устойчивых оценок в полупараметрических моделях. Особое внимание уделяется методу двойного машинного обучения и его применению в квантильной регрессии
❗️А еще! Продлён дедлайн подачи работ на международную конференцию iCEBDA 2025!
🔥Ключевые спикеры: Хидо Имбенс (Stanford GSB), лауреат Нобелевской премии по экономике (2021); Томмазо Проиетти (Università di Roma "Tor Vergata")
#канал_зовёт
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🎉6👍4
Профессор ЦЕУ Габор Бекеш продолжает радовать нас открытыми курсами в области анализа данных (об одном из них мы писали ранее). Совсем недавно в свет вышел Курс «Анализ данных с использованием ИИ» (Doing Data Analysis with AI) , который предназначен для студентов с базовыми знаниями в области анализа данных, эконометрики и количественных методов. Курс учит применять ИИ для повышения продуктивности в анализе данных. Основное внимание уделяется использованию крупных языковых моделей (LLMs), таких как ChatGPT, Claude.ai и других. Есть много практических кейсов: например, здесь Бекеш подробно описывает как генерировать графики распределения доходов в привязке к уровню образования и гендеру, приводя примеры промтов и результатов выдачи ChatGPT и Claude.ai. Если еще не используете ИИ в дата-анализе и исследованиях, курс - хорош для погружения 🧠
@evidencespace
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤4👍2👎1
Forwarded from Канал влияния
Машинное обучение постепенно входит в эмпирическую практику экономистов — от отбора переменных до оценки индивидуальных эффектов воздействия. В академической экономике это движение встречает заметное сопротивление. По мнению Беатрис Гитнер (University College Dublin), источники этого недоверия кроются в фундаментальных интеллектуальных барьерах:
В этом посте, основанном на публикации в блоге Беатрис Гитнер, мы разберём наиболее популярные мифы об ML в экономике, предложим контраргументы и в финале расскажем о свежей важной обзорной работе в сфере ML и causal inference
Современный причинный вывод активно использует ML как инструмент оценки вспомогательных (nuisance) функций (условных ожиданий, вероятностей назначения, и т.п.) в рамках строго идентифицированных моделей
Эти подходы позволяют совмещать гибкость ML с требованиями строгой причинной идентификации
Многие считают, что ML-модели сложно интерпретировать, а значит они бесполезны для научного исследования. Но интерпретируемость ≠ линейность. Современные инструменты позволяют:
Интерпретируемость в ML — это вопрос правильно выбранного инструмента и научной задачи
Ранние версии ML действительно не обеспечивали достоверного статистического вывода (inference): стандартные ошибки, доверительные интервалы, p-значения были недоступны. Но в последние годы это изменилось. ML в каузальном анализе сопровождается:
Результат — ML-подходы, совместимые с классической инференцией и теорией оценивания
ML предоставляет именно те инструменты, которых не хватает классической эконометрике, например:
То есть ML не мешает, а расширяет возможности вывода для политики
Если вы хотите разобраться, как применять ML в причинной эконометрике, начните со свежего июньского обзора (Ahrens et al., 2025), среди авторов которого Виктор Черножуков и Кристиан Хансен
Если же вы хотите не только понять, но и научиться применять эти методы на практике, начните с сайта авторов обзора dmlguide.github.io, проектов Causal ML Book от Виктора Черножукова с соавторами и Dive into Causal Machine Learning от команды, которая перерабатывает учебные материалы ведущих ученых на разные языки программирования, а также учебных материалов Мадины Курмангалиевой
#канал_обозревает
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍5🔥2👎1
Натолкнулись на интересную статью Andersen et al. (2023) Disaggregated Economic Accounts (Дезагрегированные экономические счета), в которой представлена новая система дезагрегированных экономических счетов, разбивающая национальные счета Дании на двусторонние потоки между группами потребителей и производителями, а также правительством и внешним миром. Используя различные административные данные (например, транзакции Danske Bank), авторы раскрывают «треугольную» схему торговли («triangular trade» pattern): сельские потребители направляют расходы в городские регионы, городские потребители больше тратят за границей (12% против 8% у сельских), а экспортные доходы преимущественно поступают в сельские регионы из-за расположения в них экспортных производителей.
С помощью калиброванной модели общего равновесия авторы показывают, как структура этих счетов влияет на распространение экономических шоков. Некоторые выводы работы:
- трансферы, дольше циркулирующие в национальной экономике, обеспечивают более высокий мультипликатор благосостояния, особенно в сельских районах;
- снижение экспортных тарифов напрямую выгодно сельским регионам, но общие выгоды, включая косвенные эффекты, больше ощущаются городскими потребителями;
- в целом инструменты фискальной политики результативнее в сельских регионах, так как расходы сельских потребителей дольше циркулируют внутри страны, прежде чем «утекают» за границу.
Авторы утверждают, что такой подход к оценке экономических связей позволяет лучше понимать эффекты от внешних шоков, идентифицировать наиболее уязвимых экономических агентов, а также более точно таргетировать фискальную политику. Кроме этого, работа - хороший бенчмарк того, как можно и нужно транслировать академические результаты в массы: disaggregatedaccounts.com и bfi.uchicago.edu.
@evidencespace
С помощью калиброванной модели общего равновесия авторы показывают, как структура этих счетов влияет на распространение экономических шоков. Некоторые выводы работы:
- трансферы, дольше циркулирующие в национальной экономике, обеспечивают более высокий мультипликатор благосостояния, особенно в сельских районах;
- снижение экспортных тарифов напрямую выгодно сельским регионам, но общие выгоды, включая косвенные эффекты, больше ощущаются городскими потребителями;
- в целом инструменты фискальной политики результативнее в сельских регионах, так как расходы сельских потребителей дольше циркулируют внутри страны, прежде чем «утекают» за границу.
Авторы утверждают, что такой подход к оценке экономических связей позволяет лучше понимать эффекты от внешних шоков, идентифицировать наиболее уязвимых экономических агентов, а также более точно таргетировать фискальную политику. Кроме этого, работа - хороший бенчмарк того, как можно и нужно транслировать академические результаты в массы: disaggregatedaccounts.com и bfi.uchicago.edu.
@evidencespace
❤6🔥5👍4
NBER опубликовало сегодня исследование Река Юхаса и коллектива авторов «Measuring Industrial Policy: A Text-Based Approach». О чем оно и почему интересно с точки зрения impact-оценки государственных политик?
Коллеги использовали базу данных Global Trade Alert (GTA) — самый большой в мире сборник описаний торговых и экономических мер, принятых государствами (47283 записи за 2010–2022 годы после очистки данных). В GTA собраны понятные описания на английском языке, которые составлены экспертами. Они включают только проверенные и значимые меры, влияющие на международную торговлю. Река Юхас и команда поставили перед собой задачу, используя базу GTA, разработать метод систематической идентификации и измерения мер промышленной политики среди стран Мира, а именно: классифицировать государственные меры, сформировать показатели активности промышленной политики, предельно точно идентифицировать целевой характер мер (не просто соотнести меру к тарифной политике или видам субсидий, а определить ее таргет).
Решали задачу методами ML в три этапа: ручная разметка для обучения (было размечено 2932 описания (примерно 6% от всей базы), тренировка модели (непосредственно само обучение), имплементация модели на всей выборке и кластеризация данных. В зависимости от года было выделено из GTA 44–63% мер, относящихся к промышленной политике. Точность модели на тестовой выборке достаточно высокая (F1-score 94.1%). Примеры классифицированных политик:
• Бразилия увеличила импортные тарифы на IT и телекоммуникационные товары, чтобы стимулировать инновации и укрепить национальный IT-сектор.
• Китай предоставил государственные займы для развития производства батарей для электромобилей.
• США приняли CHIPS and Science Act 2022 для развития полупроводниковой отрасли и исследований.
По стэку и методам. Использовалась модель BERT (Bidirectional Encoder Representations from Transformers), которая была дообучена для задачи трехклассовой классификации (определяли таргет (промышленная политика), не таргет и условную корзину, где модель не смогла классифицировать текстовые данные). Есть отдельный репо, но без кода - только данные. Но из текста статьи следует, что коллеги использовали инструменты на основе python, в частности Hugging Face (для доступа к предобученной модели BERT), Optuna (для оптимизации гиперпараметров модели), Prodigy (для разметки и аннотации данных).
Эффект мер на текущем этапе не оценивался, но вот некоторые выводы исследования:
1. С 2010-х годов наблюдается устойчивое увеличение разработки и применения мер промышленной политики, стимулирующих различные отрасли.
2. Промышленная политика чаще использует субсидии и меры, ориентированные на экспорт, вместо тарифных и фискальных мер.
3. Имплементация промышленной политики характерна для стран с высоким уровнем дохода, но не для развивающихся стран, что противоречит традиционным представлениям о промышленной политике как инструменте догоняющего развития.
4. Промышленная политика, особенно в странах с высоким доходом, чаще нацелена на сектора, где страна уже имеет конкурентные преимущества в рамках экспорта (отрасли как стартапы остаются за бортом).
Подход интересен тем, что он на практике показывает, как может выглядеть консолидация различных инициатив под вектором того или иного механизма воздействия. Для задач оценки государственной политики в России аналогичные методы могут быть использованы в части выявления на пантеоне текстовых данных документов стратегического планирования региональных мер, резонирующих с федеральной повесткой. При оценках различных политик, например, политики в области повышения благосостояния населения меры на федеральном уровне консолидируются в единые механизмы проще, чем меры регионального характера, которые в силу специфики отечественного госпланирования часто размыты и формально могут быть не связаны с федеральными, однако фактически могут влиять на достижение национальных целей. Методы ML, описанные в статье, могут решать такие задачи консолидации.
@evidencespace
Коллеги использовали базу данных Global Trade Alert (GTA) — самый большой в мире сборник описаний торговых и экономических мер, принятых государствами (47283 записи за 2010–2022 годы после очистки данных). В GTA собраны понятные описания на английском языке, которые составлены экспертами. Они включают только проверенные и значимые меры, влияющие на международную торговлю. Река Юхас и команда поставили перед собой задачу, используя базу GTA, разработать метод систематической идентификации и измерения мер промышленной политики среди стран Мира, а именно: классифицировать государственные меры, сформировать показатели активности промышленной политики, предельно точно идентифицировать целевой характер мер (не просто соотнести меру к тарифной политике или видам субсидий, а определить ее таргет).
Решали задачу методами ML в три этапа: ручная разметка для обучения (было размечено 2932 описания (примерно 6% от всей базы), тренировка модели (непосредственно само обучение), имплементация модели на всей выборке и кластеризация данных. В зависимости от года было выделено из GTA 44–63% мер, относящихся к промышленной политике. Точность модели на тестовой выборке достаточно высокая (F1-score 94.1%). Примеры классифицированных политик:
• Бразилия увеличила импортные тарифы на IT и телекоммуникационные товары, чтобы стимулировать инновации и укрепить национальный IT-сектор.
• Китай предоставил государственные займы для развития производства батарей для электромобилей.
• США приняли CHIPS and Science Act 2022 для развития полупроводниковой отрасли и исследований.
По стэку и методам. Использовалась модель BERT (Bidirectional Encoder Representations from Transformers), которая была дообучена для задачи трехклассовой классификации (определяли таргет (промышленная политика), не таргет и условную корзину, где модель не смогла классифицировать текстовые данные). Есть отдельный репо, но без кода - только данные. Но из текста статьи следует, что коллеги использовали инструменты на основе python, в частности Hugging Face (для доступа к предобученной модели BERT), Optuna (для оптимизации гиперпараметров модели), Prodigy (для разметки и аннотации данных).
Эффект мер на текущем этапе не оценивался, но вот некоторые выводы исследования:
1. С 2010-х годов наблюдается устойчивое увеличение разработки и применения мер промышленной политики, стимулирующих различные отрасли.
2. Промышленная политика чаще использует субсидии и меры, ориентированные на экспорт, вместо тарифных и фискальных мер.
3. Имплементация промышленной политики характерна для стран с высоким уровнем дохода, но не для развивающихся стран, что противоречит традиционным представлениям о промышленной политике как инструменте догоняющего развития.
4. Промышленная политика, особенно в странах с высоким доходом, чаще нацелена на сектора, где страна уже имеет конкурентные преимущества в рамках экспорта (отрасли как стартапы остаются за бортом).
Подход интересен тем, что он на практике показывает, как может выглядеть консолидация различных инициатив под вектором того или иного механизма воздействия. Для задач оценки государственной политики в России аналогичные методы могут быть использованы в части выявления на пантеоне текстовых данных документов стратегического планирования региональных мер, резонирующих с федеральной повесткой. При оценках различных политик, например, политики в области повышения благосостояния населения меры на федеральном уровне консолидируются в единые механизмы проще, чем меры регионального характера, которые в силу специфики отечественного госпланирования часто размыты и формально могут быть не связаны с федеральными, однако фактически могут влиять на достижение национальных целей. Методы ML, описанные в статье, могут решать такие задачи консолидации.
@evidencespace
❤8🔥7👍4
Libraries Scholarly API Cookbook - подборка туториалов Университета Алабамы по работе с API различных веб-сервисов, полезных для исследователей: arXiv, WB, Scopus, NASA, Wiley, OSM и другие.
@evidencespace
@evidencespace
👍6❤4👨💻2
Forwarded from Канал влияния
Недавно мы обещали рассказать вам, как оценивать эффекты, если воздействие непрерывное -- пришло время этой темы!
Обычно для оценки влияния политик или другого воздействия используется метод разность разностей (Difference-in-Differences, DiD), но он работает хорошо, когда можно разделить наблюдаемые единицы на две группы: тех, кто подвергся воздействию, и тех, кто нет
В реальности же воздействие часто имеет не бинарную, а непрерывную природу — то есть разную интенсивность (dose):
Во всех этих случаях вопрос звучит не "было ли воздействие?", а "насколько интенсивным оно было?"
Авторы переосмысливают классический DiD и показывают, что при непрерывном воздействии привычные методы могут давать некорректные оценки
Во многих прикладных работах исследователи используют стандартную модель с фиксированными эффектами (TWFE) и включают переменную интенсивности воздействия, умноженную на бинарную переменную пост-периода. Но такая оценка:
Авторы показывают, что даже в простой ситуации 2×2 DiD (две группы, два периода), коэффициент TWFE не имеет корректной причинной интерпретации, если интенсивность воздействия варьируется
Авторы вводят два типа причинных эффектов:
→ Позволяет идентифицировать уровневый эффект при заданной интенсивности
→ Необходимо для корректной оценки причинного отклика
Авторы статьи разработали R-пакет
contdid. Это пока альфа-версия, но она уже поддерживает непрерывное воздействие, ступенчатое воздействие (staggered adoption), агрегации по интенсивности и времени 🔗 Документация пакета: Github и RD Packages
Заинтересованным в теме предлагаем также заглянуть в препринт (Zhang, 2025), где автор пытается решить похожую задачу с помощью double/debiased machine learning
#канал_обозревает
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4❤2
Forwarded from Абсолют—Помощь
Открыт прием заявок на конкурс исследований
Мы запускаем конкурс научно-практических исследований социального развития в сфере помощи детям и молодым взрослым в ситуации уязвимости 2025.
Принять участие могут государственные и негосударственные НКО, ресурсные и методические центры, образовательные, научные и исследовательские организации, зарегистрированные по форме НКО.
Грантовый фонд конкурса составит 50 млн рублей. Прием заявок стартует 17 июня и продлится до 12.00 по московскому времени 21 июля 2025 года. Результаты конкурса будут объявлены в августе 2025 года.
Узнать больше о конкурсе и подать заявку можно по ссылке.
Мы запускаем конкурс научно-практических исследований социального развития в сфере помощи детям и молодым взрослым в ситуации уязвимости 2025.
Принять участие могут государственные и негосударственные НКО, ресурсные и методические центры, образовательные, научные и исследовательские организации, зарегистрированные по форме НКО.
Грантовый фонд конкурса составит 50 млн рублей. Прием заявок стартует 17 июня и продлится до 12.00 по московскому времени 21 июля 2025 года. Результаты конкурса будут объявлены в августе 2025 года.
Особенность конкурса в том, что он призван поддержать научно-практические исследования при условии, что результаты исследований будут в обязательном порядке внедрены в практику и способствовать улучшению жизни целевых групп. При этом важно не только проведение исследований и внедрение результатов на практике, но и распространение информации в открытом доступе, а также мониторинг и оценка влияния результатов исследования.
Узнать больше о конкурсе и подать заявку можно по ссылке.
Forwarded from Канал влияния
Мы хотели бы обратить ваше внимание на две секции, связанные с анализом данных и причинностью (24 июля - save the date) 📅
Раскрывает современные методы медиаторного анализа: как оценивать, через какие механизмы интервенции влияют на исход. Ключевой акцент — на идентификационные допущения и анализ чувствительности
Показывает, как использовать суррогатные переменные и агрегирующие медиаторы для оценки эффектов, когда главные исходы пока не наблюдаемы
Трансляции и записи лекций можно будет посмотреть на YouTube
Методы эмпирического тестирования механизмов эффектов воздействия: как убедиться, что интервенция действует именно через заявленный канал
Дискутант: Ismael Mourifié, Washington University in St. Louis and NBER
Использование спутниковых данных и данных мобильных операторов в качестве исходов для оценки программ в труднодоступных регионах (экология, агросектор и др.)
Дискутант: Seema Jayachandran, Princeton and NBER
Методы оценки причинного эффекта на текстовые переменные, извлечённые с помощью NLP (например, отзывы, протоколы заседаний и др.)
Дискутант: Jesse M. Shapiro, Harvard and NBER
Предлагается метод для объединения краткосрочных экспериментальных и долгосрочных наблюдаемых данных для оценки эффекта во времени
Дискутант: Susan Athey, Stanford and NBER
Новый способ оценки качества инструментов через мета-регрессии, обобщающий информацию из разных исследований
Дискутант: Isaiah Andrews, MIT and NBER
Разработка рецентрированных инструментов для оценки спроса в моделях с дифференцированными продуктами — актуально для IO и маркетинговых исследований
Дискутант: Steven T. Berry, Yale and NBER
#канал_зовёт
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12🔥4🎉3
Opensustain.tech: один из масштабных волонтерских open-source проектов, посвященный устойчивому развитию. Представляет собой каталог более 1000 проектов, связанных с изменением климата, возобновляемой энергетикой, биоразнообразием, природными ресурсами, бедностью и неравенством.
Вот некоторые примеры проектов с открытым исходным кодом:
accessibility: инструмент для расчёта уровней доступности и анализа бедности и неравенства в доступе к услугам, использует предварительно рассчитанную матрицу транспортных затрат и гео-данные (например, расположение рабочих мест, медицинских учреждений и населения). Проект помогает выявлять районы с ограниченным доступом к базовым услугам, что особенно актуально для бедных сообществ. В чем польза: предоставляет данные и алгоритмы для анализа пространственного неравенства, что будет ценно для исследований в области социальной географии и городской политики.
OpenTripPlanner: мультимодальный планировщик маршрутов, который объединяет данные об общественном транспорте, велосипедных маршрутах, пешеходных путях и сервисах микромобильности (например, bike-sharing). Проект помогает оптимизировать транспортные потоки и снижать углеродный след за счёт продвижения экологичных способов передвижения. В чем польза: предоставляет данные и алгоритмы для анализа транспортной инфраструктуры и моделирования сценариев устойчивых транспортных систем, можно использовать для изучения эффективности общественного транспорта в городах.
EcoSonar: инструмент, помогающий командам разработчиков оценивать экологическое воздействие цифровых технологий на этапе проектирования. Проект продвигает практики экологичного дизайна и доступности, позволяя минимизировать углеродный след программного обеспечения. В чем польза: анализа энергопотребления программных решений и разработки рекомендаций по созданию «зелёного» ПО.
venco.py: инструмент обработки данных, который создаёт профили спроса и гибкости для будущих парков электромобилей. Проект помогает моделировать сценарии использования электромобилей в энергосистемах. В чем польза: анализ интеграции электромобилей в энергосети, оценки их влияния на энергопотребление и разработка стратегий управления нагрузкой.
@evidencespace
Вот некоторые примеры проектов с открытым исходным кодом:
accessibility: инструмент для расчёта уровней доступности и анализа бедности и неравенства в доступе к услугам, использует предварительно рассчитанную матрицу транспортных затрат и гео-данные (например, расположение рабочих мест, медицинских учреждений и населения). Проект помогает выявлять районы с ограниченным доступом к базовым услугам, что особенно актуально для бедных сообществ. В чем польза: предоставляет данные и алгоритмы для анализа пространственного неравенства, что будет ценно для исследований в области социальной географии и городской политики.
OpenTripPlanner: мультимодальный планировщик маршрутов, который объединяет данные об общественном транспорте, велосипедных маршрутах, пешеходных путях и сервисах микромобильности (например, bike-sharing). Проект помогает оптимизировать транспортные потоки и снижать углеродный след за счёт продвижения экологичных способов передвижения. В чем польза: предоставляет данные и алгоритмы для анализа транспортной инфраструктуры и моделирования сценариев устойчивых транспортных систем, можно использовать для изучения эффективности общественного транспорта в городах.
EcoSonar: инструмент, помогающий командам разработчиков оценивать экологическое воздействие цифровых технологий на этапе проектирования. Проект продвигает практики экологичного дизайна и доступности, позволяя минимизировать углеродный след программного обеспечения. В чем польза: анализа энергопотребления программных решений и разработки рекомендаций по созданию «зелёного» ПО.
venco.py: инструмент обработки данных, который создаёт профили спроса и гибкости для будущих парков электромобилей. Проект помогает моделировать сценарии использования электромобилей в энергосистемах. В чем польза: анализ интеграции электромобилей в энергосети, оценки их влияния на энергопотребление и разработка стратегий управления нагрузкой.
@evidencespace
🔥7👍4❤1😁1
Forwarded from Если быть точным
Почти 70% всех выпускников бакалавриата и специалитета в 2024 году совмещали учебу с работой хотя бы один месяц. Чаще всего — на педагогических, сельскохозяйственных и инженерных направлениях.
Среди очников работу с учебой совмещали 54%. И это заметно влияет на будущее: через год после выпуска шансы найти работу у них выше на 16–19%, а зарплата — в среднем на 14%. Правда, разница между направлениями колоссальна — от 30 тысяч в драматургии до 150 тысяч в аэронавигации.
Данные о зарплатах и работе во время учебы можно найти в наших датасетах — о том, сколько зарабатывают выпускники по учебным заведениям и специальностям. Мы их как раз обновили.
Что нового:
На этих данных мы показали, что гендерный разрыв в зарплатах возникает уже через два года после выпуска и что не только престиж вуза влияет на доход выпускника. А всего у нас собрано 35 датасетов на разные проблемы — посмотреть и скачать их можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍4🤔1🎉1
Python Case Studies — «крафтовый» репо с разборами шести кейсов анализа данных на синтаксисе python от Раждипа Чакраборти:
1. DNA Sequencing — исследование биоинформатики: работа с последовательностями ДНК, выявление шаблонов и биологических закономерностей.
2. Linguistic Analysis of Books — анализ лексической вариативности в книгах: частотность, стилистика, различия между авторами.
3. Classification Models — построение предиктивных моделей на табличных данных: отбор признаков и интерпретация.
4. Whisky Flavor Profiles — исследование вкусовых характеристик шотландского виски и предпочтений потребителей (кластеризация по регионам).
5. Bird Migration (GPS) — пространственно-временной анализ маршрутов перелётных птиц.
6. Social Networks — анализ взаимодействий и социальных структур среди жителей деревни.
@evidencespace
1. DNA Sequencing — исследование биоинформатики: работа с последовательностями ДНК, выявление шаблонов и биологических закономерностей.
2. Linguistic Analysis of Books — анализ лексической вариативности в книгах: частотность, стилистика, различия между авторами.
3. Classification Models — построение предиктивных моделей на табличных данных: отбор признаков и интерпретация.
4. Whisky Flavor Profiles — исследование вкусовых характеристик шотландского виски и предпочтений потребителей (кластеризация по регионам).
5. Bird Migration (GPS) — пространственно-временной анализ маршрутов перелётных птиц.
6. Social Networks — анализ взаимодействий и социальных структур среди жителей деревни.
@evidencespace
❤9👍5
Недавно VoxDev (платформа Института Всемирного банка, посвященная исследованию экономики развития) опубликовали интересный материал о применении эконометрических методов в экономике. В статье рассматриваются примеры применения различных каузальных методов, некоторые примеры:
1. RCT:
⬇️ Государственное субсидирование среднего образования в Гане продемонстрировало выраженные положительные эффекты, отличающиеся комплексным характером, при этом особенно значительные результаты были зафиксированы в отношении женщин. Подробнее здесь.
⬇️ Внедрение децентрализованных систем водоснабжения в сельских районах Индии способствовало существенным улучшениям показателей здоровья домохозяйств, особенно за счёт повышения доступа к чистой питьевой воде и снижения распространённости заболеваний, связанных с её нехваткой. Подробнее здесь.
⬇️ Программа распределения жилья посредством жилищной лотереи в Эфиопии выявила высокий уровень неудовлетворённого спроса на улучшенные жилищные условия среди жителей трущоб, что свидетельствует о значительной потребности в доступном и качественном жилье в уязвимых городских сообществах. Подробнее здесь.
2. Натуральные эксперименты:
⬇️ Отмена программы условных денежных трансфертов в Мексике позволила оценить её влияние на образование и трудовые результаты. Подробнее здесь.
⬇️ Внедрение генетически модифицированной сои в сельском хозяйстве Бразилии позволило эмпирически оценить влияние аграрных инноваций на гендерные различия в трудовой занятости, выявив, в частности, значимые эффекты на трудовые результаты женщин в сельской местности. Подробнее здесь.
3. DID:
⬇️ Скоординированные усилия по обеспечению вакцинации существенно повысили охват детского населения, что, по оценкам, позволило предотвратить около 1,5 миллиона случаев преждевременной смертности, продемонстрировав высокую эффективность международных программ в области профилактического здравоохранения. Подробнее здесь.
4. RDD:
⬇️ Эмпирический анализ воздействия квотирования на трудоустройство лиц с инвалидностью в Бразилии продемонстрировал, что усиленные меры контроля за соблюдением трудового законодательства способствуют увеличению занятости в данной группе, подчёркивая значимость институционального давления в реализации социальной инклюзии на рынке труда. Подробнее здесь.
5. Инструментальные переменные:
⬇️ Доступ к 3G широкополосному интернету в Индонезии снизил количество случаев COVID-19 примерно на 45%, что является относительно большим воздействием по сравнению с эффективностью других нехимических интервенций. Районы с более высокими уровнями грамотности и большей способностью к удаленной работе испытали еще более выраженные преимущества. Подробнее здесь.
В статье также есть материалы об образовательных ресурсах VoxDev, включая подкасты и литературу.
@evidencespace
1. RCT:
2. Натуральные эксперименты:
3. DID:
4. RDD:
5. Инструментальные переменные:
В статье также есть материалы об образовательных ресурсах VoxDev, включая подкасты и литературу.
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍3❤2
Forwarded from Ну Экон
Interested in using intermediate outcomes to better understand causal mechanisms and predict long-term impacts of interventions? Join Prof. Chetty and Prof. Kosuke Imai at the NBER Methods lectures:
📅 Thursday, 7/24, 3 pm
📍 Cambridge, MA for NBER SI attendees, or virtually ⬇️
https://www.nber.org/conferences/si-2025-methods-lecture-uncovering-causal-mechanisms-mediation-analysis-and-surrogate-indices
📅 Thursday, 7/24, 3 pm
📍 Cambridge, MA for NBER SI attendees, or virtually ⬇️
https://www.nber.org/conferences/si-2025-methods-lecture-uncovering-causal-mechanisms-mediation-analysis-and-surrogate-indices
NBER
SI 2025 Methods Lecture: Uncovering Causal Mechanisms: Mediation Analysis and Surrogate Indices
❤8
Forwarded from Trisigma — про эксперименты
Causal Inference в реальных задачах индустрии
Привет! На связи Саша Кузнецов, старший аналитик команды Trisigma External в Авито.
Когда разговор заходит о причинно-следственных выводах (Causal Inferense), часто уходят в дебри статистики, не доходя до главного — как это работает в индустрии и зачем это нужно бизнесу.
Алекс Дэнг (ex-Microsoft, один из авторов CUPED и многих других industry-standard техник) написал открытый конспект про causality — «Causal Inference and Its Applications in Online Industry».
• Что внутри
Это не учебник, а набор глав, объясняющих «на пальцах» применение действительно релевантных для задач бизнеса методов и концепций. Также материал покрывает следующие топики:
— корреляции и Парадокс Симпсона;
— рандомизированные эксперементы;
— Propensity Scores;
— SUTVA;
— Causal Graphical Models;
— регрессионные методы;
— А/В-тесты на больших данных;
— диагностика «здоровья» А/В-систем;
— повышение чувствительности метрик.
• Главная мысль
Causality может эффективно применяться не только в академических исследованиях, но и в реальных задачах бизнеса на больших данных и высоконагруженных системах. Конспект дает базу про проектирование, запуск и интерпретацию экспериментов. Поэтому, если ещё остались вопросы, почему SRM — не баг, а симптом, или зачем в CUPED важно корректно задавать ковариты — то вам точно стоит прочитать статью.
• От себя
Это must-read для тех, кто строит эксперименты в проде, особенно если вы хотите верхнеуровнево понять, как устроены платформы уровня Bing, Airbnb или Booking. На мой взгляд, конспект не покрывает важные advanced-топики, как в Causal Inference, так и в A/B — Uplift Modelling, Mixed Models, нестандартные дизайны по типу свичбэка. Всему этому уделено неприлично мало внимания — видимо, автор решил сфокусироваться на базовых понятиях.
🔵 Прочитать материал можно тут 🔵
Привет! На связи Саша Кузнецов, старший аналитик команды Trisigma External в Авито.
Когда разговор заходит о причинно-следственных выводах (Causal Inferense), часто уходят в дебри статистики, не доходя до главного — как это работает в индустрии и зачем это нужно бизнесу.
Алекс Дэнг (ex-Microsoft, один из авторов CUPED и многих других industry-standard техник) написал открытый конспект про causality — «Causal Inference and Its Applications in Online Industry».
• Что внутри
Это не учебник, а набор глав, объясняющих «на пальцах» применение действительно релевантных для задач бизнеса методов и концепций. Также материал покрывает следующие топики:
— корреляции и Парадокс Симпсона;
— рандомизированные эксперементы;
— Propensity Scores;
— SUTVA;
— Causal Graphical Models;
— регрессионные методы;
— А/В-тесты на больших данных;
— диагностика «здоровья» А/В-систем;
— повышение чувствительности метрик.
• Главная мысль
Causality может эффективно применяться не только в академических исследованиях, но и в реальных задачах бизнеса на больших данных и высоконагруженных системах. Конспект дает базу про проектирование, запуск и интерпретацию экспериментов. Поэтому, если ещё остались вопросы, почему SRM — не баг, а симптом, или зачем в CUPED важно корректно задавать ковариты — то вам точно стоит прочитать статью.
• От себя
Это must-read для тех, кто строит эксперименты в проде, особенно если вы хотите верхнеуровнево понять, как устроены платформы уровня Bing, Airbnb или Booking. На мой взгляд, конспект не покрывает важные advanced-топики, как в Causal Inference, так и в A/B — Uplift Modelling, Mixed Models, нестандартные дизайны по типу свичбэка. Всему этому уделено неприлично мало внимания — видимо, автор решил сфокусироваться на базовых понятиях.
Please open Telegram to view this post
VIEW IN TELEGRAM
alexdeng.github.io
Causal Inference and Its Applications in Online Industry
this is a draft book.
❤13🔥5
Forwarded from Канал влияния
Если вы интересуетесь анализом данных, обратите внимание на серию воркшопов от Hertie School Data Science Lab*
Data Science Summer School 2025 – это бесплатные воркшопы по анализу данных и математическим основам
4 августа, 10:00 MSK, Sebastian Ramirez Ruiz
Практика основ языка R – от рабочего окружения и функций до работы с tidyverse
5 августа, 10:00 MSK
Базовый синтаксис, работа с реальными датасетами, основы визуализации и лайфхаки по использованию ИИ для обучения и автоматизации
6 августа, 10:00 MSK, Ilja Klebanov
Ключевые концепции (градиент, производные, градиентный спуск), без которых невозможны ML и DL
7 августа, 10:00 MSK, Dr. Kristian Rother
Простыми словами о матрицах, векторах, реальных задачах и даже трансформации изображений
8 августа, 10:00 MSK, Dr. Darina Goldin
О том, как измерять неопределенность, строить выводы из несовершенных данных и методологическую базу для ML и A/B-тестирования
7 августа, 15:00 MSK, Huy Dang
С нуля о том, что такое AI-агенты – инструменты, которые уже используется для автоматизации процессов, экспериментов и анализа. Создадите своего агента на Python
8 августа, 03:00 MSK, Dr. Kevin Munger
О том, как оценить влияние контента и алгоритмов в соцсетях, о дизайне экспериментов для real-world платформ (YouTube, Twitter/X, TikTok) и поведении и аудитории в медиа
#канал_зовёт
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍3🔥2