Sinекура
Принцип максимума энтропии показывает, какие распределения вероятностей являются "наиболее характерными"
Это, кстати, основа эпистемологического обоснования использования нормального распределения (точнее нормального правдоподобия), т.е. без ЦПТ. Очень прикольная тема, сейчас промотал лекцию, Николенко в ней как раз это обоснование в качестве примера приводит.
Сейчас подумал, что MCMC (вернее анализ того, что происходит внутри цепи) очень ярко отражают контринтуитивность теорвера и матстата.
Пост Вехтари в блоге Гелмана про effective sample size
Пост Вехтари в блоге Гелмана про effective sample size
Biostatistics on the Table
Сейчас подумал, что MCMC (вернее анализ того, что происходит внутри цепи) очень ярко отражают контринтуитивность теорвера и матстата. Пост Вехтари в блоге Гелмана про effective sample size
То есть, сложно же себе представить такое: есть случайный процесс, в котором каждое последующее наблюдение отрицательно коррелирует с предыдущим и в итоге вы получаете больше информации о маргинальном распределении по сравнению с информацией, что несет выборка с полностью незваисимыми наблюдениями, потом просто трансформируете элементы выборки и информации о маргинальном распределении трансформированой величины становится меньше.
Пришла в голову следующая задачка:
Думаю, что многие знают, что t-тест Стьюдента является просто частным случаем МНК регрессии.
Вопрос состоит в следующем: как можно с помощью регрессионной модели, которая потенциально может включать не только один предиктор, воспроизвести результаты t-теста Уэлча, который не делает допущения о гомоскедастичности? 🙃
Думаю, что многие знают, что t-тест Стьюдента является просто частным случаем МНК регрессии.
set.seed(42)
x <- rep(0:1, times = c(10, 15))
y <- rnorm(length(x), mean = x)
t.test(y ~ x, var.equal = TRUE) |>
broom::tidy() |>
dplyr::select(
estimate, statistic, p.value
)
#> # A tibble: 1 × 3
#> estimate statistic p.value
#> <dbl> <dbl> <dbl>
#> 1 -0.400 -0.755 0.458
lm(y ~ x) |>
broom::tidy() |>
dplyr::filter(term != "(Intercept)") |>
dplyr::select(
estimate, statistic, p.value
)
#> # A tibble: 1 × 3
#> estimate statistic p.value
#> <dbl> <dbl> <dbl>
#> 1 0.400 0.755 0.458
Вопрос состоит в следующем: как можно с помощью регрессионной модели, которая потенциально может включать не только один предиктор, воспроизвести результаты t-теста Уэлча, который не делает допущения о гомоскедастичности? 🙃
t.test(y ~ x, var.equal = FALSE) |>
broom::tidy() |>
dplyr::select(
estimate, statistic, p.value
)
#> # A tibble: 1 × 3
#> estimate statistic p.value
#> <dbl> <dbl> <dbl>
#> 1 -0.400 -0.845 0.407
Biostatistics on the Table
Пришла в голову следующая задачка: Думаю, что многие знают, что t-тест Стьюдента является просто частным случаем МНК регрессии. set.seed(42) x <- rep(0:1, times = c(10, 15)) y <- rnorm(length(x), mean = x) t.test(y ~ x, var.equal = TRUE) |> broom::tidy()…
Я нашел такое.
В нем для воспроизведения важны не только структура дисперсии, но и использование REML и аппроксимация df по Саттервайту.
В нем для воспроизведения важны не только структура дисперсии, но и использование REML и аппроксимация df по Саттервайту.
set.seed(42)
x <- rep(0:1, times = c(10, 15))
y <- rnorm(length(x), mean = x)
t.test(y ~ x, var.equal = FALSE) |>
broom::tidy() |>
dplyr::select(
estimate, statistic, df = parameter, p.value
)
#> # A tibble: 1 × 4
#> estimate statistic df p.value
#> <dbl> <dbl> <dbl> <dbl>
#> 1 -0.400 -0.845 22.4 0.407
nlme::gls(
y ~ x,
weights = nlme::varIdent(form = ~ 1 | x),
method = "REML"
) |>
emmeans::emmeans(~ x, mode = "satterthwaite") |>
emmeans::contrast("revpairwise") |>
tibble::as_tibble() |>
dplyr::select(
estimate,
statistic = t.ratio,
df, p.value
)
#> # A tibble: 1 × 4
#> estimate statistic df p.value
#> <dbl> <dbl> <dbl> <dbl>
#> 1 0.400 0.845 22.4 0.407
👍2
Forwarded from Maksim Kuznetsov
Не так давно, кстати, наткнулся на интересные примеры по взаимодействиям. Один из них может иметь отношение к обсуждению кмк
❤3
И еще полезное от Ольги Мироненко. Очень хорошая книжка похоже
R for Health Technology Assessment
R for Health Technology Assessment
gianluca.statistica.it
R for Health Technology Assessment
❤3
Biostatistics on the Table
На Amazon появилась страничка самой ожидаемой книжки. Видимо, как апостриорное распределение является компромиссом между априорным и правдоподобием, так и имя автора - что-то среднее между Гелманом и Карпентером
Обновление от Аки Вехтари.
Интересно, когда наконец появится электронная версия
Интересно, когда наконец появится электронная версия
Biostatistics on the Table
Только сейчас обратил внимание, какое милое hex-logo у пакета {{mice}}* * Multivariate Imputation by Chained Equations
И тут вдруг неожиданно появляется тайдиверс
❤5
Forwarded from Maksim Kuznetsov
Книга по пропускам и mice от автора пакета
У пакета mice есть очень хорошая документация
Альтернатива mice (другая реализиация FCS) для сложных моделей и моделей выживаемости
У пакета mice есть очень хорошая документация
Альтернатива mice (другая реализиация FCS) для сложных моделей и моделей выживаемости
amices.org
Multivariate Imputation by Chained Equations
Multiple imputation using Fully Conditional Specification (FCS) implemented by the MICE algorithm as described in Van Buuren and Groothuis-Oudshoorn (2011) <doi:10.18637/jss.v045.i03>. Each variable has its own imputation model. Built-in imputation models…
👍5
Biostatistics on the Table
Photo
Кошку, видимо, MNAR зовут )
Это потому что свысока на мышку смотрит.
Исходно это мем из лекции МакЭлрита, там ее скорее MAR бы звали.
Это потому что свысока на мышку смотрит.
Исходно это мем из лекции МакЭлрита, там ее скорее MAR бы звали.
😁3
Biostatistics on the Table
Обновление от Аки Вехтари. Интересно, когда наконец появится электронная версия
Обновление от Ричарда МакЭлрита.
Ждем, очень ждем...
Ждем, очень ждем...
❤2👍1🔥1