Biostatistics on the Table – Telegram

Biostatistics on the Table

@tabulated_stats

314 subscribers

108 photos

5 videos

1 file

114 links

Место, где ML расшифровывается как Maximum Likelihood

Download Telegram

About

Blog

Apps

Platform

Biostatistics on the Table

314 subscribers

Biostatistics on the Table

Принцип максимума энтропии показывает, какие распределения вероятностей являются "наиболее характерными"

Это, кстати, основа эпистемологического обоснования использования нормального распределения (точнее нормального правдоподобия), т.е. без ЦПТ. Очень прикольная тема, сейчас промотал лекцию, Николенко в ней как раз это обоснование в качестве примера приводит.

262 viewsMaksim Kuznetsov, 17:01

Biostatistics on the Table

Сейчас подумал, что MCMC (вернее анализ того, что происходит внутри цепи) очень ярко отражают контринтуитивность теорвера и матстата.

Пост Вехтари в блоге Гелмана про effective sample size

206 viewsMaksim Kuznetsov, edited 13:51

Biostatistics on the Table

Biostatistics on the Table

Сейчас подумал, что MCMC (вернее анализ того, что происходит внутри цепи) очень ярко отражают контринтуитивность теорвера и матстата. Пост Вехтари в блоге Гелмана про effective sample size

То есть, сложно же себе представить такое: есть случайный процесс, в котором каждое последующее наблюдение отрицательно коррелирует с предыдущим и в итоге вы получаете больше информации о маргинальном распределении по сравнению с информацией, что несет выборка с полностью незваисимыми наблюдениями, потом просто трансформируете элементы выборки и информации о маргинальном распределении трансформированой величины становится меньше.

192 viewsMaksim Kuznetsov, 14:29

Biostatistics on the Table

Пришла в голову следующая задачка:
Думаю, что многие знают, что t-тест Стьюдента является просто частным случаем МНК регрессии.

set.seed(42)
x <- rep(0:1, times = c(10, 15))
y <- rnorm(length(x), mean = x)

t.test(y ~ x, var.equal = TRUE) |>
    broom::tidy() |>
    dplyr::select(
        estimate, statistic, p.value
    )
#> # A tibble: 1 × 3
#>   estimate statistic p.value
#>      <dbl>     <dbl>   <dbl>
#> 1   -0.400    -0.755   0.458

lm(y ~ x) |>
    broom::tidy() |>
    dplyr::filter(term != "(Intercept)") |>
    dplyr::select(
        estimate, statistic, p.value
    )
#> # A tibble: 1 × 3
#>   estimate statistic p.value
#>      <dbl>     <dbl>   <dbl>
#> 1    0.400     0.755   0.458

Вопрос состоит в следующем: как можно с помощью регрессионной модели, которая потенциально может включать не только один предиктор, воспроизвести результаты t-теста Уэлча, который не делает допущения о гомоскедастичности? 🙃

t.test(y ~ x, var.equal = FALSE) |>
    broom::tidy() |>
    dplyr::select(
        estimate, statistic, p.value
    )
#> # A tibble: 1 × 3
#>   estimate statistic p.value
#>      <dbl>     <dbl>   <dbl>
#> 1   -0.400    -0.845   0.407

206 viewsMaksim Kuznetsov, edited 16:44

Biostatistics on the Table

Biostatistics on the Table

Пришла в голову следующая задачка: Думаю, что многие знают, что t-тест Стьюдента является просто частным случаем МНК регрессии. set.seed(42) x <- rep(0:1, times = c(10, 15)) y <- rnorm(length(x), mean = x) t.test(y ~ x, var.equal = TRUE) |> broom::tidy()…

Я нашел такое.
В нем для воспроизведения важны не только структура дисперсии, но и использование REML и аппроксимация df по Саттервайту.

set.seed(42)
x <- rep(0:1, times = c(10, 15))
y <- rnorm(length(x), mean = x)

t.test(y ~ x, var.equal = FALSE) |>
    broom::tidy() |>
    dplyr::select(
        estimate, statistic, df = parameter, p.value
    )
#> # A tibble: 1 × 4
#>   estimate statistic    df p.value
#>      <dbl>     <dbl> <dbl>   <dbl>
#> 1   -0.400    -0.845  22.4   0.407

nlme::gls(
    y ~ x, 
    weights = nlme::varIdent(form = ~ 1 | x),
    method = "REML"
) |>
    emmeans::emmeans(~ x, mode = "satterthwaite") |>
    emmeans::contrast("revpairwise") |>
    tibble::as_tibble() |>
    dplyr::select(
        estimate, 
        statistic = t.ratio,
        df, p.value
    )
#> # A tibble: 1 × 4
#>   estimate statistic    df p.value
#>      <dbl>     <dbl> <dbl>   <dbl>
#> 1    0.400     0.845  22.4   0.407

👍2

279 viewsMaksim Kuznetsov, edited 19:14

Biostatistics on the Table

Закину сюда, довольно интересные материалы

204 viewsMaksim Kuznetsov, 15:59

Biostatistics on the Table

Forwarded from Maksim Kuznetsov

Не так давно, кстати, наткнулся на интересные примеры по взаимодействиям. Один из них может иметь отношение к обсуждению кмк

❤3

286 viewsMaksim Kuznetsov, 15:59

Biostatistics on the Table

Занимательные факты
X ~ Witch(x₀, γ)

❤2

256 viewsMaksim Kuznetsov, edited 14:49

Biostatistics on the Table

На Amazon появилась страничка самой ожидаемой книжки.
Видимо, как апостриорное распределение является компромиссом между априорным и правдоподобием, так и имя автора - что-то среднее между Гелманом и Карпентером

228 viewsMaksim Kuznetsov, edited 17:50

Biostatistics on the Table

И еще полезное от Ольги Мироненко. Очень хорошая книжка похоже
R for Health Technology Assessment

gianluca.statistica.it

R for Health Technology Assessment

❤3

257 viewsMaksim Kuznetsov, 18:02

Biostatistics on the Table

Biostatistics on the Table

На Amazon появилась страничка самой ожидаемой книжки. Видимо, как апостриорное распределение является компромиссом между априорным и правдоподобием, так и имя автора - что-то среднее между Гелманом и Карпентером

Обновление от Аки Вехтари.
Интересно, когда наконец появится электронная версия

202 viewsMaksim Kuznetsov, edited 20:01

Biostatistics on the Table

Только сейчас обратил внимание, какое милое hex-logo у пакета {{mice}}*

* Multivariate Imputation by Chained Equations

❤8

178 viewsMaksim Kuznetsov, edited 18:29

Biostatistics on the Table

Biostatistics on the Table

Только сейчас обратил внимание, какое милое hex-logo у пакета {{mice}}* * Multivariate Imputation by Chained Equations

И тут вдруг неожиданно появляется тайдиверс

❤5

196 viewsMaksim Kuznetsov, 18:35

Biostatistics on the Table

Forwarded from Maksim Kuznetsov

Книга по пропускам и mice от автора пакета
У пакета mice есть очень хорошая документация
Альтернатива mice (другая реализиация FCS) для сложных моделей и моделей выживаемости

Multivariate Imputation by Chained Equations

Multiple imputation using Fully Conditional Specification (FCS) implemented by the MICE algorithm as described in Van Buuren and Groothuis-Oudshoorn (2011) <doi:10.18637/jss.v045.i03>. Each variable has its own imputation model. Built-in imputation models…

👍5

227 viewsMaksim Kuznetsov, 18:40

Biostatistics on the Table

Biostatistics on the Table

Только сейчас обратил внимание, какое милое hex-logo у пакета {{mice}}* * Multivariate Imputation by Chained Equations

🤣3

236 viewsMaksim Kuznetsov, 19:05

Biostatistics on the Table

Biostatistics on the Table

Кошку, видимо, MNAR зовут )
Это потому что свысока на мышку смотрит.
Исходно это мем из лекции МакЭлрита, там ее скорее MAR бы звали.

😁3

253 viewsMaksim Kuznetsov, edited 19:06

Biostatistics on the Table

Forwarded from Biostatistics on the Table chat

❤5👍2🔥1

266 viewsMaksim Kuznetsov, 14:55

Biostatistics on the Table

242 viewsMaksim Kuznetsov, 10:56

Biostatistics on the Table

Biostatistics on the Table

Обновление от Аки Вехтари. Интересно, когда наконец появится электронная версия

Обновление от Ричарда МакЭлрита.
Ждем, очень ждем...

❤2👍1🔥1

257 viewsMaksim Kuznetsov, 08:32