Biostatistics on the Table

Ну и полезное, надеюсь
Я бы очень хотел, чтобы моими introductory statistics textbooks были:
1) Statistics for Ecologists (не уверен, что все будут согласны, что она такая уж интродактари)
2) Telling Stories with Data (не совсем статистикс, но у Гелмана в рекомендациях она тоже присутствует)

Tellingstorieswithdata

Telling Stories with Data

🔥1

252 viewsMaksim Kuznetsov, 12:30

Biostatistics on the Table

https://osf.io/preprints/metaarxiv/eckdg_v1

168 viewsMaksim Kuznetsov, 15:53

Biostatistics on the Table

https://osf.io/preprints/metaarxiv/eckdg_v1

Простите, не могу удержаться )

мипи скузи

YouTube

Мискузи | Евротур. 2004.

Отрывок из фильма — "Евротур", 2004
EuroTrip.

Скотт Томас — выпускник местной школы, которому нужна помощь в изучении немецкого языка, и именно для этих целей он знакомится с жителем Германии по имени Майк и начинает с ним дружескую переписку. Причём Скотт…

190 viewsMaksim Kuznetsov, edited 15:54

Biostatistics on the Table

Meerkat Statistics выпустил видео, с которого, видимо, можно начать подготовку к прочтению дипломной работы Матвея ) И вот еще, Copula Modeling for Clinical Trials, все хотел почитать, но побаивался

Вот это прикольно должно быть почти наверное
Copulas 2: A Deep Dive in R

YouTube

Copulas 2: A Deep Dive in R

Outline:
* Bivariate logistic
** Draw contour lines
** Code example
* Sampling
** From the real, or directly from the copula
** Inverse Transform Sampling from the conditional distribution
** Code example
* Gaussian Copula
** Deriving the CDF and PDF
**…

183 viewsMaksim Kuznetsov, 10:39

Biostatistics on the Table

Forwarded from Sinекура

В среду снова радикально меняем тему; на этот раз у нас практически классическое машинное обучение, да ещё и с байесовским уклоном. Уверен, что в исполнении Максима будет интересно.

BART
Ссылка на трансляцию (среда 19 ноября, 14:00)

Максим Николаев
(МКН СПбГУ)

BART, Bayesian Additive Regression Trees — это непараметрическая модель, которая наследует выразительность от ансамблей деревьев решений и описание неопределённости от байесовского подхода. Как это часто бывает, апостериорное распределение этой модели краткой аналитической формы не имеет, поэтому для работы с ней используются методы Монте-Карло на марковских цепях (MCMC).

Мы обсудим устройство модели, а также используемые методы MCMC. В оставшееся время обсудим направления для дальнейших исследований. Материал не требует специфической подготовки, но будет полезным понимание основных понятий теории цепей Маркова вплоть до стационарного распределения.

❤2👍1🔥1

188 viewsMaksim Kuznetsov, 18:29

Biostatistics on the Table

Typst - классный
https://www.youtube.com/watch?v=jY2nCypm0Xs

YouTube

Making high-quality PDFs with Quarto and Typst (Livestream)

We recently published a massive blog post all about making custom PDF templates using Quarto and Typst. If you’re interested in creating beautiful, professional documents with R, you’ll want to check it out: https://rfortherestofus.com/2025/11/typst-blog…

228 viewsMaksim Kuznetsov, 18:22

Biostatistics on the Table

Forwarded from Evgeny Bakin

Очень прикольно сделанный сайт, позволяющий критически переосмыслить такие незыблемые вещи как ROC и AUC:

https://predictionperformancediscrimination.netlify.app/#/discrimination

❤2👍2

182 viewsMaksim Kuznetsov, 08:42

Biostatistics on the Table

Это выглядит слишком хорошо, чтобы быть правдой.
Не понимаю, почему метод так не популярен в биомедицине.

suppressPackageStartupMessages({
    library(tidyverse)
    library(logistf)
})

set.seed(15321)

n <- 150
p1 <- 0.015
p2 <- 0.03

x <- rep(0:1, each = n)
probs <- rep(c(p1, p2), each = n)

sim <- function() {
    df <- data.frame(
        x = x,
        y = rbinom(
            n = n * 2, size = 1, 
            prob = probs
        )
    )
    
    fit <- logistf(
        y ~ x, data = df, 
        pl = TRUE, firth = TRUE
    )
    
    c(
        n1 = sum(df$y[x == 0]), 
        n2 = sum(df$y[x == 1]),
        beta = fit$coefficients[[2]],
        lcl = fit$ci.lower[[2]], 
        ucl = fit$ci.upper[[2]],
        lrt = 1 - pchisq(-2 * diff(fit$loglik), df = 1)
    )
}

res <- replicate(10000, sim())

eff <- log((p2/(1 - p2))/(p1/(1 - p1)))

t(res) |>
    as_tibble() |>
    mutate(eff = eff) |>
    summarise(
        coverage = mean(between(eff, lcl, ucl)),
        power = mean(lrt.null < 0.05),
        `S-type` = mean(beta < 0 & lrt.null < 0.05),
        mean = mean(beta),
        true = mean(eff),
        bias = mean - true
    )

183 viewsMaksim Kuznetsov, edited 12:17

Biostatistics on the Table

Это выглядит слишком хорошо, чтобы быть правдой. Не понимаю, почему метод так не популярен в биомедицине. suppressPackageStartupMessages({ library(tidyverse) library(logistf) }) set.seed(15321) n <- 150 p1 <- 0.015 p2 <- 0.03 x <- rep(0:1, each…

171 viewsMaksim Kuznetsov, 12:17

Biostatistics on the Table

Здесь очень сложная ситуация.
Редкие события и маленькая выборка, с учетом редкости событий в одной из групп с 10% вероятностью событий не будет вовсе.
Но я ничего не фильтровал и никаких na.rm = TRUE, все 10000 моделей сошлись и ДИ почти обеспечивают заявленную альфу (полуторапроцентное перепокрытие мне представляется даже чем-то хорошим с практической точки зрения).
Просто попробуйте, кому интересно, glm() с вальдовскими интервалами при такой ситуации запустить (вернее даже при более мягкой, здесь с glm в общем-то ловить совсем нечего).

176 viewsMaksim Kuznetsov, edited 12:24

Biostatistics on the Table

в одной из групп с 10% вероятностью событий не будет вовсе

В рассматриваемом сценарии хотя бы в одной из групп не было событий в 1105 случаях, в обеих (!) группах не было событий в 10 случаях (да, в этих случаях мы тоже получили оценки эффекта, понятно, что это не очень информативно, но все же прикольно).

206 viewsMaksim Kuznetsov, edited 12:42

Biostatistics on the Table

Интересно будет еще байесовский бутстреп с этой моделью попробовать релизовать для RD и RR

192 viewsMaksim Kuznetsov, 13:45

Biostatistics on the Table

Вдруг кому-то пригодится

165 viewsMaksim Kuznetsov, 11:07

Biostatistics on the Table

Forwarded from Maksim Kuznetsov

Не ответ на вопрос, но в последнее время я обратил внимание, что очень часто в качестве учебника по статистике рекомендуют вот эту книгу

https://www.routledge.com/Statistical-Inference/Casella-Berger/p/book/9781032593036

Routledge & CRC Press

Statistical Inference

This classic textbook builds theoretical statistics from the first principles of probability theory. Starting from the basics of probability, the authors develop the theory of statistical inference using techniques, definitions, and concepts that are statistical…

175 viewsMaksim Kuznetsov, 11:07

Biostatistics on the Table

Maksim Kuznetsov

Не ответ на вопрос, но в последнее время я обратил внимание, что очень часто в качестве учебника по статистике рекомендуют вот эту книгу https://www.routledge.com/Statistical-Inference/Casella-Berger/p/book/9781032593036

Вот, буквально на днях

200 viewsMaksim Kuznetsov, 11:10

Biostatistics on the Table

Это очень интересные сюжеты, кстати

179 viewsMaksim Kuznetsov, 12:53

Biostatistics on the Table

Forwarded from Sinекура

В курсе "Основы байесовского вывода" сегодня поговорили о двух важных общих сюжетах:

СПбГУ — 2025.11.27 — Принцип максимума энтропии и априорные распределения Джеффриса
(слайды и доска на странице курса)

Принцип максимума энтропии показывает, какие распределения вероятностей являются "наиболее характерными". Сам принцип приходит из статистической физики, из работ Гиббса и того же Эдвина Джейнса, но и в машинном обучении тоже встречается. Так что в виде небольшого лирического отступления рассказал, откуда берётся максимизация энтропии, и привёл пару примеров.

А главный сегодняшний объект, априорные распределения Джеффриса, решает проблему, которая возникает из наивного вопроса: что происходит с априорными распределениями при репараметризации? Предположим, что мы хотим выразить незнание о параметре монетки, и выражаем его равномерным априорным распределением на [0, 1]. Но если мы перейдём от вероятности орла, скажем, к log-odds, что является даже более естественной параметризацией, равномерное распределение превратится в бог знает что... Сэр Рональд Фишер критиковал за это весь байесианизм в целом, а другой сэр Гарольд Джеффрис предложил потребовать инвариантность при репараметризации как свойство априорных распределений, и получились как раз в довольно глубоком смысле "распределения полного незнания".

#spsu #lectures #bayes2025

❤1

188 viewsMaksim Kuznetsov, 12:53

About

Blog

Apps

Platform