Дан процесс Бернулли с неизвестной вероятностью успеха p: какие способы оценки p вы предложите по выборке и в каких ситуациях предпочтительнее байесовский подход
Предыдущий
вопрос Следующий
вопрос

Question

Дан процесс Бернулли с неизвестной вероятностью успеха p: какие способы оценки p вы предложите по выборке и в каких ситуациях предпочтительнее байесовский подход
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по математике

Дан процесс Бернулли...

eva

24 Ноя в 09:24

2 +2

0

Helper · Answer 1

Способы оценки

p

и краткие рекомендации.
1) Точечные оценки
- Оценка максимального правдоподобия (MLE) / метод моментов:

p^=Xn,X=∑i=1nYi. \hat p=\frac{X}{n},\quad X=\sum_{i=1}^n Y_i.

Свойства: несмещённа,

Var(p^)=p(1−p)n\mathrm{Var}(\hat p)=\dfrac{p(1-p)}{n}

. Для больших

n

асимптотически нормальна.
- Байесовская точечная оценка (при Beta-приоре

Beta(a,b)\mathrm{Beta}(a,b)

):
- апостериорное распределение:

b+n−X)\mathrm{Beta}(a+X,\; b+n-X)

.
- апостериорное среднее:

\mathbb{E}[p\mid X]=\frac{a+X}{a+b+n}.

- MAP (если

b+n−X>1a+X>1,\; b+n-X>1

):

p_{\mathrm{MAP}}=\frac{a+X-1}{a+b+n-2}.

2) Интервальные оценки (интервалы доверительные / доверительные и апостериорные)
- Вольд (Wald) — нормальная аппроксимация:

p^±z1−α/2p^(1−p^)n. \hat p\pm z_{1-\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}.

Быстро считается, но плохо себя ведёт при малых

n

или при

p^\hat p

близком к

0

или

1

.
- Wilson (лучше чем Wald при малых

n

):
Пусть

z=z1−α/2z=z_{1-\alpha/2}

. Центр и полуширина:

p~=p^+z22n1+z2n,половина ширины=zp^(1−p^)n+z24n21+z2n. \tilde p=\frac{\hat p+\frac{z^2}{2n}}{1+\frac{z^2}{n}},\qquad \text{половина ширины}=\frac{z\sqrt{\frac{\hat p(1-\hat p)}{n}+\frac{z^2}{4n^2}}}{1+\frac{z^2}{n}}.

- Agresti–Coull (псевдосчёты):

\tilde p=\frac{X+\frac{z^2}{2}}{n+z^2},

дальше применяют нормальную формулу к

p~\tilde p

.
- Clopper–Pearson («точный» биномиальный доверительный интервал):
Для уровня

1−α1-\alpha

границы через обратную функцию бета:

\text{Lower} = \mathrm{B}^{-1}\!\left(\frac{\alpha}{2};\,X,\;n-X+1\right),\qquad \text{Upper} = \mathrm{B}^{-1}\!\left(1-\frac{\alpha}{2};\,X+1,\;n-X\right).

Надёжный (непереходящий ниже заданного уровня), но консервативен.
- Байесовский (кредитные) интервалы: при

Beta(a,b)\mathrm{Beta}(a,b)

апостериорный

(1−α)(1-\alpha)

-интервал — квантили апостериорного

Beta(a+X,b+n−X)\mathrm{Beta}(a+X,b+n-X)

(например, для непараметрической «Jeffreys»-приоры

a = b = 1/2

получаем хорошие частотные свойства).
3) Выбор метода — когда что предпочтительнее
- Частотный (MLE, Wilson, Clopper–Pearson) хорош при больших

n

и отсутствии априорной информации; прост и имеет частотную интерпретацию.
- Bayesian предпочтителен, если:
- малая выборка или наблюдается

X = 0

или

X = n

(крайние случаи), где нормальные приближения дают неверные интервалы;
- имеется достоверная априорная информация, которую нужно формально учесть;
- требуется прямая апостериорная вероятность событий (например, «вероятность, что

p>p_0

»);
- нужен простой последовательный (online) апдейт при приходе данных;
- модель становится иерархической (много групп) — байесовские иерархические модели естественны и стабилизируют оценки (shrinkage);
- требуется учёт потерь / оптимальное решение по критерию ожидаемой полезности (решения на основе апостериорного распределения).
Кроме того, для биномиальной задачи байесовский подход с Beta-приорой прост в вычислениях (конъюгированность) и часто даёт интервалы с хорошими частотными свойствами (например, Jeffreys-приора).
4) Практические рекомендации
- Если

n

достаточно велико и

p^\hat p

не близко к 0 или 1: MLE и Wilson/Agresti–Coull подойдут.
- Если

n

мало или наблюдаются крайние результаты: используйте Clopper–Pearson или байесовский интервал с невырожденной приорой (Jeffreys

Beta(1/2,1/2)\mathrm{Beta}(1/2,1/2)

как непараметрический выбор).
- Если есть информативная априорная информация или иерархия — однозначно байесовский подход.
Если нужно, могу привести код/шаги для вычисления конкретных интервалов или показательные примеры.

Другие вопросы eva

Другие вопросы
eva