Рассмотрите вероятностную модель: бросают честную монету до первого появления орла; найдите распределение числа выпадений решки, математическое ожидание и дисперсию; затем обсудите, как изменятся эти значения для несправедливой монеты и какие методы оценки параметра следует использовать
Модель: бросают монету до первого орла. Обозначим число выпавших решек (до первого орла) через XXX (включая возможность X=0X=0X=0). 1) Справедливая монета (p=12p=\tfrac12p=21, где ppp — вероятность орла) - Распределение: P(X=k)=(12)k+1, k=0,1,2,…P(X=k)=\left(\tfrac12\right)^{k+1},\ k=0,1,2,\dotsP(X=k)=(21)k+1,k=0,1,2,…. - Математическое ожидание: EX=1\mathbb{E}X=1EX=1. - Дисперсия: Var(X)=2\operatorname{Var}(X)=2Var(X)=2. 2) Несправедливая монета (вероятность орла p∈(0,1)\;p\in(0,1)p∈(0,1)) - Геометрическое распределение (количество неудач до первой удачи): P(X=k)=(1−p)kp, k=0,1,2,… .\displaystyle P(X=k)=(1-p)^k p,\ k=0,1,2,\dots.P(X=k)=(1−p)kp,k=0,1,2,….
- Математическое ожидание: EX=1−pp.\displaystyle \mathbb{E}X=\frac{1-p}{p}.EX=p1−p.
- Дисперсия: Var(X)=1−pp2.\displaystyle \operatorname{Var}(X)=\frac{1-p}{p^2}.Var(X)=p21−p. 3) Оценивание параметра ppp (при независимых повторениях эксперимента, наблюдения X1,…,XnX_1,\dots,X_nX1,…,Xn) - Функция правдоподобия: L(p)=∏i=1np(1−p)Xi=pn(1−p)∑Xi.\displaystyle L(p)=\prod_{i=1}^n p(1-p)^{X_i}=p^n(1-p)^{\sum X_i}.L(p)=i=1∏np(1−p)Xi=pn(1−p)∑Xi.
- MLE (и метод моментов совпадает): p^MLE=nn+∑i=1nXi.\displaystyle \hat p_{\mathrm{MLE}}=\frac{n}{n+\sum_{i=1}^n X_i}.p^MLE=n+∑i=1nXin. Этот оцениватель состоятельный и асимптотически нормальный. - Асимптотическая дисперсия MLE: Var(p^MLE)≈p2(1−p)n.\displaystyle \operatorname{Var}(\hat p_{\mathrm{MLE}})\approx\frac{p^2(1-p)}{n}.Var(p^MLE)≈np2(1−p). На практике используйте оценку с подстановкой p^\hat pp^ для построения доверительных интервалов: p^±z1−α/2p^2(1−p^)n.\displaystyle \hat p\pm z_{1-\alpha/2}\sqrt{\frac{\hat p^{2}(1-\hat p)}{n}}.p^±z1−α/2np^2(1−p^).
- Байесовский подход: при априорe Beta(α,β)\operatorname{Beta}(\alpha,\beta)Beta(α,β) апостериор для ppp будет Beta(α+n, β+∑Xi)\operatorname{Beta}(\alpha+n,\ \beta+\sum X_i)Beta(α+n,β+∑Xi). При непараметрическом равновероятном априоре α=β=1\alpha=\beta=1α=β=1 апостериорное среднее n+1n+∑Xi+2\displaystyle \frac{n+1}{n+\sum X_i+2}n+∑Xi+2n+1. - Для малых выборок полезны байесовские оценки или бутстрэп; можно также оценивать непосредственно EX\mathbb{E}XEX через выборочное среднее Xˉ=1n∑Xi\bar X=\frac{1}{n}\sum X_iXˉ=n1∑Xi и дисперсию через выборочную дисперсию s2s^2s2. Кратко: модель — геометрическая с параметром ppp; для несправедливой монеты формулы заменяются общими выражениями через ppp; для оценки ppp предпочтительны MLE/метод моментов (совпадают), а при необходимости — байесовский подход или бутстрэп для малых выборок.
1) Справедливая монета (p=12p=\tfrac12p=21 , где ppp — вероятность орла)
- Распределение: P(X=k)=(12)k+1, k=0,1,2,…P(X=k)=\left(\tfrac12\right)^{k+1},\ k=0,1,2,\dotsP(X=k)=(21 )k+1, k=0,1,2,….
- Математическое ожидание: EX=1\mathbb{E}X=1EX=1.
- Дисперсия: Var(X)=2\operatorname{Var}(X)=2Var(X)=2.
2) Несправедливая монета (вероятность орла p∈(0,1)\;p\in(0,1)p∈(0,1))
- Геометрическое распределение (количество неудач до первой удачи):
P(X=k)=(1−p)kp, k=0,1,2,… .\displaystyle P(X=k)=(1-p)^k p,\ k=0,1,2,\dots.P(X=k)=(1−p)kp, k=0,1,2,…. - Математическое ожидание: EX=1−pp.\displaystyle \mathbb{E}X=\frac{1-p}{p}.EX=p1−p . - Дисперсия: Var(X)=1−pp2.\displaystyle \operatorname{Var}(X)=\frac{1-p}{p^2}.Var(X)=p21−p .
3) Оценивание параметра ppp (при независимых повторениях эксперимента, наблюдения X1,…,XnX_1,\dots,X_nX1 ,…,Xn )
- Функция правдоподобия: L(p)=∏i=1np(1−p)Xi=pn(1−p)∑Xi.\displaystyle L(p)=\prod_{i=1}^n p(1-p)^{X_i}=p^n(1-p)^{\sum X_i}.L(p)=i=1∏n p(1−p)Xi =pn(1−p)∑Xi . - MLE (и метод моментов совпадает): p^MLE=nn+∑i=1nXi.\displaystyle \hat p_{\mathrm{MLE}}=\frac{n}{n+\sum_{i=1}^n X_i}.p^ MLE =n+∑i=1n Xi n . Этот оцениватель состоятельный и асимптотически нормальный.
- Асимптотическая дисперсия MLE: Var(p^MLE)≈p2(1−p)n.\displaystyle \operatorname{Var}(\hat p_{\mathrm{MLE}})\approx\frac{p^2(1-p)}{n}.Var(p^ MLE )≈np2(1−p) . На практике используйте оценку с подстановкой p^\hat pp^ для построения доверительных интервалов: p^±z1−α/2p^2(1−p^)n.\displaystyle \hat p\pm z_{1-\alpha/2}\sqrt{\frac{\hat p^{2}(1-\hat p)}{n}}.p^ ±z1−α/2 np^ 2(1−p^ ) . - Байесовский подход: при априорe Beta(α,β)\operatorname{Beta}(\alpha,\beta)Beta(α,β) апостериор для ppp будет Beta(α+n, β+∑Xi)\operatorname{Beta}(\alpha+n,\ \beta+\sum X_i)Beta(α+n, β+∑Xi ). При непараметрическом равновероятном априоре α=β=1\alpha=\beta=1α=β=1 апостериорное среднее n+1n+∑Xi+2\displaystyle \frac{n+1}{n+\sum X_i+2}n+∑Xi +2n+1 .
- Для малых выборок полезны байесовские оценки или бутстрэп; можно также оценивать непосредственно EX\mathbb{E}XEX через выборочное среднее Xˉ=1n∑Xi\bar X=\frac{1}{n}\sum X_iXˉ=n1 ∑Xi и дисперсию через выборочную дисперсию s2s^2s2.
Кратко: модель — геометрическая с параметром ppp; для несправедливой монеты формулы заменяются общими выражениями через ppp; для оценки ppp предпочтительны MLE/метод моментов (совпадают), а при необходимости — байесовский подход или бутстрэп для малых выборок.