В статистике предлагаются два оценивателя дисперсии выборки: S_n^2 = (1/n) sum (X_i - X_bar)^2 и S_{n-1}^2 = (1/(n-1)) sum (X_i - X_bar)^2. Проанализируйте их смещение, состоятельность и среднеквадратичную ошибку; в каких практических ситуациях предпочтительнее использовать несмещённый оцениватель, а когда может быть оправдано использование делителя n?

22 Окт в 14:53
6 +6
0
Ответы
1
Кратко и по пунктам.
Определения:
Sn2=1n∑i=1n(Xi−Xˉ)2,Sn−12=1n−1∑i=1n(Xi−Xˉ)2.S_n^2=\dfrac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2,\qquad
S_{n-1}^2=\dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2.
Sn2 =n1 i=1n (Xi Xˉ)2,Sn12 =n11 i=1n (Xi Xˉ)2.

Смещение:
- Так как E ⁣[∑i=1n(Xi−Xˉ)2]=(n−1)σ2E\!\Big[\sum_{i=1}^n (X_i-\bar X)^2\Big]=(n-1)\sigma^2E[i=1n (Xi Xˉ)2]=(n1)σ2, то
E[Sn2]=n−1nσ2E[S_n^2]=\dfrac{n-1}{n}\sigma^2E[Sn2 ]=nn1 σ2, т.е. смещение
Bias⁡(Sn2)=−σ2n\operatorname{Bias}(S_n^2)=-\dfrac{\sigma^2}{n}Bias(Sn2 )=nσ2 .
- E[Sn−12]=σ2E[S_{n-1}^2]=\sigma^2E[Sn12 ]=σ2, т.е. Sn−12S_{n-1}^2Sn12 несмещённый.
Состоятельность:
- При E[X2]<∞E[X^2]<\inftyE[X2]< оба оценивателя сходятся по вероятности к σ2\sigma^2σ2:
Sn2→pσ2, Sn−12→pσ2S_n^2\stackrel{p}{\to}\sigma^2,\; S_{n-1}^2\stackrel{p}{\to}\sigma^2Sn2 pσ2,Sn12 pσ2.
(Дело в том, что Sn2=1n∑Xi2−Xˉ2S_n^2=\frac{1}{n}\sum X_i^2-\bar X^2Sn2 =n1 Xi2 Xˉ2, и обе части сходятся.)
Среднеквадратичная ошибка (MSE):
- Общая формула: MSE⁡(θ^)=Var⁡(θ^)+Bias⁡(θ^)2\operatorname{MSE}(\hat\theta)=\operatorname{Var}(\hat\theta)+\operatorname{Bias}(\hat\theta)^2MSE(θ^)=Var(θ^)+Bias(θ^)2.
- Для общего распределения дисперсия оценивателя зависит от четвёртого центрального момента μ4=E[(X−μ)4]\mu_4=E[(X-\mu)^4]μ4 =E[(Xμ)4] (формула громоздкая); важно, что Var уменьшается как O(1/n)O(1/n)O(1/n) при конечной μ4\mu_4μ4 .
- Для нормального распределения (точные простые выражения):
Var⁡(Sn−12)=2σ4 n−1 ,\operatorname{Var}(S_{n-1}^2)=\dfrac{2\sigma^4}{\,n-1\,},Var(Sn12 )=n12σ4 , Var⁡(Sn2)=2(n−1)σ4n2.\operatorname{Var}(S_n^2)=\dfrac{2(n-1)\sigma^4}{n^2}.Var(Sn2 )=n22(n1)σ4 . Тогда
MSE⁡(Sn−12)=2σ4 n−1 ,\operatorname{MSE}(S_{n-1}^2)=\dfrac{2\sigma^4}{\,n-1\,},MSE(Sn12 )=n12σ4 , MSE⁡(Sn2)=2(n−1)σ4n2+σ4n2=σ42n−1n2.\operatorname{MSE}(S_n^2)=\dfrac{2(n-1)\sigma^4}{n^2}+\dfrac{\sigma^4}{n^2}
=\sigma^4\frac{2n-1}{n^2}.
MSE(Sn2 )=n22(n1)σ4 +n2σ4 =σ4n22n1 .
Из этих выражений при n≥2n\ge2n2 следует
MSE⁡(Sn2)<MSE⁡(Sn−12)\operatorname{MSE}(S_n^2)<\operatorname{MSE}(S_{n-1}^2)MSE(Sn2 )<MSE(Sn12 ): MLE (делитель nnn) даёт меньшую MSE при нормальности, хотя и смещён.
Практические рекомендации (когда что предпочесть):
- Используйте Sn−12S_{n-1}^2Sn12 (несмещённый):
- при малых выборках и при необходимости несмещённой оценки дисперсии;
- когда строите классические доверительные интервалы и критические статистики (t-тесты, хи-кв. распределение) — стандартные процедуры требуют Sn−12S_{n-1}^2Sn12 ;
- в учебных и статистических отчётах, где важна несмещённость.
- Используйте Sn2S_n^2Sn2 (делитель nnn, MLE):
- в задачах максимального правдоподобия, машинном обучении и при оценке параметров модели (обычно предпочтительна согласованность с ML-подходом);
- когда цель — минимизировать среднеквадратичную ошибку (особенно при нормальности) или когда небольшое смещение несущественно (большие nnn);
- в прикладных/прагматичных задачах с большими выборками, где смещение −σ2/n-\sigma^2/nσ2/n пренебрежимо.
- Дополнительно: для минимизации MSE при нормальности оптимальный множитель перед ∑(Xi−Xˉ)2\sum (X_i-\bar X)^2(Xi Xˉ)2 равен 1n+1\dfrac{1}{n+1}n+11 (т.е. немного сильнее «сжать», чем MLE). Это показывает, что иногда разумно использовать смещённые, но менее дисперсионные оценки (shrinkage).
Краткое заключение:
- Sn−12S_{n-1}^2Sn12 — несмещённый и стандартный выбор для малых выборок и классической статистики; Sn2S_n^2Sn2 — смещённый, но часто даёт меньшую MSE (особенно при нормальности) и удобен в ML/ML-оцениваемых задачах; при большом nnn различие практически исчезает.
22 Окт в 16:12
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир