В статистике предлагаются два оценивателя дисперсии выборки: S_n^2 = (1/n) sum (X_i - X_bar)^2 и S_{n-1}^2 = (1/(n-1)) sum (X_i - X_bar)^2. Проанализируйте их смещение, состоятельность и среднеквадратичную ошибку; в каких практических ситуациях предпочтительнее использовать несмещённый оцениватель, а когда может быть оправдано использование делителя n?
Кратко и по пунктам. Определения: Sn2=1n∑i=1n(Xi−Xˉ)2,Sn−12=1n−1∑i=1n(Xi−Xˉ)2.S_n^2=\dfrac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2,\qquad S_{n-1}^2=\dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2.Sn2=n1∑i=1n(Xi−Xˉ)2,Sn−12=n−11∑i=1n(Xi−Xˉ)2. Смещение: - Так как E [∑i=1n(Xi−Xˉ)2]=(n−1)σ2E\!\Big[\sum_{i=1}^n (X_i-\bar X)^2\Big]=(n-1)\sigma^2E[∑i=1n(Xi−Xˉ)2]=(n−1)σ2, то E[Sn2]=n−1nσ2E[S_n^2]=\dfrac{n-1}{n}\sigma^2E[Sn2]=nn−1σ2, т.е. смещение Bias(Sn2)=−σ2n\operatorname{Bias}(S_n^2)=-\dfrac{\sigma^2}{n}Bias(Sn2)=−nσ2. - E[Sn−12]=σ2E[S_{n-1}^2]=\sigma^2E[Sn−12]=σ2, т.е. Sn−12S_{n-1}^2Sn−12 несмещённый. Состоятельность: - При E[X2]<∞E[X^2]<\inftyE[X2]<∞ оба оценивателя сходятся по вероятности к σ2\sigma^2σ2: Sn2→pσ2, Sn−12→pσ2S_n^2\stackrel{p}{\to}\sigma^2,\; S_{n-1}^2\stackrel{p}{\to}\sigma^2Sn2→pσ2,Sn−12→pσ2. (Дело в том, что Sn2=1n∑Xi2−Xˉ2S_n^2=\frac{1}{n}\sum X_i^2-\bar X^2Sn2=n1∑Xi2−Xˉ2, и обе части сходятся.) Среднеквадратичная ошибка (MSE): - Общая формула: MSE(θ^)=Var(θ^)+Bias(θ^)2\operatorname{MSE}(\hat\theta)=\operatorname{Var}(\hat\theta)+\operatorname{Bias}(\hat\theta)^2MSE(θ^)=Var(θ^)+Bias(θ^)2. - Для общего распределения дисперсия оценивателя зависит от четвёртого центрального момента μ4=E[(X−μ)4]\mu_4=E[(X-\mu)^4]μ4=E[(X−μ)4] (формула громоздкая); важно, что Var уменьшается как O(1/n)O(1/n)O(1/n) при конечной μ4\mu_4μ4. - Для нормального распределения (точные простые выражения): Var(Sn−12)=2σ4 n−1 ,\operatorname{Var}(S_{n-1}^2)=\dfrac{2\sigma^4}{\,n-1\,},Var(Sn−12)=n−12σ4,Var(Sn2)=2(n−1)σ4n2.\operatorname{Var}(S_n^2)=\dfrac{2(n-1)\sigma^4}{n^2}.Var(Sn2)=n22(n−1)σ4.
Тогда MSE(Sn−12)=2σ4 n−1 ,\operatorname{MSE}(S_{n-1}^2)=\dfrac{2\sigma^4}{\,n-1\,},MSE(Sn−12)=n−12σ4,MSE(Sn2)=2(n−1)σ4n2+σ4n2=σ42n−1n2.\operatorname{MSE}(S_n^2)=\dfrac{2(n-1)\sigma^4}{n^2}+\dfrac{\sigma^4}{n^2} =\sigma^4\frac{2n-1}{n^2}.MSE(Sn2)=n22(n−1)σ4+n2σ4=σ4n22n−1.
Из этих выражений при n≥2n\ge2n≥2 следует MSE(Sn2)<MSE(Sn−12)\operatorname{MSE}(S_n^2)<\operatorname{MSE}(S_{n-1}^2)MSE(Sn2)<MSE(Sn−12): MLE (делитель nnn) даёт меньшую MSE при нормальности, хотя и смещён. Практические рекомендации (когда что предпочесть): - Используйте Sn−12S_{n-1}^2Sn−12 (несмещённый): - при малых выборках и при необходимости несмещённой оценки дисперсии; - когда строите классические доверительные интервалы и критические статистики (t-тесты, хи-кв. распределение) — стандартные процедуры требуют Sn−12S_{n-1}^2Sn−12; - в учебных и статистических отчётах, где важна несмещённость. - Используйте Sn2S_n^2Sn2 (делитель nnn, MLE): - в задачах максимального правдоподобия, машинном обучении и при оценке параметров модели (обычно предпочтительна согласованность с ML-подходом); - когда цель — минимизировать среднеквадратичную ошибку (особенно при нормальности) или когда небольшое смещение несущественно (большие nnn); - в прикладных/прагматичных задачах с большими выборками, где смещение −σ2/n-\sigma^2/n−σ2/n пренебрежимо. - Дополнительно: для минимизации MSE при нормальности оптимальный множитель перед ∑(Xi−Xˉ)2\sum (X_i-\bar X)^2∑(Xi−Xˉ)2 равен 1n+1\dfrac{1}{n+1}n+11 (т.е. немного сильнее «сжать», чем MLE). Это показывает, что иногда разумно использовать смещённые, но менее дисперсионные оценки (shrinkage). Краткое заключение: - Sn−12S_{n-1}^2Sn−12 — несмещённый и стандартный выбор для малых выборок и классической статистики; Sn2S_n^2Sn2 — смещённый, но часто даёт меньшую MSE (особенно при нормальности) и удобен в ML/ML-оцениваемых задачах; при большом nnn различие практически исчезает.
Определения:
Sn2=1n∑i=1n(Xi−Xˉ)2,Sn−12=1n−1∑i=1n(Xi−Xˉ)2.S_n^2=\dfrac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2,\qquad
S_{n-1}^2=\dfrac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2.Sn2 =n1 ∑i=1n (Xi −Xˉ)2,Sn−12 =n−11 ∑i=1n (Xi −Xˉ)2.
Смещение:
- Так как E [∑i=1n(Xi−Xˉ)2]=(n−1)σ2E\!\Big[\sum_{i=1}^n (X_i-\bar X)^2\Big]=(n-1)\sigma^2E[∑i=1n (Xi −Xˉ)2]=(n−1)σ2, то
E[Sn2]=n−1nσ2E[S_n^2]=\dfrac{n-1}{n}\sigma^2E[Sn2 ]=nn−1 σ2, т.е. смещение
Bias(Sn2)=−σ2n\operatorname{Bias}(S_n^2)=-\dfrac{\sigma^2}{n}Bias(Sn2 )=−nσ2 .
- E[Sn−12]=σ2E[S_{n-1}^2]=\sigma^2E[Sn−12 ]=σ2, т.е. Sn−12S_{n-1}^2Sn−12 несмещённый.
Состоятельность:
- При E[X2]<∞E[X^2]<\inftyE[X2]<∞ оба оценивателя сходятся по вероятности к σ2\sigma^2σ2:
Sn2→pσ2, Sn−12→pσ2S_n^2\stackrel{p}{\to}\sigma^2,\; S_{n-1}^2\stackrel{p}{\to}\sigma^2Sn2 →pσ2,Sn−12 →pσ2.
(Дело в том, что Sn2=1n∑Xi2−Xˉ2S_n^2=\frac{1}{n}\sum X_i^2-\bar X^2Sn2 =n1 ∑Xi2 −Xˉ2, и обе части сходятся.)
Среднеквадратичная ошибка (MSE):
- Общая формула: MSE(θ^)=Var(θ^)+Bias(θ^)2\operatorname{MSE}(\hat\theta)=\operatorname{Var}(\hat\theta)+\operatorname{Bias}(\hat\theta)^2MSE(θ^)=Var(θ^)+Bias(θ^)2.
- Для общего распределения дисперсия оценивателя зависит от четвёртого центрального момента μ4=E[(X−μ)4]\mu_4=E[(X-\mu)^4]μ4 =E[(X−μ)4] (формула громоздкая); важно, что Var уменьшается как O(1/n)O(1/n)O(1/n) при конечной μ4\mu_4μ4 .
- Для нормального распределения (точные простые выражения):
Var(Sn−12)=2σ4 n−1 ,\operatorname{Var}(S_{n-1}^2)=\dfrac{2\sigma^4}{\,n-1\,},Var(Sn−12 )=n−12σ4 , Var(Sn2)=2(n−1)σ4n2.\operatorname{Var}(S_n^2)=\dfrac{2(n-1)\sigma^4}{n^2}.Var(Sn2 )=n22(n−1)σ4 . Тогда
MSE(Sn−12)=2σ4 n−1 ,\operatorname{MSE}(S_{n-1}^2)=\dfrac{2\sigma^4}{\,n-1\,},MSE(Sn−12 )=n−12σ4 , MSE(Sn2)=2(n−1)σ4n2+σ4n2=σ42n−1n2.\operatorname{MSE}(S_n^2)=\dfrac{2(n-1)\sigma^4}{n^2}+\dfrac{\sigma^4}{n^2}
=\sigma^4\frac{2n-1}{n^2}.MSE(Sn2 )=n22(n−1)σ4 +n2σ4 =σ4n22n−1 . Из этих выражений при n≥2n\ge2n≥2 следует
MSE(Sn2)<MSE(Sn−12)\operatorname{MSE}(S_n^2)<\operatorname{MSE}(S_{n-1}^2)MSE(Sn2 )<MSE(Sn−12 ): MLE (делитель nnn) даёт меньшую MSE при нормальности, хотя и смещён.
Практические рекомендации (когда что предпочесть):
- Используйте Sn−12S_{n-1}^2Sn−12 (несмещённый):
- при малых выборках и при необходимости несмещённой оценки дисперсии;
- когда строите классические доверительные интервалы и критические статистики (t-тесты, хи-кв. распределение) — стандартные процедуры требуют Sn−12S_{n-1}^2Sn−12 ;
- в учебных и статистических отчётах, где важна несмещённость.
- Используйте Sn2S_n^2Sn2 (делитель nnn, MLE):
- в задачах максимального правдоподобия, машинном обучении и при оценке параметров модели (обычно предпочтительна согласованность с ML-подходом);
- когда цель — минимизировать среднеквадратичную ошибку (особенно при нормальности) или когда небольшое смещение несущественно (большие nnn);
- в прикладных/прагматичных задачах с большими выборками, где смещение −σ2/n-\sigma^2/n−σ2/n пренебрежимо.
- Дополнительно: для минимизации MSE при нормальности оптимальный множитель перед ∑(Xi−Xˉ)2\sum (X_i-\bar X)^2∑(Xi −Xˉ)2 равен 1n+1\dfrac{1}{n+1}n+11 (т.е. немного сильнее «сжать», чем MLE). Это показывает, что иногда разумно использовать смещённые, но менее дисперсионные оценки (shrinkage).
Краткое заключение:
- Sn−12S_{n-1}^2Sn−12 — несмещённый и стандартный выбор для малых выборок и классической статистики; Sn2S_n^2Sn2 — смещённый, но часто даёт меньшую MSE (особенно при нормальности) и удобен в ML/ML-оцениваемых задачах; при большом nnn различие практически исчезает.