Даны независимые случайные величины X1,...,Xn с неизвестным математическим ожиданием mu и дисперсией sigma^2. Предложите несколько оценок для mu и sigma^2 (точечных и доверительных), сравните их по смещённости, состоятельности и эффективности, и обсудите, как выбор модели распределения влияет на рекомендации
Ниже — компактный обзор распространённых точечных оценок и доверительных интервалов для μ\muμ и σ2\sigma^2σ2, их свойства (смещённость, состоятельность, эффективность) и влияние предположений о модели. 1) Точечные оценки для μ\muμ
- Выборка и среднее: - Xˉ=1n∑i=1nXi\displaystyle \bar X=\frac{1}{n}\sum_{i=1}^n X_iXˉ=n1i=1∑nXi. - Смещённость: Xˉ\bar XXˉ — несмещённая оценка μ\muμ. - Состоятельность: Xˉ→pμ\bar X\stackrel{p}{\to}\muXˉ→pμ при Var(Xi)<∞\operatorname{Var}(X_i)<\inftyVar(Xi)<∞. - Эффективность: при нормальности Xˉ\bar XXˉ — UMVUE и достигает С-R границы; в общем асимптотически эффективна (CLT): n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)n(Xˉ−μ)→dN(0,σ2). - Минусы: чувствительна к выбросам. - Медиана и усечённое среднее (robust): - Медиана X~\tilde XX~ и усечённое среднее (trimmed mean) более робастны при выбросах. - Смещённость: при симметричных распределениях несмещены (асимпотически). - Состоятельность: да (при стандартных условиях). - Эффективность: при нормальности медиана имеет меньшую асимптотическую эффективность (ок. 64%64\%64% эффективности по сравнению со средним); усечённое среднее даёт компромисс. 2) Точечные оценки для σ2\sigma^2σ2
- Несмещённая выборочная дисперсия: - S2=1n−1∑i=1n(Xi−Xˉ)2\displaystyle S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2S2=n−11i=1∑n(Xi−Xˉ)2. - Смещённость: несмещённая. - Состоятельность: S2→pσ2S^2\stackrel{p}{\to}\sigma^2S2→pσ2. - Эффективность: при нормальности S2S^2S2 — UMVUE (минимальная дисперсия среди несмещённых). - MLE для σ2\sigma^2σ2 (при нормальности): - σ^MLE2=1n∑i=1n(Xi−Xˉ)2=n−1nS2\displaystyle \hat\sigma^2_{MLE}=\frac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2=\frac{n-1}{n}S^2σ^MLE2=n1i=1∑n(Xi−Xˉ)2=nn−1S2. - Смещённость: смещён вниз (на фактор (n−1)/n(n-1)/n(n−1)/n). - Часто имеет меньшую дисперсию и меньший MSE по сравнению с несмещённой оценкой при малых nnn (т.е. компромисс смещение/дисперсия). - Состоятельность: да. - Робастные оценки масштаба: - MAD: MAD=median(∣Xi−median(X)∣)\mathrm{MAD}=\mathrm{median}(|X_i-\mathrm{median}(X)|)MAD=median(∣Xi−median(X)∣), поправка для нормальности: 1.4826⋅MAD1.4826\cdot\mathrm{MAD}1.4826⋅MAD. - Робастны при выбросах; менее эффективны при нормальности. 3) Доверительные интервалы для μ\muμ
- При нормальности (точно, σ\sigmaσ не известно): - 100(1−α)%100(1-\alpha)\%100(1−α)% CI: Xˉ±t1−α/2, n−1Sn\displaystyle \bar X\pm t_{1-\alpha/2,\,n-1}\frac{S}{\sqrt n}Xˉ±t1−α/2,n−1nS. - Точный (основан на ttt-распределении), оптимален при нормальности. - Большая выборка (CLT, σ\sigmaσ неизвестно): - Xˉ±z1−α/2Sn\displaystyle \bar X\pm z_{1-\alpha/2}\frac{S}{\sqrt n}Xˉ±z1−α/2nS. - Асимптотически корректен при Var(Xi)<∞\operatorname{Var}(X_i)<\inftyVar(Xi)<∞. - Непараметрические/робастные: - Бутстрэп (перцентильный или t- бутстрэп) даёт доверительные интервалы без строгой нормальности. - Интервалы по медиане или усечённому среднему при тяжёлых хвостах. - Консервативный (Чебышёв): - Pr(∣Xˉ−μ∣≤ε)≥1−σ2nε2\Pr\big(|\bar X-\mu|\le \varepsilon\big)\ge 1-\dfrac{\sigma^2}{n\varepsilon^2}Pr(∣Xˉ−μ∣≤ε)≥1−nε2σ2 (основано на неравенстве Чебышёва) — очень широкие интервалы. 4) Доверительные интервалы для σ2\sigma^2σ2
- При нормальности (точно): - ((n−1)S2χ1−α/2, n−12, (n−1)S2χα/2, n−12)\displaystyle \left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)(χ1−α/2,n−12(n−1)S2,χα/2,n−12(n−1)S2). - Точный, эффективный при нормальности. - При больших nnn: - Асимптотический CI через нормализацию n(S2−σ2)→dN(0, 2σ4)\sqrt n(S^2-\sigma^2)\to_d N(0,\,2\sigma^4)n(S2−σ2)→dN(0,2σ4): даёт приближённый интервал. - Бутстрэп часто предпочтителен при отклонениях от нормальности. 5) Сравнение по критериям - Смещённость: - Xˉ\bar XXˉ, S2S^2S2 — несмещённые; σ^MLE2\hat\sigma^2_{MLE}σ^MLE2 — смещён. - Состоятельность: - Все перечисленные стандартные оценки (Xˉ\bar XXˉ, медиана, S2S^2S2, MLE) — состоятельны при конечной дисперсии (для масштаба дополнительно требуется четвёртый момент для некоторых асимптотик). - Эффективность: - При нормальности Xˉ\bar XXˉ и S2S^2S2 оптимальны (UMVUE, минимальная дисперсия среди несмещённых). Медиана/робастные оценки менее эффективны при нормальности, но более устойчивы при выборе модели с тяжёлыми хвостами. - Асимптотически многие оценки имеют нормальное распределение; эффективная оценка минимизирует асимптотическую дисперсию. 6) Влияние выбора модели распределения и практические рекомендации - Если нормально распределены (или это правдоподобно при маленьком nnn): - Использовать Xˉ\bar XXˉ, S2S^2S2; доверительные интервалы на основе ttt- и χ2\chi^2χ2-распределений (точные и эффективные). - Если nnn велико (CLT применим) и Var(X)<∞\operatorname{Var}(X)<\inftyVar(X)<∞: - Можно использовать среднее и асимптотические нормальные интервалы; бутстрэп — надёжная альтернатива. - Если возможны выбросы или тяжёлые хвосты: - Рассмотреть медиану/усечённое среднее и робастные оценки масштаба (MAD); применять бутстрэп для CI. - Если дисперсия бесконечна или распределение сильно нестандартное: - Оценка среднего может быть несостоятельной в смысле CLT; нужно менять критерии (медиана, методы для стабильных распределений). - Практический совет: - Для малых выборок и отсутствия уверенности в нормальности — либо проверить нормальность, либо применять робастные методы/бутстрэп, либо явно указать риск некорректности t-/chi2-интервалов. - Для больших выборок стандартные оценки и асимптотические интервалы обычно достаточны. Ключевые формулы (суммирую): - Xˉ=1n∑Xi\bar X=\dfrac{1}{n}\sum X_iXˉ=n1∑Xi. - S2=1n−1∑(Xi−Xˉ)2S^2=\dfrac{1}{n-1}\sum (X_i-\bar X)^2S2=n−11∑(Xi−Xˉ)2, σ^MLE2=1n∑(Xi−Xˉ)2\hat\sigma^2_{MLE}=\dfrac{1}{n}\sum (X_i-\bar X)^2σ^MLE2=n1∑(Xi−Xˉ)2. - CI для μ\muμ при нормальности: Xˉ±t1−α/2, n−1Sn\bar X\pm t_{1-\alpha/2,\,n-1}\dfrac{S}{\sqrt n}Xˉ±t1−α/2,n−1nS. - CI для σ2\sigma^2σ2 при нормальности: ((n−1)S2χ1−α/2, n−12, (n−1)S2χα/2, n−12)\left(\dfrac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\dfrac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)(χ1−α/2,n−12(n−1)S2,χα/2,n−12(n−1)S2). - Асимптотики: n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)n(Xˉ−μ)→dN(0,σ2), n(S2−σ2)→dN(0,2σ4)\sqrt{n}(S^2-\sigma^2)\to_d N(0,2\sigma^4)n(S2−σ2)→dN(0,2σ4) (при наличии нужных моментов). Если нужно, могу привести конкретные формулы бутстрэп-интервалов или сравнить MSE для S2S^2S2 и σ^MLE2\hat\sigma^2_{MLE}σ^MLE2 при заданном nnn.
1) Точечные оценки для μ\muμ - Выборка и среднее:
- Xˉ=1n∑i=1nXi\displaystyle \bar X=\frac{1}{n}\sum_{i=1}^n X_iXˉ=n1 i=1∑n Xi .
- Смещённость: Xˉ\bar XXˉ — несмещённая оценка μ\muμ.
- Состоятельность: Xˉ→pμ\bar X\stackrel{p}{\to}\muXˉ→pμ при Var(Xi)<∞\operatorname{Var}(X_i)<\inftyVar(Xi )<∞.
- Эффективность: при нормальности Xˉ\bar XXˉ — UMVUE и достигает С-R границы; в общем асимптотически эффективна (CLT): n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)n (Xˉ−μ)→d N(0,σ2).
- Минусы: чувствительна к выбросам.
- Медиана и усечённое среднее (robust):
- Медиана X~\tilde XX~ и усечённое среднее (trimmed mean) более робастны при выбросах.
- Смещённость: при симметричных распределениях несмещены (асимпотически).
- Состоятельность: да (при стандартных условиях).
- Эффективность: при нормальности медиана имеет меньшую асимптотическую эффективность (ок. 64%64\%64% эффективности по сравнению со средним); усечённое среднее даёт компромисс.
2) Точечные оценки для σ2\sigma^2σ2 - Несмещённая выборочная дисперсия:
- S2=1n−1∑i=1n(Xi−Xˉ)2\displaystyle S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2S2=n−11 i=1∑n (Xi −Xˉ)2.
- Смещённость: несмещённая.
- Состоятельность: S2→pσ2S^2\stackrel{p}{\to}\sigma^2S2→pσ2.
- Эффективность: при нормальности S2S^2S2 — UMVUE (минимальная дисперсия среди несмещённых).
- MLE для σ2\sigma^2σ2 (при нормальности):
- σ^MLE2=1n∑i=1n(Xi−Xˉ)2=n−1nS2\displaystyle \hat\sigma^2_{MLE}=\frac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2=\frac{n-1}{n}S^2σ^MLE2 =n1 i=1∑n (Xi −Xˉ)2=nn−1 S2.
- Смещённость: смещён вниз (на фактор (n−1)/n(n-1)/n(n−1)/n).
- Часто имеет меньшую дисперсию и меньший MSE по сравнению с несмещённой оценкой при малых nnn (т.е. компромисс смещение/дисперсия).
- Состоятельность: да.
- Робастные оценки масштаба:
- MAD: MAD=median(∣Xi−median(X)∣)\mathrm{MAD}=\mathrm{median}(|X_i-\mathrm{median}(X)|)MAD=median(∣Xi −median(X)∣), поправка для нормальности: 1.4826⋅MAD1.4826\cdot\mathrm{MAD}1.4826⋅MAD.
- Робастны при выбросах; менее эффективны при нормальности.
3) Доверительные интервалы для μ\muμ - При нормальности (точно, σ\sigmaσ не известно):
- 100(1−α)%100(1-\alpha)\%100(1−α)% CI: Xˉ±t1−α/2, n−1Sn\displaystyle \bar X\pm t_{1-\alpha/2,\,n-1}\frac{S}{\sqrt n}Xˉ±t1−α/2,n−1 n S .
- Точный (основан на ttt-распределении), оптимален при нормальности.
- Большая выборка (CLT, σ\sigmaσ неизвестно):
- Xˉ±z1−α/2Sn\displaystyle \bar X\pm z_{1-\alpha/2}\frac{S}{\sqrt n}Xˉ±z1−α/2 n S .
- Асимптотически корректен при Var(Xi)<∞\operatorname{Var}(X_i)<\inftyVar(Xi )<∞.
- Непараметрические/робастные:
- Бутстрэп (перцентильный или t- бутстрэп) даёт доверительные интервалы без строгой нормальности.
- Интервалы по медиане или усечённому среднему при тяжёлых хвостах.
- Консервативный (Чебышёв):
- Pr(∣Xˉ−μ∣≤ε)≥1−σ2nε2\Pr\big(|\bar X-\mu|\le \varepsilon\big)\ge 1-\dfrac{\sigma^2}{n\varepsilon^2}Pr(∣Xˉ−μ∣≤ε)≥1−nε2σ2 (основано на неравенстве Чебышёва) — очень широкие интервалы.
4) Доверительные интервалы для σ2\sigma^2σ2 - При нормальности (точно):
- ((n−1)S2χ1−α/2, n−12, (n−1)S2χα/2, n−12)\displaystyle \left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)(χ1−α/2,n−12 (n−1)S2 ,χα/2,n−12 (n−1)S2 ).
- Точный, эффективный при нормальности.
- При больших nnn:
- Асимптотический CI через нормализацию n(S2−σ2)→dN(0, 2σ4)\sqrt n(S^2-\sigma^2)\to_d N(0,\,2\sigma^4)n (S2−σ2)→d N(0,2σ4): даёт приближённый интервал.
- Бутстрэп часто предпочтителен при отклонениях от нормальности.
5) Сравнение по критериям
- Смещённость:
- Xˉ\bar XXˉ, S2S^2S2 — несмещённые; σ^MLE2\hat\sigma^2_{MLE}σ^MLE2 — смещён.
- Состоятельность:
- Все перечисленные стандартные оценки (Xˉ\bar XXˉ, медиана, S2S^2S2, MLE) — состоятельны при конечной дисперсии (для масштаба дополнительно требуется четвёртый момент для некоторых асимптотик).
- Эффективность:
- При нормальности Xˉ\bar XXˉ и S2S^2S2 оптимальны (UMVUE, минимальная дисперсия среди несмещённых). Медиана/робастные оценки менее эффективны при нормальности, но более устойчивы при выборе модели с тяжёлыми хвостами.
- Асимптотически многие оценки имеют нормальное распределение; эффективная оценка минимизирует асимптотическую дисперсию.
6) Влияние выбора модели распределения и практические рекомендации
- Если нормально распределены (или это правдоподобно при маленьком nnn):
- Использовать Xˉ\bar XXˉ, S2S^2S2; доверительные интервалы на основе ttt- и χ2\chi^2χ2-распределений (точные и эффективные).
- Если nnn велико (CLT применим) и Var(X)<∞\operatorname{Var}(X)<\inftyVar(X)<∞:
- Можно использовать среднее и асимптотические нормальные интервалы; бутстрэп — надёжная альтернатива.
- Если возможны выбросы или тяжёлые хвосты:
- Рассмотреть медиану/усечённое среднее и робастные оценки масштаба (MAD); применять бутстрэп для CI.
- Если дисперсия бесконечна или распределение сильно нестандартное:
- Оценка среднего может быть несостоятельной в смысле CLT; нужно менять критерии (медиана, методы для стабильных распределений).
- Практический совет:
- Для малых выборок и отсутствия уверенности в нормальности — либо проверить нормальность, либо применять робастные методы/бутстрэп, либо явно указать риск некорректности t-/chi2-интервалов.
- Для больших выборок стандартные оценки и асимптотические интервалы обычно достаточны.
Ключевые формулы (суммирую):
- Xˉ=1n∑Xi\bar X=\dfrac{1}{n}\sum X_iXˉ=n1 ∑Xi .
- S2=1n−1∑(Xi−Xˉ)2S^2=\dfrac{1}{n-1}\sum (X_i-\bar X)^2S2=n−11 ∑(Xi −Xˉ)2, σ^MLE2=1n∑(Xi−Xˉ)2\hat\sigma^2_{MLE}=\dfrac{1}{n}\sum (X_i-\bar X)^2σ^MLE2 =n1 ∑(Xi −Xˉ)2.
- CI для μ\muμ при нормальности: Xˉ±t1−α/2, n−1Sn\bar X\pm t_{1-\alpha/2,\,n-1}\dfrac{S}{\sqrt n}Xˉ±t1−α/2,n−1 n S .
- CI для σ2\sigma^2σ2 при нормальности: ((n−1)S2χ1−α/2, n−12, (n−1)S2χα/2, n−12)\left(\dfrac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\dfrac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)(χ1−α/2,n−12 (n−1)S2 ,χα/2,n−12 (n−1)S2 ).
- Асимптотики: n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)n (Xˉ−μ)→d N(0,σ2), n(S2−σ2)→dN(0,2σ4)\sqrt{n}(S^2-\sigma^2)\to_d N(0,2\sigma^4)n (S2−σ2)→d N(0,2σ4) (при наличии нужных моментов).
Если нужно, могу привести конкретные формулы бутстрэп-интервалов или сравнить MSE для S2S^2S2 и σ^MLE2\hat\sigma^2_{MLE}σ^MLE2 при заданном nnn.