Даны независимые случайные величины X1,...,Xn с неизвестным математическим ожиданием mu и дисперсией sigma^2. Предложите несколько оценок для mu и sigma^2 (точечных и доверительных), сравните их по смещённости, состоятельности и эффективности, и обсудите, как выбор модели распределения влияет на рекомендации
Предыдущий
вопрос Следующий
вопрос

Question

Даны независимые случайные величины X1,...,Xn с неизвестным математическим ожиданием mu и дисперсией sigma^2. Предложите несколько оценок для mu и sigma^2 (точечных и доверительных), сравните их по смещённости, состоятельности и эффективности, и обсудите, как выбор модели распределения влияет на рекомендации
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по математике

Даны независимые слу...

eva

5 Ноя в 15:05

7 +7

0

Helper · Answer 1

Ниже — компактный обзор распространённых точечных оценок и доверительных интервалов для

μ\mu

и

σ2\sigma^2

, их свойства (смещённость, состоятельность, эффективность) и влияние предположений о модели.
1) Точечные оценки для

μ\mu

- Выборка и среднее:
-

Xˉ=1n∑i=1nXi\displaystyle \bar X=\frac{1}{n}\sum_{i=1}^n X_i

.
- Смещённость:

Xˉ\bar X

— несмещённая оценка

μ\mu

.
- Состоятельность:

Xˉ→pμ\bar X\stackrel{p}{\to}\mu

при

Var⁡(Xi)<∞\operatorname{Var}(X_i)<\infty

.
- Эффективность: при нормальности

Xˉ\bar X

— UMVUE и достигает С-R границы; в общем асимптотически эффективна (CLT):

n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)

.
- Минусы: чувствительна к выбросам.
- Медиана и усечённое среднее (robust):
- Медиана

X~\tilde X

и усечённое среднее (trimmed mean) более робастны при выбросах.
- Смещённость: при симметричных распределениях несмещены (асимпотически).
- Состоятельность: да (при стандартных условиях).
- Эффективность: при нормальности медиана имеет меньшую асимптотическую эффективность (ок.

64%64\%

эффективности по сравнению со средним); усечённое среднее даёт компромисс.
2) Точечные оценки для

σ2\sigma^2

- Несмещённая выборочная дисперсия:
-

S2=1n−1∑i=1n(Xi−Xˉ)2\displaystyle S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2

.
- Смещённость: несмещённая.
- Состоятельность:

S2→pσ2S^2\stackrel{p}{\to}\sigma^2

.
- Эффективность: при нормальности

S^2

— UMVUE (минимальная дисперсия среди несмещённых).
- MLE для

σ2\sigma^2

(при нормальности):
-

σ^MLE2=1n∑i=1n(Xi−Xˉ)2=n−1nS2\displaystyle \hat\sigma^2_{MLE}=\frac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2=\frac{n-1}{n}S^2

.
- Смещённость: смещён вниз (на фактор

(n - 1) / n

).
- Часто имеет меньшую дисперсию и меньший MSE по сравнению с несмещённой оценкой при малых

n

(т.е. компромисс смещение/дисперсия).
- Состоятельность: да.
- Робастные оценки масштаба:
- MAD:

MAD=median(∣Xi−median(X)∣)\mathrm{MAD}=\mathrm{median}(|X_i-\mathrm{median}(X)|)

, поправка для нормальности:

1.4826⋅MAD1.4826\cdot\mathrm{MAD}

.
- Робастны при выбросах; менее эффективны при нормальности.
3) Доверительные интервалы для

μ\mu

- При нормальности (точно,

σ\sigma

не известно):
-

100(1−α)%100(1-\alpha)\%

CI:

n−1Sn\displaystyle \bar X\pm t_{1-\alpha/2,\,n-1}\frac{S}{\sqrt n}

.
- Точный (основан на

t

-распределении), оптимален при нормальности.
- Большая выборка (CLT,

σ\sigma

неизвестно):
-

Xˉ±z1−α/2Sn\displaystyle \bar X\pm z_{1-\alpha/2}\frac{S}{\sqrt n}

.
- Асимптотически корректен при

Var⁡(Xi)<∞\operatorname{Var}(X_i)<\infty

.
- Непараметрические/робастные:
- Бутстрэп (перцентильный или t- бутстрэп) даёт доверительные интервалы без строгой нормальности.
- Интервалы по медиане или усечённому среднему при тяжёлых хвостах.
- Консервативный (Чебышёв):
-

Pr⁡(∣Xˉ−μ∣≤ε)≥1−σ2nε2\Pr\big(|\bar X-\mu|\le \varepsilon\big)\ge 1-\dfrac{\sigma^2}{n\varepsilon^2}

(основано на неравенстве Чебышёва) — очень широкие интервалы.
4) Доверительные интервалы для

σ2\sigma^2

- При нормальности (точно):
-

n−12)\displaystyle \left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)

.
- Точный, эффективный при нормальности.
- При больших

n

:
- Асимптотический CI через нормализацию

2σ4)\sqrt n(S^2-\sigma^2)\to_d N(0,\,2\sigma^4)

: даёт приближённый интервал.
- Бутстрэп часто предпочтителен при отклонениях от нормальности.
5) Сравнение по критериям
- Смещённость:
-

Xˉ\bar X

,

S^2

— несмещённые;

σ^MLE2\hat\sigma^2_{MLE}

— смещён.
- Состоятельность:
- Все перечисленные стандартные оценки (

Xˉ\bar X

, медиана,

S^2

, MLE) — состоятельны при конечной дисперсии (для масштаба дополнительно требуется четвёртый момент для некоторых асимптотик).
- Эффективность:
- При нормальности

Xˉ\bar X

и

S^2

оптимальны (UMVUE, минимальная дисперсия среди несмещённых). Медиана/робастные оценки менее эффективны при нормальности, но более устойчивы при выборе модели с тяжёлыми хвостами.
- Асимптотически многие оценки имеют нормальное распределение; эффективная оценка минимизирует асимптотическую дисперсию.
6) Влияние выбора модели распределения и практические рекомендации
- Если нормально распределены (или это правдоподобно при маленьком

n

):
- Использовать

Xˉ\bar X

,

S^2

; доверительные интервалы на основе

t

- и

χ2\chi^2

-распределений (точные и эффективные).
- Если

n

велико (CLT применим) и

Var⁡(X)<∞\operatorname{Var}(X)<\infty

:
- Можно использовать среднее и асимптотические нормальные интервалы; бутстрэп — надёжная альтернатива.
- Если возможны выбросы или тяжёлые хвосты:
- Рассмотреть медиану/усечённое среднее и робастные оценки масштаба (MAD); применять бутстрэп для CI.
- Если дисперсия бесконечна или распределение сильно нестандартное:
- Оценка среднего может быть несостоятельной в смысле CLT; нужно менять критерии (медиана, методы для стабильных распределений).
- Практический совет:
- Для малых выборок и отсутствия уверенности в нормальности — либо проверить нормальность, либо применять робастные методы/бутстрэп, либо явно указать риск некорректности t-/chi2-интервалов.
- Для больших выборок стандартные оценки и асимптотические интервалы обычно достаточны.
Ключевые формулы (суммирую):
-

Xˉ=1n∑Xi\bar X=\dfrac{1}{n}\sum X_i

.
-

S2=1n−1∑(Xi−Xˉ)2S^2=\dfrac{1}{n-1}\sum (X_i-\bar X)^2

,

σ^MLE2=1n∑(Xi−Xˉ)2\hat\sigma^2_{MLE}=\dfrac{1}{n}\sum (X_i-\bar X)^2

.
- CI для

μ\mu

при нормальности:

n−1Sn\bar X\pm t_{1-\alpha/2,\,n-1}\dfrac{S}{\sqrt n}

.
- CI для

σ2\sigma^2

при нормальности:

n−12)\left(\dfrac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\dfrac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)

.
- Асимптотики:

n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)

,

n(S2−σ2)→dN(0,2σ4)\sqrt{n}(S^2-\sigma^2)\to_d N(0,2\sigma^4)

(при наличии нужных моментов).
Если нужно, могу привести конкретные формулы бутстрэп-интервалов или сравнить MSE для

S^2

и

σ^MLE2\hat\sigma^2_{MLE}

при заданном

n

.

Другие вопросы eva

Другие вопросы
eva