Даны независимые случайные величины X1,...,Xn с неизвестным математическим ожиданием mu и дисперсией sigma^2. Предложите несколько оценок для mu и sigma^2 (точечных и доверительных), сравните их по смещённости, состоятельности и эффективности, и обсудите, как выбор модели распределения влияет на рекомендации

5 Ноя в 15:05
7 +7
0
Ответы
1
Ниже — компактный обзор распространённых точечных оценок и доверительных интервалов для μ\muμ и σ2\sigma^2σ2, их свойства (смещённость, состоятельность, эффективность) и влияние предположений о модели.
1) Точечные оценки для μ\muμ - Выборка и среднее:
- Xˉ=1n∑i=1nXi\displaystyle \bar X=\frac{1}{n}\sum_{i=1}^n X_iXˉ=n1 i=1n Xi .
- Смещённость: Xˉ\bar XXˉ — несмещённая оценка μ\muμ.
- Состоятельность: Xˉ→pμ\bar X\stackrel{p}{\to}\muXˉpμ при Var⁡(Xi)<∞\operatorname{Var}(X_i)<\inftyVar(Xi )<.
- Эффективность: при нормальности Xˉ\bar XXˉ — UMVUE и достигает С-R границы; в общем асимптотически эффективна (CLT): n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)n (Xˉμ)d N(0,σ2).
- Минусы: чувствительна к выбросам.
- Медиана и усечённое среднее (robust):
- Медиана X~\tilde XX~ и усечённое среднее (trimmed mean) более робастны при выбросах.
- Смещённость: при симметричных распределениях несмещены (асимпотически).
- Состоятельность: да (при стандартных условиях).
- Эффективность: при нормальности медиана имеет меньшую асимптотическую эффективность (ок. 64%64\%64% эффективности по сравнению со средним); усечённое среднее даёт компромисс.
2) Точечные оценки для σ2\sigma^2σ2 - Несмещённая выборочная дисперсия:
- S2=1n−1∑i=1n(Xi−Xˉ)2\displaystyle S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar X)^2S2=n11 i=1n (Xi Xˉ)2.
- Смещённость: несмещённая.
- Состоятельность: S2→pσ2S^2\stackrel{p}{\to}\sigma^2S2pσ2.
- Эффективность: при нормальности S2S^2S2 — UMVUE (минимальная дисперсия среди несмещённых).
- MLE для σ2\sigma^2σ2 (при нормальности):
- σ^MLE2=1n∑i=1n(Xi−Xˉ)2=n−1nS2\displaystyle \hat\sigma^2_{MLE}=\frac{1}{n}\sum_{i=1}^n (X_i-\bar X)^2=\frac{n-1}{n}S^2σ^MLE2 =n1 i=1n (Xi Xˉ)2=nn1 S2.
- Смещённость: смещён вниз (на фактор (n−1)/n(n-1)/n(n1)/n).
- Часто имеет меньшую дисперсию и меньший MSE по сравнению с несмещённой оценкой при малых nnn (т.е. компромисс смещение/дисперсия).
- Состоятельность: да.
- Робастные оценки масштаба:
- MAD: MAD=median(∣Xi−median(X)∣)\mathrm{MAD}=\mathrm{median}(|X_i-\mathrm{median}(X)|)MAD=median(Xi median(X)), поправка для нормальности: 1.4826⋅MAD1.4826\cdot\mathrm{MAD}1.4826MAD.
- Робастны при выбросах; менее эффективны при нормальности.
3) Доверительные интервалы для μ\muμ - При нормальности (точно, σ\sigmaσ не известно):
- 100(1−α)%100(1-\alpha)\%100(1α)% CI: Xˉ±t1−α/2, n−1Sn\displaystyle \bar X\pm t_{1-\alpha/2,\,n-1}\frac{S}{\sqrt n}Xˉ±t1α/2,n1 n S .
- Точный (основан на ttt-распределении), оптимален при нормальности.
- Большая выборка (CLT, σ\sigmaσ неизвестно):
- Xˉ±z1−α/2Sn\displaystyle \bar X\pm z_{1-\alpha/2}\frac{S}{\sqrt n}Xˉ±z1α/2 n S .
- Асимптотически корректен при Var⁡(Xi)<∞\operatorname{Var}(X_i)<\inftyVar(Xi )<.
- Непараметрические/робастные:
- Бутстрэп (перцентильный или t- бутстрэп) даёт доверительные интервалы без строгой нормальности.
- Интервалы по медиане или усечённому среднему при тяжёлых хвостах.
- Консервативный (Чебышёв):
- Pr⁡(∣Xˉ−μ∣≤ε)≥1−σ2nε2\Pr\big(|\bar X-\mu|\le \varepsilon\big)\ge 1-\dfrac{\sigma^2}{n\varepsilon^2}Pr(Xˉμε)1nε2σ2 (основано на неравенстве Чебышёва) — очень широкие интервалы.
4) Доверительные интервалы для σ2\sigma^2σ2 - При нормальности (точно):
- ((n−1)S2χ1−α/2, n−12, (n−1)S2χα/2, n−12)\displaystyle \left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)(χ1α/2,n12 (n1)S2 ,χα/2,n12 (n1)S2 ).
- Точный, эффективный при нормальности.
- При больших nnn:
- Асимптотический CI через нормализацию n(S2−σ2)→dN(0, 2σ4)\sqrt n(S^2-\sigma^2)\to_d N(0,\,2\sigma^4)n (S2σ2)d N(0,2σ4): даёт приближённый интервал.
- Бутстрэп часто предпочтителен при отклонениях от нормальности.
5) Сравнение по критериям
- Смещённость:
- Xˉ\bar XXˉ, S2S^2S2 — несмещённые; σ^MLE2\hat\sigma^2_{MLE}σ^MLE2 — смещён.
- Состоятельность:
- Все перечисленные стандартные оценки (Xˉ\bar XXˉ, медиана, S2S^2S2, MLE) — состоятельны при конечной дисперсии (для масштаба дополнительно требуется четвёртый момент для некоторых асимптотик).
- Эффективность:
- При нормальности Xˉ\bar XXˉ и S2S^2S2 оптимальны (UMVUE, минимальная дисперсия среди несмещённых). Медиана/робастные оценки менее эффективны при нормальности, но более устойчивы при выборе модели с тяжёлыми хвостами.
- Асимптотически многие оценки имеют нормальное распределение; эффективная оценка минимизирует асимптотическую дисперсию.
6) Влияние выбора модели распределения и практические рекомендации
- Если нормально распределены (или это правдоподобно при маленьком nnn):
- Использовать Xˉ\bar XXˉ, S2S^2S2; доверительные интервалы на основе ttt- и χ2\chi^2χ2-распределений (точные и эффективные).
- Если nnn велико (CLT применим) и Var⁡(X)<∞\operatorname{Var}(X)<\inftyVar(X)<:
- Можно использовать среднее и асимптотические нормальные интервалы; бутстрэп — надёжная альтернатива.
- Если возможны выбросы или тяжёлые хвосты:
- Рассмотреть медиану/усечённое среднее и робастные оценки масштаба (MAD); применять бутстрэп для CI.
- Если дисперсия бесконечна или распределение сильно нестандартное:
- Оценка среднего может быть несостоятельной в смысле CLT; нужно менять критерии (медиана, методы для стабильных распределений).
- Практический совет:
- Для малых выборок и отсутствия уверенности в нормальности — либо проверить нормальность, либо применять робастные методы/бутстрэп, либо явно указать риск некорректности t-/chi2-интервалов.
- Для больших выборок стандартные оценки и асимптотические интервалы обычно достаточны.
Ключевые формулы (суммирую):
- Xˉ=1n∑Xi\bar X=\dfrac{1}{n}\sum X_iXˉ=n1 Xi .
- S2=1n−1∑(Xi−Xˉ)2S^2=\dfrac{1}{n-1}\sum (X_i-\bar X)^2S2=n11 (Xi Xˉ)2, σ^MLE2=1n∑(Xi−Xˉ)2\hat\sigma^2_{MLE}=\dfrac{1}{n}\sum (X_i-\bar X)^2σ^MLE2 =n1 (Xi Xˉ)2.
- CI для μ\muμ при нормальности: Xˉ±t1−α/2, n−1Sn\bar X\pm t_{1-\alpha/2,\,n-1}\dfrac{S}{\sqrt n}Xˉ±t1α/2,n1 n S .
- CI для σ2\sigma^2σ2 при нормальности: ((n−1)S2χ1−α/2, n−12, (n−1)S2χα/2, n−12)\left(\dfrac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\dfrac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}}\right)(χ1α/2,n12 (n1)S2 ,χα/2,n12 (n1)S2 ).
- Асимптотики: n(Xˉ−μ)→dN(0,σ2)\sqrt{n}(\bar X-\mu)\to_d N(0,\sigma^2)n (Xˉμ)d N(0,σ2), n(S2−σ2)→dN(0,2σ4)\sqrt{n}(S^2-\sigma^2)\to_d N(0,2\sigma^4)n (S2σ2)d N(0,2σ4) (при наличии нужных моментов).
Если нужно, могу привести конкретные формулы бутстрэп-интервалов или сравнить MSE для S2S^2S2 и σ^MLE2\hat\sigma^2_{MLE}σ^MLE2 при заданном nnn.
5 Ноя в 16:11
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир