Кейс по статистике: при оценке среднего по выборке с неизвестной дисперсией предложите, когда использовать нормальное приближение, а когда t-распределение; обсудите влияние размера выборки и исходного распределения популяции
Предыдущий
вопрос Следующий
вопрос

Question

Кейс по статистике: при оценке среднего по выборке с неизвестной дисперсией предложите, когда использовать нормальное приближение, а когда t-распределение; обсудите влияние размера выборки и исходного распределения популяции
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по математике

Кейс по статистике: ...

eva

17 Ноя в 09:52

6 +6

0

Helper · Answer 1

Кратко и по делу — когда применять t‑распределение, а когда нормальное приближение при оценке среднего при неизвестной дисперсии, и как на это влияют размер выборки и форма популяции.
Основное правило
- Если выборка из нормально распределённой популяции, статистика

t=\frac{\bar x-\mu_0}{s/\sqrt{n}}

имеет точно t‑распределение с

n - 1

степенями свободы; используйте t‑критерий/интервалы:

\bar x \pm t_{n-1,\,1-\alpha/2}\frac{s}{\sqrt n}.

- Если дисперсия неизвестна, но выборка большая, то по ЦПТ можно приближать распределение выборочного среднего нормальным и использовать z‑приближение с оценкой дисперсии:

z\approx\frac{\bar x-\mu_0}{s/\sqrt{n}}\sim N(0,1),

а доверительный интервал примерно

\bar x \pm z_{1-\alpha/2}\frac{s}{\sqrt n}.

Влияние размера выборки
- Для малого

n

(обычно

n < 30

) использование t обязателено при условии, что популяция близка к нормальной; t учитывает дополнительную неопределённость оценки дисперсии (тяжёлые хвосты).
- При большом

n

(правило типа

n≥30n\ge 30

или

n≥50n\ge 50

, в зависимости от ситуации) распределение t быстро сходится к нормальному, поэтому z‑приближение становится адекватным:

tn−1→N(0,1)t_{n-1}\to N(0,1)

при

n→∞n\to\infty

.
Влияние формы популяции
- Если популяция нормально распределена: t корректен при любом

n

.
- Если популяция несильно скошена и не имеет тяжёлых хвостов: ЦПТ даёт приближение уже при умеренных

n

(обычно

n≳30n\gtrsim 30

).
- При сильной асимметрии или тяжёлых хвостах нужны гораздо большие

n

для нормального приближения; для малых выборок в таких случаях ни t, ни z могут давать неверные уровни доверия/значимости.
- Наличие выбросов делает оценку среднего и стандартного отклонения ненадёжной; рассмотрите медиану/робастные методы или бутстрэп.
Практические рекомендации
- Если

n

мал и вы можете предположить нормальность — используйте t.
- Если

n

велико (

\gtrsim 30

) и нет экстремальной асимметрии — можно использовать нормальное приближение.
- Если популяция явно не нормальна и

n

мал — избегайте стандартных t/z; используйте непараметрические методы или бутстрэп (параметрический/непараметрический) для доверительных интервалов и тестов.
- Всегда проверяйте на выбросы и асимметрию (гистограмма, Q‑Q график, коэффициенты асимметрии/эксцесса).
Краткая суть: при неизвестной дисперсии t — «правильный» инструмент при нормальной популяции (особенно для малых

n

); при большом

n

t≈N и можно применять нормальное приближение; при несоответствии нормальности и малых выборках — прибегайте к бутстрэпу или робастным методам.

Другие вопросы eva

Другие вопросы
eva