В статистике различают два типа оценок дисперсии: смещенные (или "нескорректированные") и несмещенные (или "скорректированные"). Различие между ними заключается в том, как они используют данные выборки для оценки дисперсии генеральной совокупности.
1. Смещенная оценка дисперсии
Смещенная оценка дисперсии, обозначаемая как ( \sigma^2 ), вычисляется по формуле:
Эта оценка делит на ( n-1 ) вместо ( n ). Использование ( n-1 ) вместо ( n ) называется "корректировкой Бесселя" и обусловлено тем, что мы оцениваем параметр (дисперсию) на основе выборки. Это позволяет избежать систематической недооценки дисперсии.
Пример вычисления
Предположим, у нас есть выборка роста из 5 человек:
Таким образом, для данной выборки смещенная оценка дисперсии составила ( 45 ), а несмещенная — ( 56.25 ). Несмещенная оценка обеспечивает более точную оценку дисперсии генеральной совокупности, особенно для малых выборок.
В статистике различают два типа оценок дисперсии: смещенные (или "нескорректированные") и несмещенные (или "скорректированные"). Различие между ними заключается в том, как они используют данные выборки для оценки дисперсии генеральной совокупности.
1. Смещенная оценка дисперсииСмещенная оценка дисперсии, обозначаемая как ( \sigma^2 ), вычисляется по формуле:
[
\sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
]
где:
( n ) - размер выборки,( x_i ) - отдельные значения выборки,( \bar{x} ) - среднее арифметическое выборки.Смещенная оценка учитывает все данные, и делит на ( n ), что может привести к недооценке истинной дисперсии в случае выборки.
2. Несмещенная оценка дисперсииНесмещенная оценка дисперсии, обозначаемая как ( s^2 ), вычисляется по формуле:
[
s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2
]
Эта оценка делит на ( n-1 ) вместо ( n ). Использование ( n-1 ) вместо ( n ) называется "корректировкой Бесселя" и обусловлено тем, что мы оцениваем параметр (дисперсию) на основе выборки. Это позволяет избежать систематической недооценки дисперсии.
Пример вычисленияПредположим, у нас есть выборка роста из 5 человек:
[ 170, 175, 180, 165, 160 ]
Рассчитаем среднее (( \bar{x} )):
[
\bar{x} = \frac{170 + 175 + 180 + 165 + 160}{5} = 170
]
Рассчитаем смещенную дисперсию (( \sigma^2 )):
[
\sigma^2 = \frac{1}{5} \left((170 - 170)^2 + (175 - 170)^2 + (180 - 170)^2 + (165 - 170)^2 + (160 - 170)^2\right)
]
[
= \frac{1}{5} \left(0 + 25 + 100 + 25 + 100\right) = \frac{225}{5} = 45
]
Рассчитаем несмещенную дисперсию (( s^2 )):
Вывод[
s^2 = \frac{1}{5-1} \left((170 - 170)^2 + (175 - 170)^2 + (180 - 170)^2 + (165 - 170)^2 + (160 - 170)^2\right)
]
[
= \frac{1}{4} \left(0 + 25 + 100 + 25 + 100\right) = \frac{225}{4} = 56.25
]
Таким образом, для данной выборки смещенная оценка дисперсии составила ( 45 ), а несмещенная — ( 56.25 ). Несмещенная оценка обеспечивает более точную оценку дисперсии генеральной совокупности, особенно для малых выборок.