Дано вероятностное задание: в урне N белых и M чёрных шаров извлекают по одному шарику с возвращением k раз; сравните ожидание числа белых в двух моделях: с возвращением и без возвращения, и обсудите зависимость дисперсий
Обозначим p=NN+Mp=\dfrac{N}{N+M}p=N+MN и общее число шаров T=N+MT=N+MT=N+M. Ожидание: - При извлечении с возвращением (биномиальная модель) число белых X∼Bin(k,p)X\sim\mathrm{Bin}(k,p)X∼Bin(k,p), поэтому E[X]=kp.
\mathbb{E}[X]=kp. E[X]=kp.
- При извлечении без возвращения (гипергеометрическая модель) число белых YYY имеет параметры (T,N,k)(T,N,k)(T,N,k), и E[Y]=kp.
\mathbb{E}[Y]=kp. E[Y]=kp.
Итого: ожидания в обеих моделях одинаковы: E[X]=E[Y]=kp\mathbb{E}[X]=\mathbb{E}[Y]=kpE[X]=E[Y]=kp. Дисперсии: - С возвращением Var(X)=kp(1−p).
\mathrm{Var}(X)=kp(1-p). Var(X)=kp(1−p).
- Без возвращения (гипергеометрическое) справедлива формула с поправкой на конечную совокупность (FPC): Var(Y)=kp(1−p) T−kT−1.
\mathrm{Var}(Y)=kp(1-p)\,\frac{T-k}{T-1}. Var(Y)=kp(1−p)T−1T−k.
Зависимость и интерпретация: - T−kT−1≤1\dfrac{T-k}{T-1}\le 1T−1T−k≤1, поэтому Var(Y)≤Var(X)\mathrm{Var}(Y)\le\mathrm{Var}(X)Var(Y)≤Var(X). Без возвращения дисперсия меньше из‑за отрицательной корреляции между отдельными вытаскиваниями. - При k≪Tk\ll Tk≪T фактор T−kT−1≈1\dfrac{T-k}{T-1}\approx 1T−1T−k≈1, дисперсии почти равны. - При k→Tk\to Tk→T фактор →0\to 0→0, Var(Y)→0\mathrm{Var}(Y)\to 0Var(Y)→0 (вся совокупность извлечена). - Для k=1k=1k=1 обе дисперсии совпадают (т.к. фактор равен 1). Краткая схема вывода для без возвращения: представить Y=∑i=1kIiY=\sum_{i=1}^k I_iY=∑i=1kIi, где IiI_iIi — индикатор белого в i‑м вытаскивании; Cov(Ii,Ij)=−p(1−p)T−1\mathrm{Cov}(I_i,I_j)=-\dfrac{p(1-p)}{T-1}Cov(Ii,Ij)=−T−1p(1−p), подставив в Var(Y)=∑Var(Ii)+2∑i<jCov(Ii,Ij)\mathrm{Var}(Y)=\sum\mathrm{Var}(I_i)+2\sum_{i<j}\mathrm{Cov}(I_i,I_j)Var(Y)=∑Var(Ii)+2∑i<jCov(Ii,Ij) получаем указанную формулу.
Ожидание:
- При извлечении с возвращением (биномиальная модель) число белых X∼Bin(k,p)X\sim\mathrm{Bin}(k,p)X∼Bin(k,p), поэтому
E[X]=kp. \mathbb{E}[X]=kp.
E[X]=kp. - При извлечении без возвращения (гипергеометрическая модель) число белых YYY имеет параметры (T,N,k)(T,N,k)(T,N,k), и
E[Y]=kp. \mathbb{E}[Y]=kp.
E[Y]=kp. Итого: ожидания в обеих моделях одинаковы: E[X]=E[Y]=kp\mathbb{E}[X]=\mathbb{E}[Y]=kpE[X]=E[Y]=kp.
Дисперсии:
- С возвращением
Var(X)=kp(1−p). \mathrm{Var}(X)=kp(1-p).
Var(X)=kp(1−p). - Без возвращения (гипергеометрическое) справедлива формула с поправкой на конечную совокупность (FPC):
Var(Y)=kp(1−p) T−kT−1. \mathrm{Var}(Y)=kp(1-p)\,\frac{T-k}{T-1}.
Var(Y)=kp(1−p)T−1T−k . Зависимость и интерпретация:
- T−kT−1≤1\dfrac{T-k}{T-1}\le 1T−1T−k ≤1, поэтому Var(Y)≤Var(X)\mathrm{Var}(Y)\le\mathrm{Var}(X)Var(Y)≤Var(X). Без возвращения дисперсия меньше из‑за отрицательной корреляции между отдельными вытаскиваниями.
- При k≪Tk\ll Tk≪T фактор T−kT−1≈1\dfrac{T-k}{T-1}\approx 1T−1T−k ≈1, дисперсии почти равны.
- При k→Tk\to Tk→T фактор →0\to 0→0, Var(Y)→0\mathrm{Var}(Y)\to 0Var(Y)→0 (вся совокупность извлечена).
- Для k=1k=1k=1 обе дисперсии совпадают (т.к. фактор равен 1).
Краткая схема вывода для без возвращения: представить Y=∑i=1kIiY=\sum_{i=1}^k I_iY=∑i=1k Ii , где IiI_iIi — индикатор белого в i‑м вытаскивании; Cov(Ii,Ij)=−p(1−p)T−1\mathrm{Cov}(I_i,I_j)=-\dfrac{p(1-p)}{T-1}Cov(Ii ,Ij )=−T−1p(1−p) , подставив в Var(Y)=∑Var(Ii)+2∑i<jCov(Ii,Ij)\mathrm{Var}(Y)=\sum\mathrm{Var}(I_i)+2\sum_{i<j}\mathrm{Cov}(I_i,I_j)Var(Y)=∑Var(Ii )+2∑i<j Cov(Ii ,Ij ) получаем указанную формулу.