В урне 5 белых и 5 черных шаров извлекают по одному без возвращения четыре раза. Какова вероятность получить ровно два белых шара? Выберите между полным комбинаторным подсчетом, приближением биномиальной моделью и симуляцией, объясните различия и влияние допущений
Короткий ответ (рекомендуемый — полный комбинаторный подсчёт): - Точная вероятность (без возвращения) по гипергеометрическому закону: P(X=2)=(52)(52)(104)=100210=1021≈0.47619.
P(X=2)=\frac{\binom{5}{2}\binom{5}{2}}{\binom{10}{4}}=\frac{100}{210}=\frac{10}{21}\approx0.47619. P(X=2)=(410)(25)(25)=210100=2110≈0.47619. Различия методов и влияние допущений: - Полный комбинаторный (гипергеометрический) — точен при выборке без возвращения из конечной популяции. Формула: P(X=k)=(Kk)(N−Kn−k)(Nn).
P(X=k)=\frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}. P(X=k)=(nN)(kK)(n−kN−K).
Для наших данных N=10N=10N=10, K=5K=5K=5, n=4n=4n=4. - Биномиальная аппроксимация — предполагает независимые испытания с вероятностью успеха ppp (т.е. с возвращением или при очень большой популяции). Здесь p=0.5p=0.5p=0.5, поэтому P(X=2)≈(42)p2(1−p)2=(42)(0.5)4=38=0.375.
P(X=2)\approx\binom{4}{2}p^2(1-p)^2=\binom{4}{2}(0.5)^4=\frac{3}{8}=0.375. P(X=2)≈(24)p2(1−p)2=(24)(0.5)4=83=0.375.
Разница от точного значения объясняется нарушением независимости при выборке без возвращения. - Почему значения отличаются: матожидание совпадает (E[X]=4⋅0.5=2E[X]=4\cdot0.5=2E[X]=4⋅0.5=2), но дисперсия гипергеометрического распределения меньше биномиальной из‑за фактора конечной популяции: VarHG=np(1−p)N−nN−1=1⋅69=23≈0.6667,
\operatorname{Var}_{HG}=np(1-p)\frac{N-n}{N-1}=1\cdot\frac{6}{9}=\frac{2}{3}\approx0.6667, VarHG=np(1−p)N−1N−n=1⋅96=32≈0.6667,
тогда как биномиальная дисперсия =1=1=1. Меньшая дисперсия концентрирует массу ближе к среднему, поэтому P(X=2)P(X=2)P(X=2) выше в гипергеометрическом случае. - Симуляция (Монте‑Карло) — практический способ проверить/оценить вероятность: с большим числом прогонов оценка сходится к 0.476190.476190.47619. Погрешность оценки примерно SE≈p(1−p)N,
SE\approx\sqrt{\frac{p(1-p)}{N}}, SE≈Np(1−p),
например при N=10000N=10000N=10000 получится SE≈0.005SE\approx0.005SE≈0.005. Резюме: используйте полный комбинаторный (гипергеометрический) метод — он точен; биномиальная модель годится как приближение при возвращении или большой популяции; симуляция полезна для проверки и оценки погрешности.
- Точная вероятность (без возвращения) по гипергеометрическому закону:
P(X=2)=(52)(52)(104)=100210=1021≈0.47619. P(X=2)=\frac{\binom{5}{2}\binom{5}{2}}{\binom{10}{4}}=\frac{100}{210}=\frac{10}{21}\approx0.47619.
P(X=2)=(410 )(25 )(25 ) =210100 =2110 ≈0.47619.
Различия методов и влияние допущений:
- Полный комбинаторный (гипергеометрический) — точен при выборке без возвращения из конечной популяции. Формула:
P(X=k)=(Kk)(N−Kn−k)(Nn). P(X=k)=\frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}.
P(X=k)=(nN )(kK )(n−kN−K ) . Для наших данных N=10N=10N=10, K=5K=5K=5, n=4n=4n=4.
- Биномиальная аппроксимация — предполагает независимые испытания с вероятностью успеха ppp (т.е. с возвращением или при очень большой популяции). Здесь p=0.5p=0.5p=0.5, поэтому
P(X=2)≈(42)p2(1−p)2=(42)(0.5)4=38=0.375. P(X=2)\approx\binom{4}{2}p^2(1-p)^2=\binom{4}{2}(0.5)^4=\frac{3}{8}=0.375.
P(X=2)≈(24 )p2(1−p)2=(24 )(0.5)4=83 =0.375. Разница от точного значения объясняется нарушением независимости при выборке без возвращения.
- Почему значения отличаются: матожидание совпадает (E[X]=4⋅0.5=2E[X]=4\cdot0.5=2E[X]=4⋅0.5=2), но дисперсия гипергеометрического распределения меньше биномиальной из‑за фактора конечной популяции:
VarHG=np(1−p)N−nN−1=1⋅69=23≈0.6667, \operatorname{Var}_{HG}=np(1-p)\frac{N-n}{N-1}=1\cdot\frac{6}{9}=\frac{2}{3}\approx0.6667,
VarHG =np(1−p)N−1N−n =1⋅96 =32 ≈0.6667, тогда как биномиальная дисперсия =1=1=1. Меньшая дисперсия концентрирует массу ближе к среднему, поэтому P(X=2)P(X=2)P(X=2) выше в гипергеометрическом случае.
- Симуляция (Монте‑Карло) — практический способ проверить/оценить вероятность: с большим числом прогонов оценка сходится к 0.476190.476190.47619. Погрешность оценки примерно
SE≈p(1−p)N, SE\approx\sqrt{\frac{p(1-p)}{N}},
SE≈Np(1−p) , например при N=10000N=10000N=10000 получится SE≈0.005SE\approx0.005SE≈0.005.
Резюме: используйте полный комбинаторный (гипергеометрический) метод — он точен; биномиальная модель годится как приближение при возвращении или большой популяции; симуляция полезна для проверки и оценки погрешности.