Вопрос по теории вероятностей: приведите и обсудите различные определения условной вероятности при нулевой вероятности условного события; какие подходы применяются в современной теории и почему они различаются
Кратко о главных подходах и о том, почему они различаются. 1) Классическое определение (Колмогоров) - При P(B)>0P(B)>0P(B)>0: P(A∣B)=P(A∩B)P(B)P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}P(A∣B)=P(B)P(A∩B). - При P(B)=0P(B)=0P(B)=0 это неопределённо; в теории вводят условное ожидание/условную вероятность относительно σ‑алгебры G\mathcal GG: условная вероятность множества AAA как случайная величина P(A∣G)=E[1A∣G],
P(A\mid\mathcal G)=\mathbb E[1_A\mid\mathcal G], P(A∣G)=E[1A∣G],
определённая в смысле почти всюду (a.s.). Значение на множествах нулевой вероятности не фиксировано — только класс a.s. эквивалентных версий. 2) Регулярная условная вероятность / дизинтеграция (disintegration, RCP) - Если пространство «хорошее» (обычно стандартное Борелево), то существует семейство мер {Py}\{P_y\}{Py} такие, что для измеримых A,BA,BA,BP(X∈A, Y∈B)=∫BPy(A) μY(dy).
P(X\in A,\,Y\in B)=\int_B P_y(A)\,\mu_Y(dy). P(X∈A,Y∈B)=∫BPy(A)μY(dy).
Тогда для μY\mu_YμY-почти всех yyy определяют P(X∈A∣Y=y)=Py(A)P(X\in A\mid Y=y)=P_y(A)P(X∈A∣Y=y)=Py(A). Это даёт точечные значения при «нулевых» одномерных событиях {Y=y} \{Y=y\}{Y=y} только для a.e. yyy; для конкретного yyy значение неуниверсально без дополнительных соглашений. 3) Подход через предельное условие (conditioning as limit) - Задают BnB_nBn с P(Bn)>0P(B_n)>0P(Bn)>0, Bn↓BB_n\downarrow BBn↓B и берут P(A∣B)=limn→∞P(A∣Bn),
P(A\mid B)=\lim_{n\to\infty}P(A\mid B_n), P(A∣B)=n→∞limP(A∣Bn),
если предел существует и не зависит от выбора последовательности. Такой подход интуитивен (оперативное приближение нулевого события) но не даёт единственности: разные приближения могут давать разные пределы (пример: парадокс Бореля — условная мера на сфере зависит от параметризации/приближения). 4) Плотности и условные плотности - Если существует совместная плотность fX,Y(x,y)f_{X,Y}(x,y)fX,Y(x,y) и маргинальная fY(y)f_Y(y)fY(y), то формально fX∣Y(x∣y)=fX,Y(x,y)fY(y).
f_{X\mid Y}(x\mid y)=\frac{f_{X,Y}(x,y)}{f_Y(y)}. fX∣Y(x∣y)=fY(y)fX,Y(x,y).
При fY(y)=0f_Y(y)=0fY(y)=0 выражение не определено; однако при наличии регулярной версии условной плотности можно определить fX∣Y(x∣y)f_{X\mid Y}(x\mid y)fX∣Y(x∣y) для почти всех yyy. Для конкретного нулевого yyy часто берут предел по окрестностям, но это снова зависит от способа предела. 5) Аксиоматические/другое: Поппер, Реньи, де Финетти и конечная аддитивность - Поппер‑функции и Реньи‑пространства принимают условную вероятность P(A∣B)P(A\mid B)P(A∣B) за примитив и вводят аксиомы, которые позволяют определять её и для P(B)=0P(B)=0P(B)=0. Это даёт более широкие, но неоднозначные возможности: дополнительные допущения (согласованность, однозначность) нужны для уникальности. Де Финетти использовал понятие когерентности (ставки), допускающее конечную аддитивность (а не σ‑аддитивность), что также меняет поведение при нулевых событиях. Почему разные подходы и в чём принципиальная причина различий - Неопределённость на множествах нулевой меры: при теории меры объекты задаются по равенству почти всюду, поэтому точечные значения на нулевых множествах не закреплены и могут быть изменены. Любое «определение» на таких множествах требует дополнительных соглашений. - Топология/структура пространства: в стандартных Бореловых пространствах дизинтеграция существует и даёт естественные версии; в произвольных пространствах может не существовать. - Операциональность vs. аксиоматичность: предельный/плотностной подходы удобны для прикладных задач; аксиоматические подходы пытаются формализовать условие для всех пар событий, но требуют жёстких допущений и дают неоднозначность. - Инвариантность: некоторые способы (дизинтеграция в стандартых пространствах) дают инвариантное определение, другие (пределы/параметризации) — приводят к парадоксам зависимым от выбора координат. Короткая сводка практикующему: - Если работаете в стандартном вероятностном пространстве (например, с вещественными RV), пользуйтесь регулярной условной вероятностью / дизинтеграцией — она даёт «правильные» версии для почти всех значений. - Для интерпретаций, требующих значения именно при конкретном нулевом событии, нужно явно указать способ определения (предел по окрестностям, выбор версии RCP, аксиоматизация типа Поппера и т. п.) и принять, что результат может зависеть от этого выбора.
1) Классическое определение (Колмогоров)
- При P(B)>0P(B)>0P(B)>0: P(A∣B)=P(A∩B)P(B)P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}P(A∣B)=P(B)P(A∩B) .
- При P(B)=0P(B)=0P(B)=0 это неопределённо; в теории вводят условное ожидание/условную вероятность относительно σ‑алгебры G\mathcal GG: условная вероятность множества AAA как случайная величина
P(A∣G)=E[1A∣G], P(A\mid\mathcal G)=\mathbb E[1_A\mid\mathcal G],
P(A∣G)=E[1A ∣G], определённая в смысле почти всюду (a.s.). Значение на множествах нулевой вероятности не фиксировано — только класс a.s. эквивалентных версий.
2) Регулярная условная вероятность / дизинтеграция (disintegration, RCP)
- Если пространство «хорошее» (обычно стандартное Борелево), то существует семейство мер {Py}\{P_y\}{Py } такие, что для измеримых A,BA,BA,B P(X∈A, Y∈B)=∫BPy(A) μY(dy). P(X\in A,\,Y\in B)=\int_B P_y(A)\,\mu_Y(dy).
P(X∈A,Y∈B)=∫B Py (A)μY (dy). Тогда для μY\mu_YμY -почти всех yyy определяют P(X∈A∣Y=y)=Py(A)P(X\in A\mid Y=y)=P_y(A)P(X∈A∣Y=y)=Py (A). Это даёт точечные значения при «нулевых» одномерных событиях {Y=y} \{Y=y\}{Y=y} только для a.e. yyy; для конкретного yyy значение неуниверсально без дополнительных соглашений.
3) Подход через предельное условие (conditioning as limit)
- Задают BnB_nBn с P(Bn)>0P(B_n)>0P(Bn )>0, Bn↓BB_n\downarrow BBn ↓B и берут
P(A∣B)=limn→∞P(A∣Bn), P(A\mid B)=\lim_{n\to\infty}P(A\mid B_n),
P(A∣B)=n→∞lim P(A∣Bn ), если предел существует и не зависит от выбора последовательности. Такой подход интуитивен (оперативное приближение нулевого события) но не даёт единственности: разные приближения могут давать разные пределы (пример: парадокс Бореля — условная мера на сфере зависит от параметризации/приближения).
4) Плотности и условные плотности
- Если существует совместная плотность fX,Y(x,y)f_{X,Y}(x,y)fX,Y (x,y) и маргинальная fY(y)f_Y(y)fY (y), то формально
fX∣Y(x∣y)=fX,Y(x,y)fY(y). f_{X\mid Y}(x\mid y)=\frac{f_{X,Y}(x,y)}{f_Y(y)}.
fX∣Y (x∣y)=fY (y)fX,Y (x,y) . При fY(y)=0f_Y(y)=0fY (y)=0 выражение не определено; однако при наличии регулярной версии условной плотности можно определить fX∣Y(x∣y)f_{X\mid Y}(x\mid y)fX∣Y (x∣y) для почти всех yyy. Для конкретного нулевого yyy часто берут предел по окрестностям, но это снова зависит от способа предела.
5) Аксиоматические/другое: Поппер, Реньи, де Финетти и конечная аддитивность
- Поппер‑функции и Реньи‑пространства принимают условную вероятность P(A∣B)P(A\mid B)P(A∣B) за примитив и вводят аксиомы, которые позволяют определять её и для P(B)=0P(B)=0P(B)=0. Это даёт более широкие, но неоднозначные возможности: дополнительные допущения (согласованность, однозначность) нужны для уникальности. Де Финетти использовал понятие когерентности (ставки), допускающее конечную аддитивность (а не σ‑аддитивность), что также меняет поведение при нулевых событиях.
Почему разные подходы и в чём принципиальная причина различий
- Неопределённость на множествах нулевой меры: при теории меры объекты задаются по равенству почти всюду, поэтому точечные значения на нулевых множествах не закреплены и могут быть изменены. Любое «определение» на таких множествах требует дополнительных соглашений.
- Топология/структура пространства: в стандартных Бореловых пространствах дизинтеграция существует и даёт естественные версии; в произвольных пространствах может не существовать.
- Операциональность vs. аксиоматичность: предельный/плотностной подходы удобны для прикладных задач; аксиоматические подходы пытаются формализовать условие для всех пар событий, но требуют жёстких допущений и дают неоднозначность.
- Инвариантность: некоторые способы (дизинтеграция в стандартых пространствах) дают инвариантное определение, другие (пределы/параметризации) — приводят к парадоксам зависимым от выбора координат.
Короткая сводка практикующему:
- Если работаете в стандартном вероятностном пространстве (например, с вещественными RV), пользуйтесь регулярной условной вероятностью / дизинтеграцией — она даёт «правильные» версии для почти всех значений.
- Для интерпретаций, требующих значения именно при конкретном нулевом событии, нужно явно указать способ определения (предел по окрестностям, выбор версии RCP, аксиоматизация типа Поппера и т. п.) и принять, что результат может зависеть от этого выбора.