Игровая ситуация: три двери, за одной машина, за двумя козы; игрок выбирает дверь, ведущий открывает одну козью дверь из оставшихся и предлагает поменять выбор; проанализируйте ситуации, когда ведущий выбирает дверь случайно, когда выбирает с предвзятостью, и когда информация о выборе ведущего не является полной; какой стратегии должен придерживаться игрок и почему (формулировка модели и обоснование)?
Коротко: оптимальная стратегия зависит от модели поведения ведущего. Формулировка модели (общая): пусть C∈{1,2,3}C\in\{1,2,3\}C∈{1,2,3} — дверь с машиной, игрок выбирает дверь PPP (без потери общности P=1P=1P=1), ведущий открывает дверь H∈{2,3}H\in\{2,3\}H∈{2,3} по некоторому правилу (стохастической функции) s(h∣c,p)=Pr(H=h∣C=c,P=p)s(h\mid c,p)=\Pr(H=h\mid C=c,P=p)s(h∣c,p)=Pr(H=h∣C=c,P=p). После наблюдения H=hH=hH=h апостериорная вероятность, что машина за дверью ccc, даётся Байесом: Pr(C=c∣H=h,P=p) = Pr(C=c) s(h∣c,p)∑c′Pr(C=c′) s(h∣c′,p).
\Pr(C=c\mid H=h,P=p)\;=\; \frac{\Pr(C=c)\,s(h\mid c,p)}{\sum_{c'}\Pr(C=c')\,s(h\mid c',p)}. Pr(C=c∣H=h,P=p)=∑c′Pr(C=c′)s(h∣c′,p)Pr(C=c)s(h∣c,p).
Решение: переключаться, если Pr(машина за другой закрытой дверью∣H=h)>1/2\Pr(\text{машина за другой закрытой дверью}\mid H=h)>1/2Pr(машиназадругойзакрытойдверью∣H=h)>1/2; иначе не переключаться. Разбор трёх ситуаций. 1) Ведущий всегда знает, никогда не открывает машину и всегда предлагает смену (классический Monty Hall). Модель: Pr(C=c)=1/3\Pr(C=c)=1/3Pr(C=c)=1/3 для каждого ccc; если PPP — не машина (C≠PC\ne PC=P), у ведущего выбора нет и он открывает единственную козью дверь; если PPP — машина (C=PC=PC=P), он случайно (или по любой фиксированной жёсткой схеме) открывает одну из двух козьих дверей. Независимо от деталей выбора при наличии выбора, общая вероятность того, что изначально выбранная дверь содержит машину — 1/31/31/3, что она не содержит — 2/32/32/3. Следовательно при переходе на оставшуюся закрытую дверь вероятность выигрыша равна 2/32/32/3. Вывод: переключаться — оптимально (выигрыш 2/32/32/3 против 1/31/31/3 при сохранении). 2) Ведущий выбирает дверь случайно среди оставшихся и при этом может случайно открыть машину (т.е. он не «избегает» машины). Допустим ведущий выбирает равновероятно одну из двух невыбранных дверей независимо от содержимого. Рассмотрим условие, что он открыл козу (иначе игра завершается и переключения нет). Тогда Pr(C=1, H=коза)=13⋅1=13,
\Pr(C=1,\ H=\text{коза})=\tfrac{1}{3}\cdot 1=\tfrac{1}{3}, Pr(C=1,H=коза)=31⋅1=31,Pr(C=2, H=коза)=13⋅12=16,Pr(C=3, H=коза)=16,
\Pr(C=2,\ H=\text{коза})=\tfrac{1}{3}\cdot\tfrac{1}{2}=\tfrac{1}{6}, \quad \Pr(C=3,\ H=\text{коза})=\tfrac{1}{6}, Pr(C=2,H=коза)=31⋅21=61,Pr(C=3,H=коза)=61,
и суммарная вероятность события «открыл козу» равна 2/32/32/3. Поэтому Pr(C=1∣H=коза)=1/32/3=12,
\Pr(C=1\mid H=\text{коза})=\frac{1/3}{2/3}=\tfrac{1}{2}, Pr(C=1∣H=коза)=2/31/3=21,
то есть при условии, что ведущий случайно открыл козу и вам предлагают сменить — шансы на машине за вашей первоначальной дверью и за другой равны 1/21/21/2. Вывод: переключение не даёт преимущества (равновероятно). Если же ведущий может иногда открывать машину и тогда игра прекращается, то информация о том, что он не открыл машину, меняет апостериорную вероятность и даёт ровно 1/21/21/2 как показано. 3) Ведущий предвзято выбирает между двумя козами (он всегда избегает машины, но при наличии выбора делает это с известным (или неизвестным) смещением). Модель: как в (1) ведущий никогда не открывает машину; когда C=PC=PC=P (игрок выбрал машину), ведущий открывает двери 222 и 333 с вероятностями qqq и 1−q1-q1−q (параметр предвзятости). Пусть он открыл дверь 333. Тогда по формуле Байеса: Pr(C=2∣H=3)=13⋅113q+13⋅1+0=11+q,Pr(C=1∣H=3)=13q13(q+1)=q1+q.
\Pr(C=2\mid H=3)=\frac{\tfrac{1}{3}\cdot 1}{\tfrac{1}{3}q+\tfrac{1}{3}\cdot 1+0}=\frac{1}{1+q}, \quad \Pr(C=1\mid H=3)=\frac{\tfrac{1}{3}q}{\tfrac{1}{3}(q+1)}=\frac{q}{1+q}. Pr(C=2∣H=3)=31q+31⋅1+031⋅1=1+q1,Pr(C=1∣H=3)=31(q+1)31q=1+qq.
Следовательно вероятность выиграть при переключении на оставшуюся (№2) равна 11+q\dfrac{1}{1+q}1+q1. Особые случаи: q=12q=\tfrac12q=21 (симметричный выбор) даёт 23\tfrac{2}{3}32 — классика; q=0q=0q=0 даёт выигрыш при переключении с вероятностью 111; q→1q\to1q→1 даёт 12\tfrac{1}{2}21. Однако важное замечание: если ведущий действительно никогда не открывает машину и всегда делает предложение «сменить», то вне зависимости от qqq безусловная (до наблюдения, усреднённая) вероятность выигрыша при переключении равна 2/32/32/3 (потому что переключение выигрывает всегда в тех случаях, когда игрок изначально выбрал козу, а это происходит с вероятностью 2/32/32/3). Смещение qqq влияет только на условную вероятность, видимую после того, какую конкретную дверь ведущий открыл. 4) Неполная информация о выборе ведущего (неизвестен протокол s или неизвестно, предлагает ли ведущий смену всегда или выбор зависит от положения машины). В этом случае нужно формализовать неопределость через параметр(ы) θ\thetaθ (например, вероятность того, что ведущий открывает козу в конкретных ситуациях, или вероятность того, что он предлагает смену) и задать априорное распределение π(θ)\pi(\theta)π(θ). Тогда оптимальная стратегия — максимизировать ожидаемую вероятность выигрыша: выбрать “сменить” iff Eθ∼π[Pr(машина за другой дверью∣H,h,θ)]>1/2.
\text{выбрать ``сменить'' iff } \mathbb{E}_{\theta\sim\pi}\big[\Pr(\text{машина за другой дверью}\mid H,h,\theta)\big]>1/2. выбрать “сменить” iff Eθ∼π[Pr(машиназадругойдверью∣H,h,θ)]>1/2.
Если никакой информации о протоколе нет (нет априора и нет оснований полагать ведущего честным), то нельзя однозначно рекомендовать «всегда переключаться»: злоумышленный ведущий, умеющий выбирать, может сделать так, что предложение переключиться даётся только в тех ситуациях, где это невыгодно (вплоть до того, чтобы сделать переключение проигрышным). Поэтому при абсолютно полной неопределённости о политике ведущего нельзя гарантировать преимущество переключения. Практическое правило: - если известно или разумно предполагать, что ведущий не открывает машину и предлагает смену всегда независимо от положения машины — переключаться (выигрыш 2/32/32/3); - если известно, что ведущий выбирает дверь полностью случайно (и вы видите, что он открыл козу) — переключение не даёт преимущества (шансы 1/21/21/2); - если политика ведущего частично неизвестна — формализуйте модель sss, поставьте априор и примените Байес; при отсутствии информации используйте консервативный (minimax) подход — не переключаться, если боитесь худшего сценария, или требуйте дополнительной информации о протоколе. Короткое резюме: при стандартном правиле ведущего (он знает, избегает машины и всегда предлагает смену) переключаться выгодно (2/3). Если ведущий выбирает дверь случайно и мог бы открыть машину, то при условии, что он открыл козу, переключение даёт 1/21/21/2 (невыгодно). При предвзятом выборе между козами общая выгода переключения остаётся (в среднем) 2/32/32/3, но условная вероятность после конкретного хода ведущего зависит от параметра смещения qqq по формуле Pr(машина за другой∣H)=11+q\Pr(\text{машина за другой}\mid H)=\dfrac{1}{1+q}Pr(машиназадругой∣H)=1+q1. При неполной информации решайте через байесовский анализ либо действуйте осторожно (не переключаться) при страхе худшего.
Pr(C=c∣H=h,P=p) = Pr(C=c) s(h∣c,p)∑c′Pr(C=c′) s(h∣c′,p). \Pr(C=c\mid H=h,P=p)\;=\;
\frac{\Pr(C=c)\,s(h\mid c,p)}{\sum_{c'}\Pr(C=c')\,s(h\mid c',p)}.
Pr(C=c∣H=h,P=p)=∑c′ Pr(C=c′)s(h∣c′,p)Pr(C=c)s(h∣c,p) . Решение: переключаться, если Pr(машина за другой закрытой дверью∣H=h)>1/2\Pr(\text{машина за другой закрытой дверью}\mid H=h)>1/2Pr(машина за другой закрытой дверью∣H=h)>1/2; иначе не переключаться.
Разбор трёх ситуаций.
1) Ведущий всегда знает, никогда не открывает машину и всегда предлагает смену (классический Monty Hall).
Модель: Pr(C=c)=1/3\Pr(C=c)=1/3Pr(C=c)=1/3 для каждого ccc; если PPP — не машина (C≠PC\ne PC=P), у ведущего выбора нет и он открывает единственную козью дверь; если PPP — машина (C=PC=PC=P), он случайно (или по любой фиксированной жёсткой схеме) открывает одну из двух козьих дверей. Независимо от деталей выбора при наличии выбора, общая вероятность того, что изначально выбранная дверь содержит машину — 1/31/31/3, что она не содержит — 2/32/32/3. Следовательно при переходе на оставшуюся закрытую дверь вероятность выигрыша равна 2/32/32/3. Вывод: переключаться — оптимально (выигрыш 2/32/32/3 против 1/31/31/3 при сохранении).
2) Ведущий выбирает дверь случайно среди оставшихся и при этом может случайно открыть машину (т.е. он не «избегает» машины). Допустим ведущий выбирает равновероятно одну из двух невыбранных дверей независимо от содержимого. Рассмотрим условие, что он открыл козу (иначе игра завершается и переключения нет). Тогда
Pr(C=1, H=коза)=13⋅1=13, \Pr(C=1,\ H=\text{коза})=\tfrac{1}{3}\cdot 1=\tfrac{1}{3},
Pr(C=1, H=коза)=31 ⋅1=31 , Pr(C=2, H=коза)=13⋅12=16,Pr(C=3, H=коза)=16, \Pr(C=2,\ H=\text{коза})=\tfrac{1}{3}\cdot\tfrac{1}{2}=\tfrac{1}{6},
\quad
\Pr(C=3,\ H=\text{коза})=\tfrac{1}{6},
Pr(C=2, H=коза)=31 ⋅21 =61 ,Pr(C=3, H=коза)=61 , и суммарная вероятность события «открыл козу» равна 2/32/32/3. Поэтому
Pr(C=1∣H=коза)=1/32/3=12, \Pr(C=1\mid H=\text{коза})=\frac{1/3}{2/3}=\tfrac{1}{2},
Pr(C=1∣H=коза)=2/31/3 =21 , то есть при условии, что ведущий случайно открыл козу и вам предлагают сменить — шансы на машине за вашей первоначальной дверью и за другой равны 1/21/21/2. Вывод: переключение не даёт преимущества (равновероятно). Если же ведущий может иногда открывать машину и тогда игра прекращается, то информация о том, что он не открыл машину, меняет апостериорную вероятность и даёт ровно 1/21/21/2 как показано.
3) Ведущий предвзято выбирает между двумя козами (он всегда избегает машины, но при наличии выбора делает это с известным (или неизвестным) смещением). Модель: как в (1) ведущий никогда не открывает машину; когда C=PC=PC=P (игрок выбрал машину), ведущий открывает двери 222 и 333 с вероятностями qqq и 1−q1-q1−q (параметр предвзятости). Пусть он открыл дверь 333. Тогда по формуле Байеса:
Pr(C=2∣H=3)=13⋅113q+13⋅1+0=11+q,Pr(C=1∣H=3)=13q13(q+1)=q1+q. \Pr(C=2\mid H=3)=\frac{\tfrac{1}{3}\cdot 1}{\tfrac{1}{3}q+\tfrac{1}{3}\cdot 1+0}=\frac{1}{1+q},
\quad
\Pr(C=1\mid H=3)=\frac{\tfrac{1}{3}q}{\tfrac{1}{3}(q+1)}=\frac{q}{1+q}.
Pr(C=2∣H=3)=31 q+31 ⋅1+031 ⋅1 =1+q1 ,Pr(C=1∣H=3)=31 (q+1)31 q =1+qq . Следовательно вероятность выиграть при переключении на оставшуюся (№2) равна 11+q\dfrac{1}{1+q}1+q1 . Особые случаи: q=12q=\tfrac12q=21 (симметричный выбор) даёт 23\tfrac{2}{3}32 — классика; q=0q=0q=0 даёт выигрыш при переключении с вероятностью 111; q→1q\to1q→1 даёт 12\tfrac{1}{2}21 . Однако важное замечание: если ведущий действительно никогда не открывает машину и всегда делает предложение «сменить», то вне зависимости от qqq безусловная (до наблюдения, усреднённая) вероятность выигрыша при переключении равна 2/32/32/3 (потому что переключение выигрывает всегда в тех случаях, когда игрок изначально выбрал козу, а это происходит с вероятностью 2/32/32/3). Смещение qqq влияет только на условную вероятность, видимую после того, какую конкретную дверь ведущий открыл.
4) Неполная информация о выборе ведущего (неизвестен протокол s или неизвестно, предлагает ли ведущий смену всегда или выбор зависит от положения машины). В этом случае нужно формализовать неопределость через параметр(ы) θ\thetaθ (например, вероятность того, что ведущий открывает козу в конкретных ситуациях, или вероятность того, что он предлагает смену) и задать априорное распределение π(θ)\pi(\theta)π(θ). Тогда оптимальная стратегия — максимизировать ожидаемую вероятность выигрыша:
выбрать “сменить” iff Eθ∼π[Pr(машина за другой дверью∣H,h,θ)]>1/2. \text{выбрать ``сменить'' iff } \mathbb{E}_{\theta\sim\pi}\big[\Pr(\text{машина за другой дверью}\mid H,h,\theta)\big]>1/2.
выбрать “сменить” iff Eθ∼π [Pr(машина за другой дверью∣H,h,θ)]>1/2. Если никакой информации о протоколе нет (нет априора и нет оснований полагать ведущего честным), то нельзя однозначно рекомендовать «всегда переключаться»: злоумышленный ведущий, умеющий выбирать, может сделать так, что предложение переключиться даётся только в тех ситуациях, где это невыгодно (вплоть до того, чтобы сделать переключение проигрышным). Поэтому при абсолютно полной неопределённости о политике ведущего нельзя гарантировать преимущество переключения. Практическое правило:
- если известно или разумно предполагать, что ведущий не открывает машину и предлагает смену всегда независимо от положения машины — переключаться (выигрыш 2/32/32/3);
- если известно, что ведущий выбирает дверь полностью случайно (и вы видите, что он открыл козу) — переключение не даёт преимущества (шансы 1/21/21/2);
- если политика ведущего частично неизвестна — формализуйте модель sss, поставьте априор и примените Байес; при отсутствии информации используйте консервативный (minimax) подход — не переключаться, если боитесь худшего сценария, или требуйте дополнительной информации о протоколе.
Короткое резюме: при стандартном правиле ведущего (он знает, избегает машины и всегда предлагает смену) переключаться выгодно (2/3). Если ведущий выбирает дверь случайно и мог бы открыть машину, то при условии, что он открыл козу, переключение даёт 1/21/21/2 (невыгодно). При предвзятом выборе между козами общая выгода переключения остаётся (в среднем) 2/32/32/3, но условная вероятность после конкретного хода ведущего зависит от параметра смещения qqq по формуле Pr(машина за другой∣H)=11+q\Pr(\text{машина за другой}\mid H)=\dfrac{1}{1+q}Pr(машина за другой∣H)=1+q1 . При неполной информации решайте через байесовский анализ либо действуйте осторожно (не переключаться) при страхе худшего.