Разберите задачу на вероятность: два игрока по очереди бросают честную монету; первый, кто получит шаблон HT, выигрывает. Второй игрок выбирает шаблон TH. Проанализируйте вероятности выигрыша каждого и объясните, почему выбор игрока 2 может дать преимущество
Ответ: при выборе игрока 1 шаблона A=HTA=HTA=HT и игрока 2 шаблона B=THB=THB=TH шансы равны: оба выигрывают с вероятностью 1/21/21/2. Краткий вывод через состояния (учитываем только последний бросок, т.к. шаблоны длины 2). Обозначим pHp_HpH — вероятность победы AAA при том, что последний бросок был HHH, pTp_TpT — при последнем TTT, p0p_0p0 — в начале. Переходы: - Если последний был HHH, то с вероятностью 1/21/21/2 выпадает TTT и сразу появляется HTHTHT (победа AAA), иначе выпадает HHH и состояние остаётся HHH. Поэтому pH=12⋅1+12⋅pH.
p_H=\tfrac12\cdot 1+\tfrac12\cdot p_H. pH=21⋅1+21⋅pH.
Отсюда pH=1p_H=1pH=1. - Если последний был TTT, то с вероятностью 1/21/21/2 выпадет HHH и появится THTHTH (победа BBB), иначе остаёмся в TTT. Значит pT=12⋅0+12⋅pT,
p_T=\tfrac12\cdot 0+\tfrac12\cdot p_T, pT=21⋅0+21⋅pT,
и pT=0p_T=0pT=0. - В начале первый бросок HHH или TTT с равной вероятностью, значит p0=12pH+12pT=12⋅1+12⋅0=12.
p_0=\tfrac12 p_H+\tfrac12 p_T=\tfrac12\cdot 1+\tfrac12\cdot 0=\tfrac12. p0=21pH+21pT=21⋅1+21⋅0=21. Почему второй игрок может получить преимущество в других случаях: дело в «перекрытиях» шаблонов. Если шаблон второго построен так, что при одном символе предварительного состояния он немедленно приводит к своей победе, а шаблон первого в том же состоянии — нет, то второй имеет значительное преимущество. Пример: если первый выбирает HHHHHH, а второй — THTHTH, то по аналогичным уравнениям вероятность победы первого равна 1/41/41/4, второго — 3/43/43/4. Это и есть суть игры Пенни — второй игрок, увидев выбор первого, может подобрать шаблон с выгодной структурой перекрытий.
Краткий вывод через состояния (учитываем только последний бросок, т.к. шаблоны длины 2). Обозначим pHp_HpH — вероятность победы AAA при том, что последний бросок был HHH, pTp_TpT — при последнем TTT, p0p_0p0 — в начале. Переходы:
- Если последний был HHH, то с вероятностью 1/21/21/2 выпадает TTT и сразу появляется HTHTHT (победа AAA), иначе выпадает HHH и состояние остаётся HHH. Поэтому
pH=12⋅1+12⋅pH. p_H=\tfrac12\cdot 1+\tfrac12\cdot p_H.
pH =21 ⋅1+21 ⋅pH . Отсюда pH=1p_H=1pH =1.
- Если последний был TTT, то с вероятностью 1/21/21/2 выпадет HHH и появится THTHTH (победа BBB), иначе остаёмся в TTT. Значит
pT=12⋅0+12⋅pT, p_T=\tfrac12\cdot 0+\tfrac12\cdot p_T,
pT =21 ⋅0+21 ⋅pT , и pT=0p_T=0pT =0.
- В начале первый бросок HHH или TTT с равной вероятностью, значит
p0=12pH+12pT=12⋅1+12⋅0=12. p_0=\tfrac12 p_H+\tfrac12 p_T=\tfrac12\cdot 1+\tfrac12\cdot 0=\tfrac12.
p0 =21 pH +21 pT =21 ⋅1+21 ⋅0=21 .
Почему второй игрок может получить преимущество в других случаях: дело в «перекрытиях» шаблонов. Если шаблон второго построен так, что при одном символе предварительного состояния он немедленно приводит к своей победе, а шаблон первого в том же состоянии — нет, то второй имеет значительное преимущество. Пример: если первый выбирает HHHHHH, а второй — THTHTH, то по аналогичным уравнениям вероятность победы первого равна 1/41/41/4, второго — 3/43/43/4. Это и есть суть игры Пенни — второй игрок, увидев выбор первого, может подобрать шаблон с выгодной структурой перекрытий.