В задаче по теории вероятностей: даны две urnы с разными составами шаров, игрок выбирает урну случайно и затем вытаскивает шар. Как оценить вероятность выигрыша и как изменилась бы стратегия при известном выигрыше за определённый цвет; сравните байесовский и частотный подходы
Предыдущий
вопрос Следующий
вопрос

Question

В задаче по теории вероятностей: даны две urnы с разными составами шаров, игрок выбирает урну случайно и затем вытаскивает шар. Как оценить вероятность выигрыша и как изменилась бы стратегия при известном выигрыше за определённый цвет; сравните байесовский и частотный подходы
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по математике

В задаче по теории в...

eva

27 Ноя в 09:44

5 +5

0

Helper · Answer 1

1) Базовая оценка вероятности выигрыша (урна выбирается случайно). Пусть есть две урны

U_1,U_2

с известными вероятностями вытащить выигрышный цвет

p2=P(win∣U2)p_1=P(\text{win}|U_1),\; p_2=P(\text{win}|U_2)

и вероятность выбора урны

P(U_1)=q,\; P(U_2)=1-q

. Тогда по формуле полной вероятности

P(\text{win})=q\,p_1+(1-q)\,p_2.

При равновероятном выборе урн

q = 1/2

, т.е.

P(win)=12(p1+p2)P(\text{win})=\tfrac{1}{2}(p_1+p_2)

.
2) Если игрок может выбирать урну и за определённый цвет известна выплата. Пусть за цвет A выплата

w_A

, за B —

w_B

. Тогда ожидаемая выплата при выборе

U_i

E[\text{payoff}|U_i]=w_A\cdot P(A|U_i)+w_B\cdot P(B|U_i).

Стратегия: выбрать урну

U_i

с максимальным

E[payoff∣Ui]E[\text{payoff}|U_i]

. В частном случае «выигрыш только при цвете A» (т.е.

w_A=1,\; w_B=0

) это сводится к выбору урны с большим

P(A|U_i)

.
Пример:

q=1/2⇒P(win)=0.45p_1=0.3,\; p_2=0.6,\; q=1/2\Rightarrow P(\text{win})=0.45

. Если можно выбирать и выигрыш за нужный цвет равен 1, берём

U_2

(0.6>0.3).
3) Сравнение байесовского и частотного подходов при неизвестных

p_1,p_2

.
- Частотный подход:
- Оцениваем вероятности частотами: при

n_i

наблюдениях и

k_i

выигрышах

p^i=ki/ni\hat p_i=k_i/n_i

(MLE).
- Подставляем в формулы (например,

P(win)≈qp^1+(1−q)p^2P(\text{win})\approx q\hat p_1+(1-q)\hat p_2

) и выбираем урну по максимальной

p^i\hat p_i

(или по максимальной оценке ожидаемой выплаты).
- Можно строить доверительные интервалы и проводить тесты; асимптотические частотные гарантии (сходимость, покрытие) при больших выборках.
- Минус: при малых выборках оценки нестабильны, нет учёта априорной информации.
- Байесовский подход:
- Задаём априор для каждой

p_i

, часто Beta

(α,β)(\alpha,\beta)

. После наблюдений

k_i

из

n_i

получаем апостериор Beta

(α+ki,β+ni−ki)(\alpha+k_i,\beta+n_i-k_i)

.
- Предиктивная вероятность следующего выигрыша (постерior mean) равна

\mathbb{E}[p_i|\text{данные}] = \frac{\alpha+k_i}{\alpha+\beta+n_i},

(для несмешанной оценки предсказания можно использовать эту величину).
- Решение: выбирать урну, максимизирующую апостериорное ожидание полезности (интеграл полезности по апостериору).
- Плюсы: учитывает априорные знания, даёт корректное учёт неопределённости (получаем распределение, а не только точечную оценку), устойчив при малых n (шри́нкедж). Минусы: зависимость от априора; вычисления могут быть сложнее.
Короткое руководство по выбору метода:
- Большие данные, отсутствие разумного априорного знания: частотный подход (MLE, интервалы).
- Малые выборки или есть априорная информация/неопределённость, важна корректная учётная неопределённость: байесовский (Beta-приоры для биномиальных моделей — простое и практичное решение).
- Для принятия решения в условиях неопределённости байесовская максимизация ожидаемой полезности даёт более согласованные решения, а частотный подход хорош для долгосрочных частотных свойств и контроля ошибок.

Другие вопросы eva

Другие вопросы
eva