Монету подбрасывают 10 раз, но известно, что результаты могут демонстрировать зависимость от предыдущего броска (марковская зависимость). Предложите модель для оценки вероятности выпадения орла и подробно обоснуйте выбор процедур оценки и критериев качества оценок
Предыдущий
вопрос Следующий
вопрос

Question

Монету подбрасывают 10 раз, но известно, что результаты могут демонстрировать зависимость от предыдущего броска (марковская зависимость). Предложите модель для оценки вероятности выпадения орла и подробно обоснуйте выбор процедур оценки и критериев качества оценок
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по математике

Монету подбрасывают ...

eva

30 Сен в 17:29

11 +1

0

Helper · Answer 1

Ниже — компактное, прозрачное предложение модели, процедуры оценивания и критерии качества, пригодные для данных из 10 бросков монеты, когда допускается зависимость от предыдущего результата (марковская зависимость).

1) Модель

Возьмём однозвенную (первого порядка) цепь Маркова на двух состояниях {H (орёл), T (решка)}. Обозначим
α = P(next = H | current = H),β = P(next = H | current = T).Матрица переходов:
[ [α, 1−α],
[β, 1−β] ].Начальное состояние x1 можно считать фиксированным (условно), или моделировать как случайное с неизвестной начальной вероятностью π1. Практически при 10 бросках удобнее работать с условием на x1 (иначе вводится ещё параметр начального распределения).

Интерпретация параметров:

α и β — напрямую оценивают влияние предыдущего броска.Стационарная вероятность орла (если цепь стационарна) π_H = β / (β + 1 − α).

2) Данные и достаточные статистики

Пусть наблюдаем последовательность x1,...,x10. Рассмотрим 9 переходов (t = 1..9): counts
n_HH = число переходов H→H,n_HT = число H→T,n_TH = число T→H,n_TT = число T→T.Тогда n_H = n_HH + n_HT = число времен, когда предыдущее было H (количество испытаний для оценки α),
n_T = n_TH + n_TT = число времен, когда предыдущее было T (для β).
n_H + n_T = 9.

3) Оценки (точечные)

MLE (очевидно и удобно):
\hat{α} = n_HH / n_H (если n_H>0),\hat{β} = n_TH / n_T (если n_T>0).
Это следует из того, что условно на предыдущем состоянии число «успехов» (переходов в H) биномиально.Оценка стационарной доли орлов (plug-in):
\hat{π}_H = \hat{β} / (\hat{β} + 1 − \hat{α}).

4) Интервальные оценки и малые выборки (особенно важно для n=10)

Для α и β: поскольку условно на число предшествующих состояний эти оценки — биномиальные доли, используйте точные биномиальные интервалы (Clopper–Pearson) или Wilson/Agresti–Coull для более «корректных» малых выборок. Эти интервалы дают корректное (в смысле покрытия) отражение неопределённости при малых n_H, n_T.Для π_H: можно получить интервал двумя способами:
Бутстрэп (параметрический): имитировать цепочки по оценённым (\hat{α},\hat{β}) и строить эмпирическое распределение \hat{π}_H; это даёт надежные интервалы при малой выборке.Дельта-метод (асимптотический) — быстро, но при n=10 может быть неточен.Байесовский вариант: взять независимые Beta-приоромы для α и β (например, Beta(1,1) — равновероятный), получить постериорные Beta(n_HH+α0, n_HT+β0) и Beta(n_TH+α0, n_TT+β0). Постериорные интервалы и предиктивные распределения удобны при малых n и дают естественное регуляризующее смещение.

5) Тестирование зависимости (марковость vs iid)

Нулевая гипотеза H0: независимые броски (iid Bernoulli с параметром p), т.е. α = β = p.Альтернатива H1: α ≠ β (порядка-1 Марков).Тесты:
Ликелихудное отношение (LRT): сравнить лог-правдоподобие Марковской модели (два параметра α,β) и iid-модели (1 параметр p = (n_HH + n_TH)/(n_H + n_T) условно или просто частота H). Статистика −2 log Λ примерно распределена χ^2 с df = 1 (в больших выборках). При n=10 лучше оценивать p-value с помощью бутстрапа или точной перестановки.Альтернативно: 2×2 таблица переходов (текущий vs следующий), провести точный тест Фишера или χ^2-проверку на независимость строк и столбцов (df=1). Точный тест предпочтителен при малых счётах.Вывод: если H0 не отвергается и число параметров мало, может быть предпочтителен простейший iid-модель.

6) Критерии качества оценок и их обоснование

Смещение (bias): важно знать есть ли систематическое смещение; MLE для α,β при взятии условно на предыдущее состояние — несмещённы относительно условного распределения (в частотном смысле).Дисперсия и MSE: для малых n ключевым является trade-off bias–variance; MSE полезна для сравнения методов (MLE vs байес с априори).Покрытие доверительных интервалов (coverage): особенно важно для малых выборок — применять методы с контролируемым покрытием (Clopper–Pearson, байесовские Credible intervals с хорошо подобранным prior).Консистентность и эффективность: при n→∞ MLE асимптотически состоятельны и эффективны; но при 10 наблюдениях асимптотика слабо применима.Предсказательная способность: log-правдоподобие на отложенной выборке, Brier score, кросс-валидация — критерии, если цель — прогнозировать следующий бросок.Комплексные критерии выбора модели: AIC/BIC (штраф за число параметров) — помогут выбрать между iid и марковской моделью, с оговоркой: при очень малых n BIC/AIC могут быть нестабильны, поэтому подкреплять тестами/бутстрэпом.

7) Практическая рекомендуемая процедура для 10 бросков

Посчитать n_HH, n_HT, n_TH, n_TT.Оценить α и β как частоты переходов (MLE).Построить точные биномиальные интервалы для α и β (Clopper–Pearson) — учитывает малую выборку.Оценить π_H plug-in; построить интервал для π_H через параметрический бутстрэп (симулировать многие цепочки длины 10 по (\hat{α},\hat{β}), вычислять \hat{π}_H) или байесовский подход.Проверить H0 (iid) против H1 (марков) с помощью точного теста Фишера на 2×2 таблице или бутстрап-версии LRT.При желании использовать непараметрический/априорный подход: дать Beta(1,1) prior для α,β; сообщить постериорные средние и 95% credible intervals — это особенно полезно при малых n, т.к. интервалы не выходят в крайние значения с нулевыми/полными частотами.

8) Замечания и предостережения

При n=10 возможны нулевые или очень малые n_H или n_T, тогда MLE для соответствующего параметра не определено/неустойчиво; Bayesian регуляризация или объединение параметров (предположить α=β) помогает.Если интерес — только вероятность орла в отдельном броске (без учёта предыстории), можно оценивать её непосредственно как частоту H (iid-подход), но при наличии марковской зависимости этот оценщик не даёт информации о динамике и может иметь бОльшую дисперсию для предсказания следующего броска.Если планируется прогноз следующего броска, лучше оценивать условную вероятность на основе последнего наблюдения: P(next=H | last = H) = \hat{α}, P(next=H | last = T) = \hat{β}.

Итого: модель первого порядка цепи Маркова с двумя параметрами α и β — естественный и минимально сложный выбор для моделирования зависимости от предыдущего броска. При 10 наблюдениях рекомендую MLE для точечных оценок, точные биномиальные или байесовские интервалы для α и β, бутстрэп для производных величин (например π_H) и точный/бутстрэп-тест для проверки iid vs Markov. Критериями качества используйте MSE, покрытие интервалов, предсказательную способность (лог-правдоподобие) и критерии информационного компромисса (AIC/BIC) при сравнении моделей.

Если хотите, могу:

На конкретном вашем наблюдении (послать строку из H/T) посчитать n_ij, дать оценки, интервалы и результат теста.Привести краткий R/Python-скрипт для вычислений и бутстрэп-проверок.

Другие вопросы eva

Другие вопросы
eva