Монету подбрасывают 10 раз, но известно, что результаты могут демонстрировать зависимость от предыдущего броска (марковская зависимость). Предложите модель для оценки вероятности выпадения орла и подробно обоснуйте выбор процедур оценки и критериев качества оценок

30 Сен в 17:29
11 +1
0
Ответы
1

Ниже — компактное, прозрачное предложение модели, процедуры оценивания и критерии качества, пригодные для данных из 10 бросков монеты, когда допускается зависимость от предыдущего результата (марковская зависимость).

1) Модель

Возьмём однозвенную (первого порядка) цепь Маркова на двух состояниях {H (орёл), T (решка)}. Обозначим
α = P(next = H | current = H),β = P(next = H | current = T).Матрица переходов:
[ [α, 1−α],
[β, 1−β] ].Начальное состояние x1 можно считать фиксированным (условно), или моделировать как случайное с неизвестной начальной вероятностью π1. Практически при 10 бросках удобнее работать с условием на x1 (иначе вводится ещё параметр начального распределения).

Интерпретация параметров:

α и β — напрямую оценивают влияние предыдущего броска.Стационарная вероятность орла (если цепь стационарна) π_H = β / (β + 1 − α).

2) Данные и достаточные статистики

Пусть наблюдаем последовательность x1,...,x10. Рассмотрим 9 переходов (t = 1..9): counts
n_HH = число переходов H→H,n_HT = число H→T,n_TH = число T→H,n_TT = число T→T.Тогда n_H = n_HH + n_HT = число времен, когда предыдущее было H (количество испытаний для оценки α),
n_T = n_TH + n_TT = число времен, когда предыдущее было T (для β).
n_H + n_T = 9.

3) Оценки (точечные)

MLE (очевидно и удобно):
\hat{α} = n_HH / n_H (если n_H>0),\hat{β} = n_TH / n_T (если n_T>0).
Это следует из того, что условно на предыдущем состоянии число «успехов» (переходов в H) биномиально.Оценка стационарной доли орлов (plug-in):
\hat{π}_H = \hat{β} / (\hat{β} + 1 − \hat{α}).

4) Интервальные оценки и малые выборки (особенно важно для n=10)

Для α и β: поскольку условно на число предшествующих состояний эти оценки — биномиальные доли, используйте точные биномиальные интервалы (Clopper–Pearson) или Wilson/Agresti–Coull для более «корректных» малых выборок. Эти интервалы дают корректное (в смысле покрытия) отражение неопределённости при малых n_H, n_T.Для π_H: можно получить интервал двумя способами:
Бутстрэп (параметрический): имитировать цепочки по оценённым (\hat{α},\hat{β}) и строить эмпирическое распределение \hat{π}_H; это даёт надежные интервалы при малой выборке.Дельта-метод (асимптотический) — быстро, но при n=10 может быть неточен.Байесовский вариант: взять независимые Beta-приоромы для α и β (например, Beta(1,1) — равновероятный), получить постериорные Beta(n_HH+α0, n_HT+β0) и Beta(n_TH+α0, n_TT+β0). Постериорные интервалы и предиктивные распределения удобны при малых n и дают естественное регуляризующее смещение.

5) Тестирование зависимости (марковость vs iid)

Нулевая гипотеза H0: независимые броски (iid Bernoulli с параметром p), т.е. α = β = p.Альтернатива H1: α ≠ β (порядка-1 Марков).Тесты:
Ликелихудное отношение (LRT): сравнить лог-правдоподобие Марковской модели (два параметра α,β) и iid-модели (1 параметр p = (n_HH + n_TH)/(n_H + n_T) условно или просто частота H). Статистика −2 log Λ примерно распределена χ^2 с df = 1 (в больших выборках). При n=10 лучше оценивать p-value с помощью бутстрапа или точной перестановки.Альтернативно: 2×2 таблица переходов (текущий vs следующий), провести точный тест Фишера или χ^2-проверку на независимость строк и столбцов (df=1). Точный тест предпочтителен при малых счётах.Вывод: если H0 не отвергается и число параметров мало, может быть предпочтителен простейший iid-модель.

6) Критерии качества оценок и их обоснование

Смещение (bias): важно знать есть ли систематическое смещение; MLE для α,β при взятии условно на предыдущее состояние — несмещённы относительно условного распределения (в частотном смысле).Дисперсия и MSE: для малых n ключевым является trade-off bias–variance; MSE полезна для сравнения методов (MLE vs байес с априори).Покрытие доверительных интервалов (coverage): особенно важно для малых выборок — применять методы с контролируемым покрытием (Clopper–Pearson, байесовские Credible intervals с хорошо подобранным prior).Консистентность и эффективность: при n→∞ MLE асимптотически состоятельны и эффективны; но при 10 наблюдениях асимптотика слабо применима.Предсказательная способность: log-правдоподобие на отложенной выборке, Brier score, кросс-валидация — критерии, если цель — прогнозировать следующий бросок.Комплексные критерии выбора модели: AIC/BIC (штраф за число параметров) — помогут выбрать между iid и марковской моделью, с оговоркой: при очень малых n BIC/AIC могут быть нестабильны, поэтому подкреплять тестами/бутстрэпом.

7) Практическая рекомендуемая процедура для 10 бросков

Посчитать n_HH, n_HT, n_TH, n_TT.Оценить α и β как частоты переходов (MLE).Построить точные биномиальные интервалы для α и β (Clopper–Pearson) — учитывает малую выборку.Оценить π_H plug-in; построить интервал для π_H через параметрический бутстрэп (симулировать многие цепочки длины 10 по (\hat{α},\hat{β}), вычислять \hat{π}_H) или байесовский подход.Проверить H0 (iid) против H1 (марков) с помощью точного теста Фишера на 2×2 таблице или бутстрап-версии LRT.При желании использовать непараметрический/априорный подход: дать Beta(1,1) prior для α,β; сообщить постериорные средние и 95% credible intervals — это особенно полезно при малых n, т.к. интервалы не выходят в крайние значения с нулевыми/полными частотами.

8) Замечания и предостережения

При n=10 возможны нулевые или очень малые n_H или n_T, тогда MLE для соответствующего параметра не определено/неустойчиво; Bayesian регуляризация или объединение параметров (предположить α=β) помогает.Если интерес — только вероятность орла в отдельном броске (без учёта предыстории), можно оценивать её непосредственно как частоту H (iid-подход), но при наличии марковской зависимости этот оценщик не даёт информации о динамике и может иметь бОльшую дисперсию для предсказания следующего броска.Если планируется прогноз следующего броска, лучше оценивать условную вероятность на основе последнего наблюдения: P(next=H | last = H) = \hat{α}, P(next=H | last = T) = \hat{β}.

Итого: модель первого порядка цепи Маркова с двумя параметрами α и β — естественный и минимально сложный выбор для моделирования зависимости от предыдущего броска. При 10 наблюдениях рекомендую MLE для точечных оценок, точные биномиальные или байесовские интервалы для α и β, бутстрэп для производных величин (например π_H) и точный/бутстрэп-тест для проверки iid vs Markov. Критериями качества используйте MSE, покрытие интервалов, предсказательную способность (лог-правдоподобие) и критерии информационного компромисса (AIC/BIC) при сравнении моделей.

Если хотите, могу:

На конкретном вашем наблюдении (послать строку из H/T) посчитать n_ij, дать оценки, интервалы и результат теста.Привести краткий R/Python-скрипт для вычислений и бутстрэп-проверок.
30 Сен в 20:15
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир