Рассмотрите вероятностную задачу: при независимых подбрасываниях монеты с вероятностью выпадения орла p требуется найти распределение числа подбрасываний до появления двух подряд орлов. Предложите способы вывода распределения, обсудите рекуррентные соотношения и представление через марковские цепи
Коротко — три способа вывода, рекурренты и марковская модель, с основными формулами. Обозначения: p=Pr(орёл)p=\Pr(\text{орёл})p=Pr(орёл), q=1−pq=1-pq=1−p. Пусть TTT — число подбрасываний до появления двух подряд орлов, an=Pr(T=n)a_n=\Pr(T=n)an=Pr(T=n). 1) Первый шаг / рекурренция по состояниям «последний бросок — H или нет». Введём состояния: 0 — последний бросок не H (или ещё не бросали), 1 — последний бросок H, 2 — поглощающее (HH). Условная разложение даёт для n≥3n\ge3n≥3an=q an−1+pq an−2,
a_n = q\,a_{n-1} + p q\,a_{n-2}, an=qan−1+pqan−2,
с начальными значениями a1=0,a2=p2.
a_1=0,\qquad a_2=p^2. a1=0,a2=p2.
(Обоснование: из состояния 0 после одного броска либо переход в 0 с вероятностью qqq, либо в 1 с вероятностью ppp; из состояния 1 при первом броске хвост переводит в 0, орёл — поглощение.) 2) Метод порождающей функции (или «по первым шагам»). Пусть F(s)=E[sT]=∑n≥1ansnF(s)=\mathbb{E}[s^T]=\sum_{n\ge1} a_n s^nF(s)=E[sT]=∑n≥1ansn. Из первого шага F(s)=qsF(s)+ps(ps+qsF(s)),
F(s)=q s F(s) + p s\big(p s + q s F(s)\big), F(s)=qsF(s)+ps(ps+qsF(s)),
откуда F(s)=p2s21−qs−pqs2.
F(s)=\frac{p^2 s^2}{1 - q s - p q s^2}. F(s)=1−qs−pqs2p2s2.
Разложение этой дроби по степеням sss даёт ту же рекурренцию и явные коэффициенты (см. пункт 3). 3) Решение рекурренции в явном виде. Характеристическое уравнение r2−qr−pq=0,
r^2 - q r - p q =0, r2−qr−pq=0,
корни r1,2=q±q2+4pq2.
r_{1,2}=\frac{q\pm\sqrt{q^2+4pq}}{2}. r1,2=2q±q2+4pq.
Тогда для n≥2n\ge2n≥2an=p2(q−r2)r1 n−2+(r1−q)r2 n−2r1−r2,
a_n = p^2\frac{(q-r_2)r_1^{\,n-2} + (r_1-q)r_2^{\,n-2}}{r_1-r_2}, an=p2r1−r2(q−r2)r1n−2+(r1−q)r2n−2,
что эквивалентно решению рекуррентного соотношения с заданными начальными условиями. 4) Марковская цепь / матричный подход. Остаёмся с двумя невозвратными состояниями 0 и 1 (перед попаданием в поглощающую 2). Матрица перехода для невпитывающей части Q=(qpq0),
Q=\begin{pmatrix} q & p\\[4pt] q & 0\end{pmatrix}, Q=(qqp0),
начальное распределение v0=(1,0)v_0=(1,0)v0=(1,0). Тогда вектор вероятностей нахождения в состояниях 0,1 после n−1n-1n−1 шагов (до поглощения) равен v0Q n−1v_0 Q^{\,n-1}v0Qn−1, и an=p⋅(v0Q n−1)2,
a_n = p\cdot\big(v_0 Q^{\,n-1}\big)_2, an=p⋅(v0Qn−1)2,
поскольку чтобы поглотиться на шаге nnn, на шаге n−1n-1n−1 нужно быть в состоянии 1, а затем выпадает H с вероятностью ppp. Диагонализация QQQ даёт явную форму через r1,2r_{1,2}r1,2, совпадающую с пунктом 3. Дополнительно: математическое ожидание и проверка. Решая уравнения для средних времён из состояний 0 и 1, E0=1+qE0+pE1,E1=1+qE0,
E_0=1+qE_0+pE_1,\qquad E_1=1+qE_0, E0=1+qE0+pE1,E1=1+qE0,
получаем E[T]=E0=1+pp2.
\mathbb{E}[T]=E_0=\frac{1+p}{p^2}. E[T]=E0=p21+p. Заключение (кратко): основные подходы — первый шаг и рекуррентные соотношения, генераторная функция/аналитическое решение рекуррентов, и марковская модель с матричными степенями; все они дают одинаковое распределение, задаваемое рекуррентой an=qan−1+pqan−2a_n=q a_{n-1}+p q a_{n-2}an=qan−1+pqan−2 и явной формулой через корни характеристического уравнения выше.
Обозначения: p=Pr(орёл)p=\Pr(\text{орёл})p=Pr(орёл), q=1−pq=1-pq=1−p. Пусть TTT — число подбрасываний до появления двух подряд орлов, an=Pr(T=n)a_n=\Pr(T=n)an =Pr(T=n).
1) Первый шаг / рекурренция по состояниям «последний бросок — H или нет».
Введём состояния: 0 — последний бросок не H (или ещё не бросали), 1 — последний бросок H, 2 — поглощающее (HH).
Условная разложение даёт для n≥3n\ge3n≥3 an=q an−1+pq an−2, a_n = q\,a_{n-1} + p q\,a_{n-2},
an =qan−1 +pqan−2 , с начальными значениями
a1=0,a2=p2. a_1=0,\qquad a_2=p^2.
a1 =0,a2 =p2. (Обоснование: из состояния 0 после одного броска либо переход в 0 с вероятностью qqq, либо в 1 с вероятностью ppp; из состояния 1 при первом броске хвост переводит в 0, орёл — поглощение.)
2) Метод порождающей функции (или «по первым шагам»).
Пусть F(s)=E[sT]=∑n≥1ansnF(s)=\mathbb{E}[s^T]=\sum_{n\ge1} a_n s^nF(s)=E[sT]=∑n≥1 an sn. Из первого шага
F(s)=qsF(s)+ps(ps+qsF(s)), F(s)=q s F(s) + p s\big(p s + q s F(s)\big),
F(s)=qsF(s)+ps(ps+qsF(s)), откуда
F(s)=p2s21−qs−pqs2. F(s)=\frac{p^2 s^2}{1 - q s - p q s^2}.
F(s)=1−qs−pqs2p2s2 . Разложение этой дроби по степеням sss даёт ту же рекурренцию и явные коэффициенты (см. пункт 3).
3) Решение рекурренции в явном виде.
Характеристическое уравнение
r2−qr−pq=0, r^2 - q r - p q =0,
r2−qr−pq=0, корни
r1,2=q±q2+4pq2. r_{1,2}=\frac{q\pm\sqrt{q^2+4pq}}{2}.
r1,2 =2q±q2+4pq . Тогда для n≥2n\ge2n≥2 an=p2(q−r2)r1 n−2+(r1−q)r2 n−2r1−r2, a_n = p^2\frac{(q-r_2)r_1^{\,n-2} + (r_1-q)r_2^{\,n-2}}{r_1-r_2},
an =p2r1 −r2 (q−r2 )r1n−2 +(r1 −q)r2n−2 , что эквивалентно решению рекуррентного соотношения с заданными начальными условиями.
4) Марковская цепь / матричный подход.
Остаёмся с двумя невозвратными состояниями 0 и 1 (перед попаданием в поглощающую 2). Матрица перехода для невпитывающей части
Q=(qpq0), Q=\begin{pmatrix} q & p\\[4pt] q & 0\end{pmatrix},
Q=(qq p0 ), начальное распределение v0=(1,0)v_0=(1,0)v0 =(1,0). Тогда вектор вероятностей нахождения в состояниях 0,1 после n−1n-1n−1 шагов (до поглощения) равен v0Q n−1v_0 Q^{\,n-1}v0 Qn−1, и
an=p⋅(v0Q n−1)2, a_n = p\cdot\big(v_0 Q^{\,n-1}\big)_2,
an =p⋅(v0 Qn−1)2 , поскольку чтобы поглотиться на шаге nnn, на шаге n−1n-1n−1 нужно быть в состоянии 1, а затем выпадает H с вероятностью ppp. Диагонализация QQQ даёт явную форму через r1,2r_{1,2}r1,2 , совпадающую с пунктом 3.
Дополнительно: математическое ожидание и проверка.
Решая уравнения для средних времён из состояний 0 и 1,
E0=1+qE0+pE1,E1=1+qE0, E_0=1+qE_0+pE_1,\qquad E_1=1+qE_0,
E0 =1+qE0 +pE1 ,E1 =1+qE0 , получаем
E[T]=E0=1+pp2. \mathbb{E}[T]=E_0=\frac{1+p}{p^2}.
E[T]=E0 =p21+p .
Заключение (кратко): основные подходы — первый шаг и рекуррентные соотношения, генераторная функция/аналитическое решение рекуррентов, и марковская модель с матричными степенями; все они дают одинаковое распределение, задаваемое рекуррентой an=qan−1+pqan−2a_n=q a_{n-1}+p q a_{n-2}an =qan−1 +pqan−2 и явной формулой через корни характеристического уравнения выше.