В задаче о Марковской цепи дана 2x2 стохастическая матрица P с неизвестными параметрами; сформулируйте задачу идентификации стационарного распределения, оцените устойчивость состояния, предложите критерии эргодичности и обсудите, какие наблюдения и дополнительные условия на параметры нужны, чтобы система имела единственную предельную зависимость от начального распределения.
Формулировка (параметризация). Пусть переходная матрица 2×2 задаётся параметрами a=P12a=P_{12}a=P12, b=P21b=P_{21}b=P21: P=(1−aab1−b),a,b∈[0,1].
P=\begin{pmatrix}1-a & a\\[4pt] b & 1-b\end{pmatrix},\qquad a,b\in[0,1]. P=(1−aba1−b),a,b∈[0,1]. 1) Стационарное распределение (идентификация). - Стационарное векторное решение π=πP, ∑iπi=1\pi=\pi P,\ \sum_i\pi_i=1π=πP,∑iπi=1 даёт (при a+b>0a+b>0a+b>0) π1π2=ba,π=(ba+b, aa+b).
\frac{\pi_1}{\pi_2}=\frac{b}{a},\qquad \pi=\Big(\frac{b}{a+b},\;\frac{a}{a+b}\Big). π2π1=ab,π=(a+bb,a+ba).
- Специальные случаи: - a=b=0a=b=0a=b=0: P=IP=IP=I — любое распределение стационарно (невозможно идентифицировать по одному наблюдению). - a>0,b=0a>0,b=0a>0,b=0: стационарное π=(0,1)\pi=(0,1)π=(0,1) (абсорбирующее состояние 2). - a=0,b>0a=0,b>0a=0,b>0: стационарное π=(1,0)\pi=(1,0)π=(1,0) (абсорбирующее состояние 1). - a=b=1a=b=1a=b=1: π=(1/2,1/2)\pi=(1/2,1/2)π=(1/2,1/2) — уникальное стационарное, но нет сходимости для всех начальных (период 2). 2) Устойчивость состояния и скорость сходимости. - Собственные значения PPP: λ1=1, λ2=1−(a+b)\lambda_1=1,\ \lambda_2=1-(a+b)λ1=1,λ2=1−(a+b). - При модуле ∣λ2∣<1|\lambda_2|<1∣λ2∣<1 скорость сходимости к стационарному распределению геометрическая с фактором ∣1−(a+b)∣|1-(a+b)|∣1−(a+b)∣. Т. е. ∥Pn−1π∥=O(∣1−(a+b)∣n).
\|P^n-\mathbf{1}\pi\| = O\big(|1-(a+b)|^n\big). ∥Pn−1π∥=O(∣1−(a+b)∣n).
(Здесь 1π\mathbf{1}\pi1π — матрица с одинаковыми строками, равными π\piπ.) - Поведение при краевых значениях: - a+b→0a+b\to 0a+b→0⇒\Rightarrow⇒∣λ2∣→1|\lambda_2|\to1∣λ2∣→1 — очень медленная сходимость. - a+b→2a+b\to 2a+b→2⇒\Rightarrow⇒λ2→−1\lambda_2\to-1λ2→−1 — медленная, возможны сильные колебания (периодичность близкая к 2). 3) Критерии эргодичности (классические для цепи Маркова). - Цепь эргодична (то есть существует единственная инвариантная мера и πPn→π\pi P^n\to\piπPn→π для любого начального распределения) тогда и только тогда, когда существует единственный закрытый класс, достижимый из любого состояния, и этот класс апериодичен. - В терминах a,ba,ba,b для 2 состояний: - если a>0a>0a>0 и b>0b>0b>0 (цепь неприводима), то апериодичность нарушается только при a=b=1a=b=1a=b=1. Следовательно эргодична при a>0, b>0, и не (a=b=1).
a>0,\ b>0,\ \text{и не }(a=b=1). a>0,b>0,ине(a=b=1).
- если ровно один из a,ba,ba,b равен 0, а другой положителен, то есть один поглощающий класс, достижимый из обеих точек, предельное распределение существует и равно соответствующему поглощению ((0,1)(0,1)(0,1) или (1,0)(1,0)(1,0)). - если a=b=0a=b=0a=b=0 — нет сходимости (зависит от начального распределения). если a=b=1a=b=1a=b=1 — период 2, нет сходимости для общего начального распределения. 4) Идентифицируемость из наблюдений и какие наблюдения нужны. - Наблюдение полной последовательности состояний (временной ряд) даёт идентификацию обоих параметров через частоты переходов: a^=#(1→2)# посещений 1,b^=#(2→1)# посещений 2.
\hat a=\frac{\#(1\to2)}{\#\text{ посещений }1},\qquad \hat b=\frac{\#(2\to1)}{\#\text{ посещений }2}. a^=#посещений1#(1→2),b^=#посещений2#(2→1).
- Наблюдение только предельных частот (эмпирическое распределение π^\hat\piπ^) даёт лишь соотношение π1/π2=b/a\pi_1/\pi_2=b/aπ1/π2=b/a — можно оценить только отношение b:ab:ab:a, но не отдельно a,ba,ba,b. - Если доступны наблюдения переходов с задержками (пары, подпоследовательности), то параметры идентифицируются быстрее и устойчивее. - Дополнительные условия, облегчающие идентификацию: положительность частот переходов (чтобы оценки были ненулевыми), непрерывное наблюдение в достаточном объёме времени (чтобы частоты сходились). 5) Итог — когда система имеет единственную предельную зависимость от начального распределения: - Достаточно и практически необходимое условие для 2×2: либо 1. a>0a>0a>0 и b>0b>0b>0 и не оба равны 1 (тогда цепь неприводима и апериодична) — классический случай эргодичности; либо 2. ровно один из a,ba,ba,b равен 0, другой положителен (существует единственный поглощающий класс достижимый из всех состояний) — предельное распределение существует и равно соответствующему одиночному поглощению. - Нежелательные случаи: a=b=0a=b=0a=b=0 (множество стационарных распределений, предельное зависит от начального) и a=b=1a=b=1a=b=1 (период 2 — нет сходимости). Если нужно, могу дать формулы оценок, дисперсий оценок a^,b^\hat a,\hat ba^,b^ и явную форму PnP^nPn через собственное разложение.
P=(1−aab1−b),a,b∈[0,1]. P=\begin{pmatrix}1-a & a\\[4pt] b & 1-b\end{pmatrix},\qquad a,b\in[0,1].
P=(1−ab a1−b ),a,b∈[0,1].
1) Стационарное распределение (идентификация).
- Стационарное векторное решение π=πP, ∑iπi=1\pi=\pi P,\ \sum_i\pi_i=1π=πP, ∑i πi =1 даёт (при a+b>0a+b>0a+b>0)
π1π2=ba,π=(ba+b, aa+b). \frac{\pi_1}{\pi_2}=\frac{b}{a},\qquad
\pi=\Big(\frac{b}{a+b},\;\frac{a}{a+b}\Big).
π2 π1 =ab ,π=(a+bb ,a+ba ). - Специальные случаи:
- a=b=0a=b=0a=b=0: P=IP=IP=I — любое распределение стационарно (невозможно идентифицировать по одному наблюдению).
- a>0,b=0a>0,b=0a>0,b=0: стационарное π=(0,1)\pi=(0,1)π=(0,1) (абсорбирующее состояние 2).
- a=0,b>0a=0,b>0a=0,b>0: стационарное π=(1,0)\pi=(1,0)π=(1,0) (абсорбирующее состояние 1).
- a=b=1a=b=1a=b=1: π=(1/2,1/2)\pi=(1/2,1/2)π=(1/2,1/2) — уникальное стационарное, но нет сходимости для всех начальных (период 2).
2) Устойчивость состояния и скорость сходимости.
- Собственные значения PPP: λ1=1, λ2=1−(a+b)\lambda_1=1,\ \lambda_2=1-(a+b)λ1 =1, λ2 =1−(a+b).
- При модуле ∣λ2∣<1|\lambda_2|<1∣λ2 ∣<1 скорость сходимости к стационарному распределению геометрическая с фактором ∣1−(a+b)∣|1-(a+b)|∣1−(a+b)∣. Т. е.
∥Pn−1π∥=O(∣1−(a+b)∣n). \|P^n-\mathbf{1}\pi\| = O\big(|1-(a+b)|^n\big).
∥Pn−1π∥=O(∣1−(a+b)∣n). (Здесь 1π\mathbf{1}\pi1π — матрица с одинаковыми строками, равными π\piπ.)
- Поведение при краевых значениях:
- a+b→0a+b\to 0a+b→0 ⇒\Rightarrow⇒ ∣λ2∣→1|\lambda_2|\to1∣λ2 ∣→1 — очень медленная сходимость.
- a+b→2a+b\to 2a+b→2 ⇒\Rightarrow⇒ λ2→−1\lambda_2\to-1λ2 →−1 — медленная, возможны сильные колебания (периодичность близкая к 2).
3) Критерии эргодичности (классические для цепи Маркова).
- Цепь эргодична (то есть существует единственная инвариантная мера и πPn→π\pi P^n\to\piπPn→π для любого начального распределения) тогда и только тогда, когда существует единственный закрытый класс, достижимый из любого состояния, и этот класс апериодичен.
- В терминах a,ba,ba,b для 2 состояний:
- если a>0a>0a>0 и b>0b>0b>0 (цепь неприводима), то апериодичность нарушается только при a=b=1a=b=1a=b=1. Следовательно эргодична при
a>0, b>0, и не (a=b=1). a>0,\ b>0,\ \text{и не }(a=b=1).
a>0, b>0, и не (a=b=1). - если ровно один из a,ba,ba,b равен 0, а другой положителен, то есть один поглощающий класс, достижимый из обеих точек, предельное распределение существует и равно соответствующему поглощению ((0,1)(0,1)(0,1) или (1,0)(1,0)(1,0)).
- если a=b=0a=b=0a=b=0 — нет сходимости (зависит от начального распределения). если a=b=1a=b=1a=b=1 — период 2, нет сходимости для общего начального распределения.
4) Идентифицируемость из наблюдений и какие наблюдения нужны.
- Наблюдение полной последовательности состояний (временной ряд) даёт идентификацию обоих параметров через частоты переходов:
a^=#(1→2)# посещений 1,b^=#(2→1)# посещений 2. \hat a=\frac{\#(1\to2)}{\#\text{ посещений }1},\qquad
\hat b=\frac{\#(2\to1)}{\#\text{ посещений }2}.
a^=# посещений 1#(1→2) ,b^=# посещений 2#(2→1) . - Наблюдение только предельных частот (эмпирическое распределение π^\hat\piπ^) даёт лишь соотношение π1/π2=b/a\pi_1/\pi_2=b/aπ1 /π2 =b/a — можно оценить только отношение b:ab:ab:a, но не отдельно a,ba,ba,b.
- Если доступны наблюдения переходов с задержками (пары, подпоследовательности), то параметры идентифицируются быстрее и устойчивее.
- Дополнительные условия, облегчающие идентификацию: положительность частот переходов (чтобы оценки были ненулевыми), непрерывное наблюдение в достаточном объёме времени (чтобы частоты сходились).
5) Итог — когда система имеет единственную предельную зависимость от начального распределения:
- Достаточно и практически необходимое условие для 2×2: либо
1. a>0a>0a>0 и b>0b>0b>0 и не оба равны 1 (тогда цепь неприводима и апериодична) — классический случай эргодичности; либо
2. ровно один из a,ba,ba,b равен 0, другой положителен (существует единственный поглощающий класс достижимый из всех состояний) — предельное распределение существует и равно соответствующему одиночному поглощению.
- Нежелательные случаи: a=b=0a=b=0a=b=0 (множество стационарных распределений, предельное зависит от начального) и a=b=1a=b=1a=b=1 (период 2 — нет сходимости).
Если нужно, могу дать формулы оценок, дисперсий оценок a^,b^\hat a,\hat ba^,b^ и явную форму PnP^nPn через собственное разложение.