Дана марковская цепь с конечным числом состояний и заданной матрицей перехода; опишите критерии эргодичности, предложите метод нахождения стационарного распределения и обсудите случаи неэргодичности
Кратко и по делу. 1) Критерии эргодичности (конечная цепь): - Цепь эргодична ⇔ она неразложима (irreducible) и апериодична (aperiodic). - Неразложима: для любых состояний i,ji,ji,j существует nnn такое, что (Pn)ij>0(P^n)_{ij}>0(Pn)ij>0 (в графе с вершинами — состояния и дугами i→ji\to ji→j при pij>0p_{ij}>0pij>0 граф сильносвязен). - Период состояния iii определяется как d(i)=gcd{n≥1: (Pn)ii>0}d(i)=\gcd\{n\ge1:\ (P^n)_{ii}>0\}d(i)=gcd{n≥1:(Pn)ii>0}. В одной коммуницирующей компоненте все состояния имеют одинаковый период. Апериодичность: d(i)=1d(i)=1d(i)=1. - Для конечной цепи неразложимость автоматически даёт положительную возвратность, поэтому эргодичность = неразложимость + апериодичность. - Эквивалентная матричная формулировка: матрица PPP примитивна (существует nnn с Pn>0P^n>0Pn>0). 2) Нахождение стационарного распределения: - Стационарное распределение π\piπ решает π=πP,∑iπi=1,πi≥0.
\pi=\pi P,\qquad \sum_i\pi_i=1,\qquad \pi_i\ge0. π=πP,i∑πi=1,πi≥0.
- Методы: - Прямое решение линейной системы: решить π(I−P)=0\pi(I-P)=0π(I−P)=0 с нормировкой ∑iπi=1\sum_i\pi_i=1∑iπi=1. Практически заменяют одну уравнение на нормировку, затем используют Гаусс или LU. - Собственный вектор: найти левые собственные векторы vP=vvP=vvP=v для собств. значения 111 и нормировать vvv на сумму 1. - Итерационные методы: степенной метод (начиная с вектора распределения μ(0)\mu^{(0)}μ(0), итерация μ(n+1)=μ(n)P\mu^{(n+1)}=\mu^{(n)}Pμ(n+1)=μ(n)P) — при эргодичности μ(n)→π\mu^{(n)}\to\piμ(n)→π. Для больших матриц — методы типа Arnoldi, GMRES и т.д. - Для обратимых (дetailed balance) цепей: использовать равновесие пары πipij=πjpji\pi_i p_{ij}=\pi_j p_{ji}πipij=πjpji и вычислить π\piπ через отношения (удобно для графов типа сети). - Числовые замечания: для вырожденной системы (матрица I−PI-PI−P сингулярна) заменить одно строковое уравнение условием нормировки. 3) Случаи неэргодичности и их последствия: - Случай 1 — редуцируемая цепь (разложима): - Существуют замкнутые (absorbing) классы коммуницирования и транзитные состояния. Ограничение PPP на замкнутый класс даёт собственное стационарное распределение, поддержанное внутри этого класса. - Стационарные вероятности цепи в целом: любые выпуклые комбинации стационарных распределений по замкнутым классам (массы на транзитных состояниях в стационарном распределении равны 0). Поэтому стационарное распределение неединственно, если есть >1 замкнутых класса. - Динамика: масса из транзитных классов в пределе переходит в замкнутые классы; предельное распределение зависит от начальной точки (будет концентрироваться в том замкнутом классе, в который попадёт). - Случай 2 — неапериодична отсутствует (цепь разложима апериодична? см. выше). Конкретно, если цепь неразложима но периодична (период d>1d>1d>1): - Стационарное распределение π\piπ всё ещё существует и единственно (для конечной неразложимой цепи), то есть решается π=πP\pi=\pi Pπ=πP. - Однако PijnP^n_{ij}Pijn не сходятся при n→∞n\to\inftyn→∞ (они осциллируют с периодом ddd). Зато усреднённые распределения сходятся: 1n∑k=1nPijk→πj\frac{1}{n}\sum_{k=1}^n P^k_{ij}\to\pi_jn1∑k=1nPijk→πj. - Простой пример: двухсостоянийое чередование P=(0110)P=\begin{pmatrix}0&1\\1&0\end{pmatrix}P=(0110) — период 2, стационарное распределение π=(1/2,1/2)\pi=(1/2,1/2)π=(1/2,1/2), но распределение по шагам чередуется. - Итог по предельному поведению: - Если цепь эргодична (неразложима+апериодична): для любого начального состояния iiilimn→∞(Pn)ij=πj\lim_{n\to\infty} (P^n)_{ij}=\pi_jlimn→∞(Pn)ij=πj. - Если разложима: предельное распределение зависит от начального состояния и сосредоточено в замкнутых классах; общий набор стационарных распределений — выпуклая оболочка стационарных распределений замкнутых классов. - Если периодична (но неразложима): есть единственное π\piπ, но точечная сходимость PnP^nPn отсутствует; сходятся лишь усреднения. 4) Практическая последовательность проверок при заданной матрице PPP: - Построить ориентированный граф GGG с ребром i→ji\to ji→j если pij>0p_{ij}>0pij>0. Найти сильные компоненты связности (SCC). - Если одна SCC — неразложима. Иначе найти замкнутые SCC (без исходящих ребер) — они дают возможные предельные классы. - Для неразложимой компоненты вычислить период через d(i)=gcd{n: (Pn)ii>0}d(i)=\gcd\{n:\ (P^n)_{ii}>0\}d(i)=gcd{n:(Pn)ii>0} или проверить наличие самопереходов pii>0p_{ii}>0pii>0 (самопереход даёт апериодичность). - Решить π=πP\pi=\pi Pπ=πP с нормировкой; при разложимости решать для каждой замкнутой компоненты её подматрицу. Если нужно, могу привести краткий алгоритм на псевдокоде или пример расчёта для конкретной матрицы.
1) Критерии эргодичности (конечная цепь):
- Цепь эргодична ⇔ она неразложима (irreducible) и апериодична (aperiodic).
- Неразложима: для любых состояний i,ji,ji,j существует nnn такое, что (Pn)ij>0(P^n)_{ij}>0(Pn)ij >0 (в графе с вершинами — состояния и дугами i→ji\to ji→j при pij>0p_{ij}>0pij >0 граф сильносвязен).
- Период состояния iii определяется как d(i)=gcd{n≥1: (Pn)ii>0}d(i)=\gcd\{n\ge1:\ (P^n)_{ii}>0\}d(i)=gcd{n≥1: (Pn)ii >0}. В одной коммуницирующей компоненте все состояния имеют одинаковый период. Апериодичность: d(i)=1d(i)=1d(i)=1.
- Для конечной цепи неразложимость автоматически даёт положительную возвратность, поэтому эргодичность = неразложимость + апериодичность.
- Эквивалентная матричная формулировка: матрица PPP примитивна (существует nnn с Pn>0P^n>0Pn>0).
2) Нахождение стационарного распределения:
- Стационарное распределение π\piπ решает
π=πP,∑iπi=1,πi≥0. \pi=\pi P,\qquad \sum_i\pi_i=1,\qquad \pi_i\ge0.
π=πP,i∑ πi =1,πi ≥0. - Методы:
- Прямое решение линейной системы: решить π(I−P)=0\pi(I-P)=0π(I−P)=0 с нормировкой ∑iπi=1\sum_i\pi_i=1∑i πi =1. Практически заменяют одну уравнение на нормировку, затем используют Гаусс или LU.
- Собственный вектор: найти левые собственные векторы vP=vvP=vvP=v для собств. значения 111 и нормировать vvv на сумму 1.
- Итерационные методы: степенной метод (начиная с вектора распределения μ(0)\mu^{(0)}μ(0), итерация μ(n+1)=μ(n)P\mu^{(n+1)}=\mu^{(n)}Pμ(n+1)=μ(n)P) — при эргодичности μ(n)→π\mu^{(n)}\to\piμ(n)→π. Для больших матриц — методы типа Arnoldi, GMRES и т.д.
- Для обратимых (дetailed balance) цепей: использовать равновесие пары πipij=πjpji\pi_i p_{ij}=\pi_j p_{ji}πi pij =πj pji и вычислить π\piπ через отношения (удобно для графов типа сети).
- Числовые замечания: для вырожденной системы (матрица I−PI-PI−P сингулярна) заменить одно строковое уравнение условием нормировки.
3) Случаи неэргодичности и их последствия:
- Случай 1 — редуцируемая цепь (разложима):
- Существуют замкнутые (absorbing) классы коммуницирования и транзитные состояния. Ограничение PPP на замкнутый класс даёт собственное стационарное распределение, поддержанное внутри этого класса.
- Стационарные вероятности цепи в целом: любые выпуклые комбинации стационарных распределений по замкнутым классам (массы на транзитных состояниях в стационарном распределении равны 0). Поэтому стационарное распределение неединственно, если есть >1 замкнутых класса.
- Динамика: масса из транзитных классов в пределе переходит в замкнутые классы; предельное распределение зависит от начальной точки (будет концентрироваться в том замкнутом классе, в который попадёт).
- Случай 2 — неапериодична отсутствует (цепь разложима апериодична? см. выше). Конкретно, если цепь неразложима но периодична (период d>1d>1d>1):
- Стационарное распределение π\piπ всё ещё существует и единственно (для конечной неразложимой цепи), то есть решается π=πP\pi=\pi Pπ=πP.
- Однако PijnP^n_{ij}Pijn не сходятся при n→∞n\to\inftyn→∞ (они осциллируют с периодом ddd). Зато усреднённые распределения сходятся: 1n∑k=1nPijk→πj\frac{1}{n}\sum_{k=1}^n P^k_{ij}\to\pi_jn1 ∑k=1n Pijk →πj .
- Простой пример: двухсостоянийое чередование P=(0110)P=\begin{pmatrix}0&1\\1&0\end{pmatrix}P=(01 10 ) — период 2, стационарное распределение π=(1/2,1/2)\pi=(1/2,1/2)π=(1/2,1/2), но распределение по шагам чередуется.
- Итог по предельному поведению:
- Если цепь эргодична (неразложима+апериодична): для любого начального состояния iii limn→∞(Pn)ij=πj\lim_{n\to\infty} (P^n)_{ij}=\pi_jlimn→∞ (Pn)ij =πj .
- Если разложима: предельное распределение зависит от начального состояния и сосредоточено в замкнутых классах; общий набор стационарных распределений — выпуклая оболочка стационарных распределений замкнутых классов.
- Если периодична (но неразложима): есть единственное π\piπ, но точечная сходимость PnP^nPn отсутствует; сходятся лишь усреднения.
4) Практическая последовательность проверок при заданной матрице PPP:
- Построить ориентированный граф GGG с ребром i→ji\to ji→j если pij>0p_{ij}>0pij >0. Найти сильные компоненты связности (SCC).
- Если одна SCC — неразложима. Иначе найти замкнутые SCC (без исходящих ребер) — они дают возможные предельные классы.
- Для неразложимой компоненты вычислить период через d(i)=gcd{n: (Pn)ii>0}d(i)=\gcd\{n:\ (P^n)_{ii}>0\}d(i)=gcd{n: (Pn)ii >0} или проверить наличие самопереходов pii>0p_{ii}>0pii >0 (самопереход даёт апериодичность).
- Решить π=πP\pi=\pi Pπ=πP с нормировкой; при разложимости решать для каждой замкнутой компоненты её подматрицу.
Если нужно, могу привести краткий алгоритм на псевдокоде или пример расчёта для конкретной матрицы.