Формулировка задачи моделирования: необходимо смоделировать распространение инфекции в небольшой популяции с учетом контактов, выздоровления и иммунитета. Опишите возможные математические модели (дискретные и непрерывные), укажите ключевые предположения и обсудите, какие данные и критерии проверки адекватности модели критичны.
Кратко — возможные подходы, ключевые допущения, нужные данные и критерии адекватности.
Модели (с указанием формул и ключевых предположений)
Детерминированные компартментные модели (ODE). Подход годится при достаточно большой популяции и однородном смешивании.
SIR: [ \frac{dS}{dt}=-\beta\frac{SI}{N},\quad \frac{dI}{dt}=\beta\frac{SI}{N}-\gamma I,\quad \frac{dR}{dt}=\gamma I. ] Допущения: однородные контакты, постоянные параметры передачи (\beta) и выздоровления (\gamma), иммунитет постоянен (перемещение в (R) навсегда).
SEIR (если есть латентный период): [ \frac{dS}{dt}=-\beta\frac{SI}{N},\quad \frac{dE}{dt}=\beta\frac{SI}{N}-\sigma E,\quad \frac{dI}{dt}=\sigma E-\gamma I,\quad \frac{dR}{dt}=\gamma I. ] Допущения: экспонированные неконтагиозны в (E), фиксированная скорость выхода (\sigma).
Важная характеристика: базовое репродукционное число [ R_0=\frac{\beta}{\gamma}. ]
Сточастические компартментные модели (CTMC, непрерывное время) — для малых популяций учитывают флуктуации.
Переходы с интенсивностями: [ (S,I)\to(S-1,I+1)\ \text{с частотой}\ \beta\frac{SI}{N},\quad (S,I)\to(S,I-1)\ \text{с частотой}\ \gamma I. ] Реализуют алгоритм Gillespie. Допущения: как в детерминированной, но случайность учтена.
Дискретно-временные цепи Маркова / цепь-биномиальная (подход для серийных контактов):
Вероятность того, что восприимчивый избежит заражения в шаге при (I_t) инфицированных и пер-контакт вероятности (p): [ P(\text{избежал})=(1-p)^{k},\quad\text{или при массовом контакте }P(\text{заражен})=1-(1-p)^{I_t}, ] где (k) — число контактов с инфицированными. Допущения: дискретные временные шаги, фиксированные p и число контактов.
Модели на сети и агент-ориентированные (ABM). Для малых популяций предпочтительны: каждый агент имеет состояние (S,I,R), контакты заданы графом (A) или расписанием.
Передача по ребру ((i,j)) с вероятностью (\tau) за контакт; возможны временные сети, возрастная гетерогенность, индивидуальные времена инфективности. Допущения минимальны — можно задать любые правила контакта и иммунитета.
Ветвящиеся процессы (для ранней фазы / малых вспышек). Используются для оценки шансов на вымирание очага. Если количество инфицированных невелико, распространение аппроксимируется ветвящимся процессом с средним потомством (R_0).
Ключевые предположения, которые нужно явно фиксировать
Тип смешивания: однородное vs гетерогенное (сеть, матрица контактов).Закрытая популяция vs демографические потоки (рождения/смерти/вход-выход).Постоянство/временная зависимость параметров ((\beta,\gamma,\sigma)).Характер иммунитета: перманентный, временный (иммунитет убывает со скоростью (\omega)) или частичный. Для убывающего иммунитета добавить переход (R\to S) с интенсивностью (\omega).Наличие латентного периода, асимптомных носителей, неоднородности по возрасту/поведению.Наблюдаемость: учитываются ли бессимптомные случаи и тестирование (подчёт только диагностированных).
Необходимые данные для калибровки и проверки
Демография: точный размер популяции (N), состав по возрасту/группам.Временной ряд наблюдаемых случаев (инцидентность) по датам и, если возможно, по симптоматике.Данные о контактах: контактная матрица или сеть, распределение числа контактов, расписания контактов (особенно важно в малой популяции).Временные характеристики инфекции: длительность инкубации, длительность заразного периода (оценки (\sigma^{-1},\gamma^{-1})), доля бессимптомных.Серологические данные / серопреваленс для оценки иммунитета и финального размера эпидемии.Данные о тестировании/задержках/чувствительности тестов для корректной модели наблюдений.Для сетевых моделей — структура сети (матрица смежности), динамика связей.
Критерии проверки адекватности модели
Воспроизведение ключевых статистик: Временной ряд инцидентности: форма эпидемии, время пика, высота пика.Общая атакующая доля (final size) и распределение суммарных случаев.Распределение длительностей вспышек и вероятности вымирания.Статистические меры соответствия: RMSE / MAE между прогнозом и наблюдаемыми данными для инцидентности.Лог-вероятность/обычная функция правдоподобия (для стохастических моделей) и информационные критерии (AIC/BIC) при сравнении моделей.Байесовская проверка предсказательной достоверности: posterior predictive checks, покрытие доверительных интервалов.Сравнение распределений (KS-тест) для распределения размеров вспышек при стохастических реализациях.Адекватность по ключевым параметрам: Согласованность оцененного (R0) или (R{\text{eff}}(t)) с независимыми оценками.Идентифицируемость параметров: оценка чувствительности и корреляций в постериоре (плохоидентифицируемые параметры делают модель ненадёжной).Валидация на непривязанных данных: кросс-валидация по временным отрезкам или по подгруппам популяции.Оценка прогностической способности: прогнозы на несколько шагов вперёд и их совпадение с последующими наблюдениями.
Практические рекомендации
Для действительно малой популяции используйте стохастическую модель (CTMC или агент-ориентированную на сети), потому что детерминированная ODE может сильно недооценивать вероятность вымирания очага.Если известна сеть контактов — моделируйте на графе (структура контактов критична).Для калибровки в сложных стохастических моделях применяйте MCMC, particle filter или ABC; проверяйте покрытие и постериорные предиктивные распределения.Всегда выполняйте анализ чувствительности по ключевым параметрам (особенно (\beta,\gamma), доля бессимптомных, эффективность иммунитета).
Короткая итоговая подсказка: если цель — сценарное моделирование и оценка вероятности крупных вспышек в малой популяции, выбирайте агент-ориентированную или CTMC-модель с реалистичной сетью контактов и проводите ансамблевое имитационное моделирование; проверяйте модель по распределению размеров вспышек, времени до вымирания и временным рядам инцидентности.
Кратко — возможные подходы, ключевые допущения, нужные данные и критерии адекватности.
Модели (с указанием формул и ключевых предположений)
Детерминированные компартментные модели (ODE). Подход годится при достаточно большой популяции и однородном смешивании.
SIR:
[
\frac{dS}{dt}=-\beta\frac{SI}{N},\quad
\frac{dI}{dt}=\beta\frac{SI}{N}-\gamma I,\quad
\frac{dR}{dt}=\gamma I.
]
Допущения: однородные контакты, постоянные параметры передачи (\beta) и выздоровления (\gamma), иммунитет постоянен (перемещение в (R) навсегда).
SEIR (если есть латентный период):
[
\frac{dS}{dt}=-\beta\frac{SI}{N},\quad
\frac{dE}{dt}=\beta\frac{SI}{N}-\sigma E,\quad
\frac{dI}{dt}=\sigma E-\gamma I,\quad
\frac{dR}{dt}=\gamma I.
]
Допущения: экспонированные неконтагиозны в (E), фиксированная скорость выхода (\sigma).
Важная характеристика: базовое репродукционное число
[
R_0=\frac{\beta}{\gamma}.
]
Сточастические компартментные модели (CTMC, непрерывное время) — для малых популяций учитывают флуктуации.
Переходы с интенсивностями:[
(S,I)\to(S-1,I+1)\ \text{с частотой}\ \beta\frac{SI}{N},\quad
(S,I)\to(S,I-1)\ \text{с частотой}\ \gamma I.
]
Реализуют алгоритм Gillespie. Допущения: как в детерминированной, но случайность учтена.
Дискретно-временные цепи Маркова / цепь-биномиальная (подход для серийных контактов):
Вероятность того, что восприимчивый избежит заражения в шаге при (I_t) инфицированных и пер-контакт вероятности (p):[
P(\text{избежал})=(1-p)^{k},\quad\text{или при массовом контакте }P(\text{заражен})=1-(1-p)^{I_t},
]
где (k) — число контактов с инфицированными. Допущения: дискретные временные шаги, фиксированные p и число контактов.
Модели на сети и агент-ориентированные (ABM). Для малых популяций предпочтительны: каждый агент имеет состояние (S,I,R), контакты заданы графом (A) или расписанием.
Передача по ребру ((i,j)) с вероятностью (\tau) за контакт; возможны временные сети, возрастная гетерогенность, индивидуальные времена инфективности. Допущения минимальны — можно задать любые правила контакта и иммунитета.Ветвящиеся процессы (для ранней фазы / малых вспышек). Используются для оценки шансов на вымирание очага. Если количество инфицированных невелико, распространение аппроксимируется ветвящимся процессом с средним потомством (R_0).
Ключевые предположения, которые нужно явно фиксировать
Тип смешивания: однородное vs гетерогенное (сеть, матрица контактов).Закрытая популяция vs демографические потоки (рождения/смерти/вход-выход).Постоянство/временная зависимость параметров ((\beta,\gamma,\sigma)).Характер иммунитета: перманентный, временный (иммунитет убывает со скоростью (\omega)) или частичный.Для убывающего иммунитета добавить переход (R\to S) с интенсивностью (\omega).Наличие латентного периода, асимптомных носителей, неоднородности по возрасту/поведению.Наблюдаемость: учитываются ли бессимптомные случаи и тестирование (подчёт только диагностированных).
Необходимые данные для калибровки и проверки
Демография: точный размер популяции (N), состав по возрасту/группам.Временной ряд наблюдаемых случаев (инцидентность) по датам и, если возможно, по симптоматике.Данные о контактах: контактная матрица или сеть, распределение числа контактов, расписания контактов (особенно важно в малой популяции).Временные характеристики инфекции: длительность инкубации, длительность заразного периода (оценки (\sigma^{-1},\gamma^{-1})), доля бессимптомных.Серологические данные / серопреваленс для оценки иммунитета и финального размера эпидемии.Данные о тестировании/задержках/чувствительности тестов для корректной модели наблюдений.Для сетевых моделей — структура сети (матрица смежности), динамика связей.Критерии проверки адекватности модели
Воспроизведение ключевых статистик:Временной ряд инцидентности: форма эпидемии, время пика, высота пика.Общая атакующая доля (final size) и распределение суммарных случаев.Распределение длительностей вспышек и вероятности вымирания.Статистические меры соответствия:
RMSE / MAE между прогнозом и наблюдаемыми данными для инцидентности.Лог-вероятность/обычная функция правдоподобия (для стохастических моделей) и информационные критерии (AIC/BIC) при сравнении моделей.Байесовская проверка предсказательной достоверности: posterior predictive checks, покрытие доверительных интервалов.Сравнение распределений (KS-тест) для распределения размеров вспышек при стохастических реализациях.Адекватность по ключевым параметрам:
Согласованность оцененного (R0) или (R{\text{eff}}(t)) с независимыми оценками.Идентифицируемость параметров: оценка чувствительности и корреляций в постериоре (плохоидентифицируемые параметры делают модель ненадёжной).Валидация на непривязанных данных: кросс-валидация по временным отрезкам или по подгруппам популяции.Оценка прогностической способности: прогнозы на несколько шагов вперёд и их совпадение с последующими наблюдениями.
Практические рекомендации
Для действительно малой популяции используйте стохастическую модель (CTMC или агент-ориентированную на сети), потому что детерминированная ODE может сильно недооценивать вероятность вымирания очага.Если известна сеть контактов — моделируйте на графе (структура контактов критична).Для калибровки в сложных стохастических моделях применяйте MCMC, particle filter или ABC; проверяйте покрытие и постериорные предиктивные распределения.Всегда выполняйте анализ чувствительности по ключевым параметрам (особенно (\beta,\gamma), доля бессимптомных, эффективность иммунитета).Короткая итоговая подсказка: если цель — сценарное моделирование и оценка вероятности крупных вспышек в малой популяции, выбирайте агент-ориентированную или CTMC-модель с реалистичной сетью контактов и проводите ансамблевое имитационное моделирование; проверяйте модель по распределению размеров вспышек, времени до вымирания и временным рядам инцидентности.