Спроектируйте модель SIR для распространения эпидемии на графе контактов: опишите уравнения или стохастическую симуляцию, объясните, как оценить параметры модели по наблюдаемым данным, какие методы чувствительности и валидации использовать, и как учитывать неоднородности популяции и вмешательства (вакцинация, локдауны)
Предыдущий
вопрос Следующий
вопрос

Question

Спроектируйте модель SIR для распространения эпидемии на графе контактов: опишите уравнения или стохастическую симуляцию, объясните, как оценить параметры модели по наблюдаемым данным, какие методы чувствительности и валидации использовать, и как учитывать неоднородности популяции и вмешательства (вакцинация, локдауны)
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

Спроектируйте модель...

eva

27 Окт в 05:41

5 +5

0

Helper · Answer 1

Краткая формулировка модели, способы симуляции, оценивания, валидации и учёта неоднородностей/вмешательств.
1) Постановка на графе
- Граф контактов

G = (V, E)

, матрица смежности

A=(A_{ij})

(взвешенная или 0/1). Для каждого узла

i

состояния

S, I, R

(числа или вероятности).
- Узловой (NIMFA) детерминированный приближённый ODE для долей/вероятностей

S_i(t),I_i(t),R_i(t)

:

\frac{dS_i}{dt} = -\beta S_i \sum_j A_{ij} I_j,\qquad\frac{dI_i}{dt} = \beta S_i \sum_j A_{ij} I_j - \gamma I_i,\qquad\frac{dR_i}{dt} = \gamma I_i.

(Здесь

S_i+I_i+R_i=1

если это вероятности.)
2) Стохастическая модель (точная CTMC на графе)
- Правила: для любого инфицированного узла

j

и соседнего восприимчивого

i

событие заражения

Si→IiS_i\to I_i

происходит с интенсивностью

βAij\beta A_{ij}

; восстановление

Ii→RiI_i\to R_i

с интенсивностью

γ\gamma

.
- Интенсивность заражения восприимчивого

i

в момент

t

:

\lambda_i(t)=\beta\sum_j A_{ij}\mathbf{1}_{\{j\ \text{инфекц. в }t\}}.

- Симуляция: алгоритм Гиллеспи / реакционно-сетевой SSA:
1. Вычислить все текущие интенсивности (вызовы заражения и восстановления).
2. Сгенерировать время до следующего события эксп(

∑intens\sum \text{intens}

).
3. Выбрать тип/узел события с вероятностью пропорционально интенсивности; обновить состояния и интенсивности; повторять.
3) Оценивание параметров (

β,γ\beta,\gamma

) по наблюдениям
- Полные наблюдения (времена заражения/выздоровления для узлов): максимальное правдоподобие. Общая форма правдоподобия для CTMC:

L(\beta,\gamma)=\prod_{k\in\text{инф. события}}\lambda_{i_k}(t_k)\,\exp\Big(-\int_0^T\sum_{i\in S(t)}\lambda_i(t)\,dt\Big)\times\prod_{r\in\text{восст.}} \gamma \exp(-\gamma \Delta t_r).

Максимизировать по параметрам или брать байесовскую апостериорную оценку.
- Частичные/агрегированные данные (дневные случаи, неполное тестирование): методы частичной информации
- Частичная правдоподобная оптимизация с восстановлением скрытых траекторий (EM, data augmentation MCMC).
- Частично наблюдаемые фильтры (particle filter / Sequential Monte Carlo) для оценивания и фильтрации параметров.
- Approximate Bayesian Computation (ABC) при невозможности вычислить правдоподобие.
- Учёт недоучёта/задержек: ввести параметр отчётности

ρ\rho

(вероятность, что событие зафиксировано), моделировать задержки отчетов как распределение времени наблюдения.
4) Чувствительность и идентифицируемость
- Локальная чувствительность: численные производные/градиенты целевой метрики

y(θ)y(\theta)

по параметрам

θ\theta

(например, конечный размер эпидемии, peak time):

∂y/∂θ\partial y/\partial\theta

.
- Профильное правдоподобие для выявления идентифицируемости (фиксировать один параметр, оптимизировать остальные).
- Глобальная чувствительность: Sobol, Morris — варьировать параметры в пределах априорных интервалов и смотреть вклад в дисперсию выходов.
- Анализ «sloppy parameters»: собственные значения матрицы Фишера (Fisher Information) — показатели, насколько параметры идентифицируемы.
- Валидация параметров: параметрическая бутстрэп, кросс-валидация по временам/регионам, posterior predictive checks (сравнить распределения симуляций с данными).
5) Валидация модели
- Разделение данных: калибровка на тренировочном интервале, тестирование прогноза на отложенном периоде.
- Posterior predictive checks: моделировать траектории с полученным распределением параметров и сравнивать с наблюдаемыми статистиками (накопленные случаи, пиковые значения, временные профили).
- ROC/precision для предсказания отдельных узлов (если есть лейблы заражений по узлам).
- Сравнение альтернативных моделей (AIC, BIC, WAIC, LOO-CV для байесовских моделей).
6) Учёт неоднородностей
- Пер-ребро и пер-узел трансмиссивности: ввести веса

βij\beta_{ij}

или узловые коэффициенты

βi\beta_i

, тогда интенсивность заражения

\lambda_i(t)=\sum_j \beta_{ij} A_{ij}\mathbf{1}_{\{j\ \text{инфекц.}\}}.

- Групповая структура / возраст: разбить на подпопуляции

a, b

и использовать контактную матрицу

C_{ab}

; агрегированные ODE:

\frac{dI_a}{dt}=\sum_b \beta C_{ab} S_a \frac{I_b}{N_b}-\gamma I_a.

- Вариабельность восприимчивости/вирусовыделения: вводить распределения

βi∼\beta_i\sim

(например, гамма) или стохастические весы; учитывать супершреддеров.
- Ассимптоматические/латентные стадии: добавить компартмент(ы)

E

(exposed),

A

(асимп.) с отдельными параметрами перехода и инфективности.
7) Моделирование вмешательств
- Вакцинация:
- Снижение доли восприимчивых: для вакцинированного узла

i

снизить

Si→(1−ei)SiS_i\to(1-e_i)S_i

или удалить узел (стерильная иммунность).
- Снижение передачи: уменьшить

βij→(1−eijtrans)βij\beta_{ij}\to(1-e^{\text{trans}}_{ij})\beta_{ij}

.
- Стратегии: случайная, таргетированная по степени (удаление/вакцинация узлов с максимальной степенью

k

), по центральности.
- Локдауны / сокращение контактов:
- Временное изменение весов/матрицы:

A_{ij}(t)=c(t)A_{ij}

или для подгрупп

c_{ab}(t)

.
- Удаление/реорганизация краёв между кластерами, временное снижение степени.
- Тестирование и изоляция: введение быстрого удаления инфицированных (увеличение

γ\gamma

для выявленных) или переводом в отдельный компартмент с нулевой инфективностью.
- Комбинации и time‑dependent параметры: модель с

β(t)\beta(t)

,

γ(t)\gamma(t)

,

A (t)

.
8) Практические рекомендации
- Для больших сетей (миллионы узлов): использовать NIMFA/парные аппроксимации или агрегацию по классам; для важной локальной динамики — стохастические симуляции на подграфах.
- Для частичных данных: предпочтительны particle MCMC / SMC или ABC; если есть много данных и сеть неизвестна — оценивать эффективную контактную матрицу из мобильности/опросов.
- Проверяйте идентифицируемость перед интерпретацией параметров, проводите глобальную чувствительность и posterior predictive validation.
Если надо, могу привести компактный псевдокод для Gillespie на графе или пример правдоподобия/EM для частичных наблюдений.

Другие вопросы eva

Другие вопросы
eva