Спроектируйте модель симуляции распространения эпидемии в городе: сравните агентно‑ориентированный подход и систему дифференциальных уравнений, опишите набор входных данных, стохастические факторы, критерии валидации модели и способы оценки неопределённости результатов
Краткая проектная схема + сравнение и практические рекомендации.
1) Ключевые модели (формулы)
Базовый детерминированный SEIR: [ \frac{dS}{dt}=-\beta\frac{S I}{N},\quad \frac{dE}{dt}=\beta\frac{S I}{N}-\sigma E, ] [ \frac{dI}{dt}=\sigma E-\gamma I,\quad \frac{dR}{dt}=\gamma I. ] Базовое число размножения: (\mathcal{R}_0=\beta/\gamma).Стохастическая версия (гораздо чаще для малых популяций) реализуется через отдельные случайные события (Gillespie или дискретный шаг): вероятности переходов пропорциональны тем же скоростям.Агентно‑ориентированная модель (ABM) описывается правилами для агентов: состояние болезни (S, E, I, R), календарь переходов (инкубация, заразность), контактные события; инфицирование при контакте с вероятностью (p_{trans}) (может зависеть от длительности/масок/вентиляции).
2) Сравнение: агентно‑ориентированный vs дифференциальные уравнения
Точность/реализм: ABM: высокая детализация (домохозяйства, школы, рабочие места, транспорт, гетерогенность по возрасту/поведению), моделирует сетевые эффекты и суперраспространители.ODE/SEIR: агрегированное поведение, хорошо для быстрых сценариев и аналитических выводов.Вычислительная стоимость: ABM: высокая (много агентов, много прогонов для оценок неопределённости).ODE: низкая, быстрый массовый перебор параметров.Калибровка и интерпретируемость: ABM: сложнее калибровать (больше параметров), результаты менее тривиально интерпретируемы.ODE: проще калибровать (несколько параметров), прозрачные зависимости.Применимость: ABM: оценка локальных мер (закрытие школ, локальные локдауны, таргетированная вакцинация).ODE: оценка общих сценариев (R0, общая нагрузка, сроки пиков).
Рекомендация: использовать ODE/стохастическую метапопуляционную модель для быстрой оценки сценариев и ABM для детальной проверки ключевых политик; возможен гибрид (возрастно‑структурированная/многопопуляционная ODE с стохастикой).
3) Набор входных данных
Демография: численность, возрастная структура, состав домохозяйств.Контактные матрицы по контекстам (дом, работа, школа, прочие) и по возрастам.Мобильность/маршруты и плотность населения; карта POI (шопы, транспортные узлы).Эпидемиологические параметры: инкубационный период (\tau{inc}), период заразности (\tau{inf}) (соответственно (\sigma=1/\tau{inc},\gamma=1/\tau{inf})), базовая вероятность передачи/контактная скорость (\beta).Клинико‑эпидемиологические данные: время до госпитализации, доля симптоматических, IFR, доля бессимптомных.Наблюдаемые данные для калибровки/валидации: тесты/положительные, госпитализации, ICU, смерти, серопревалентность, подвижность (мобильные данные).Интервенции: даты и степень НПИ (маски, дистанция, закрытия), уровень тестирования, трассировка, вакцинация (темп, эффективность по исходам и по заразности).Параметры поведения: уровень соблюдения, сезонность, импорт случаев.
4) Стохастические факторы и неопределённости
Стохастика передачи при контакте (биномиальная/показательная): исходы заражения случайны.Вариабельность периодов (инкубация, заразность) — распределения (логнорм/гамма), не константы.Суперраспространение — распределение вторичных случаев с высокой дисперсией (негативное биномиальное с параметром (k)).Импорт/веса случайных всплесков (попадание случая извне).Изменчивость поведения населения во времени (случайные изменения соблюдения НПИ).Ошибки наблюдений: недоучтённость/задержки тестирования, систематические смещения в данных.Пространственные и сетевые эффекты (локальная гетерогенность). В ABM все эти факторы моделируются естественно; в ODE вводят стохастику через случайные флуктуации или многопопуляционные/стохастические дифференциальные уравнения.
5) Критерии валидации модели
Сопоставление с независимыми наблюдениями: Кривые случаев, госпитализаций, ICU, смертей по времени (RMSE, MAE).Серологические данные (общая атак‑рейт).Возрастная структура случаев и госпитализаций.Пространственное распространение (карты, локальные пики).Эпидемиологические метрики: Восстановление эффективного (R_t) и его доверительные интервалы.Вторичные показатели: вторичная атака в домохозяйствах, распределение интервала серийности.Статистические критерии: Ликели‑ход и байесовская подгонка (posterior predictive checks), CRPS для прогнозов, покрытие наблюдаемых точек доверительными интервалами.Hindcasting: калибровка на раннем периоде, проверка предсказаний на последующем периоде.Чувствительность к структурным предположениям: сравнить несколько реализаций модели (ABM vs ODE) на одних данных.
6) Оценка неопределённости результатов
Метод Монте‑Карло: множество прогонов с выборкой параметров из априорных распределений → эмпирические интервалы прогнозов (перцентили 5–95% и т. п.).Байесовский подход: MCMC/Particle MCMC/SMC для получения постериорных распределений параметров и прогнозов → доверительные/кредибельные интервалы.Квази‑создание ансамблей: разные реалистичные сценарии (варианты поведения, эффективности НПИ, импорт) — сценарный анализ.Глобальная чувствительность: Sobol‑индексы или FAST для определения влияния входных параметров на вариативность выходов.Локальная чувствительность: частные производные/градиенты или PRCC (partial rank correlation coefficients).Бутстрэппинг наблюдений и параметрическая бутстрэппинг для оценки погрешности из данных.Эмуляторы/метамодели (Gaussian Process) для ускорения UQ при дорогих ABM.Отчётность: показывать медиану + 50/95% интервалы, долю прогонов, когда ключевые события (пик, перегрузка ИВЛ) происходят.
7) Практический рабочий процесс (рекомендации)
Шаг 1: собрать и предобработать данные (демография, контакты, наблюдения).Шаг 2: сделать быстрый агрегированный SEIR для первичных оценок чувствительности и грубых сценариев.Шаг 3: калибровать на наблюдаемых данных (максимальное правдоподобие или байес).Шаг 4: построить ABM для детальной оценки ключевых интервенций; использовать результаты SEIR для априорных диапазонов параметров.Шаг 5: выполнить многозарядный UQ (MC, MCMC, сценарии), глобальную чувствительность.Шаг 6: валидация через hindcasting, сравнение с независимыми датасетами (серология, госпитализации).Шаг 7: подготовить отчёт с медианой, интервалами, чувствительностью и четким описанием ограничений модели.
8) Выходы модели (ключевые метрики для принятия решений)
Прогноз ежедневных случаев, госпитализаций, ИВЛ, смертей.Время и величина пика, суммарный атак‑рейт, нагрузка на систему здравоохранения.Эффект интервенций: снижение пиков/сдвиг пиков, число предотвращённых госпитализаций.Пространственное распределение риска и группы высокого риска.
Коротко о компромиссе: ODE — быстрый, прозрачный, хорош для сценариев и калибровки; ABM — дорогой по ресурсам, но необходим для оценки локальных мер и сетевых эффектов. Надёжность выводов достигается сочетанием: начать с ODE, затем детализировать критические сценарии в ABM и систематически оценивать неопределённость через ансамбли и байесовские методы.
Краткая проектная схема + сравнение и практические рекомендации.
1) Ключевые модели (формулы)
Базовый детерминированный SEIR:[
\frac{dS}{dt}=-\beta\frac{S I}{N},\quad
\frac{dE}{dt}=\beta\frac{S I}{N}-\sigma E,
]
[
\frac{dI}{dt}=\sigma E-\gamma I,\quad
\frac{dR}{dt}=\gamma I.
]
Базовое число размножения: (\mathcal{R}_0=\beta/\gamma).Стохастическая версия (гораздо чаще для малых популяций) реализуется через отдельные случайные события (Gillespie или дискретный шаг): вероятности переходов пропорциональны тем же скоростям.Агентно‑ориентированная модель (ABM) описывается правилами для агентов: состояние болезни (S, E, I, R), календарь переходов (инкубация, заразность), контактные события; инфицирование при контакте с вероятностью (p_{trans}) (может зависеть от длительности/масок/вентиляции).
2) Сравнение: агентно‑ориентированный vs дифференциальные уравнения
Точность/реализм:ABM: высокая детализация (домохозяйства, школы, рабочие места, транспорт, гетерогенность по возрасту/поведению), моделирует сетевые эффекты и суперраспространители.ODE/SEIR: агрегированное поведение, хорошо для быстрых сценариев и аналитических выводов.Вычислительная стоимость:
ABM: высокая (много агентов, много прогонов для оценок неопределённости).ODE: низкая, быстрый массовый перебор параметров.Калибровка и интерпретируемость:
ABM: сложнее калибровать (больше параметров), результаты менее тривиально интерпретируемы.ODE: проще калибровать (несколько параметров), прозрачные зависимости.Применимость:
ABM: оценка локальных мер (закрытие школ, локальные локдауны, таргетированная вакцинация).ODE: оценка общих сценариев (R0, общая нагрузка, сроки пиков).
Рекомендация: использовать ODE/стохастическую метапопуляционную модель для быстрой оценки сценариев и ABM для детальной проверки ключевых политик; возможен гибрид (возрастно‑структурированная/многопопуляционная ODE с стохастикой).
3) Набор входных данных
Демография: численность, возрастная структура, состав домохозяйств.Контактные матрицы по контекстам (дом, работа, школа, прочие) и по возрастам.Мобильность/маршруты и плотность населения; карта POI (шопы, транспортные узлы).Эпидемиологические параметры: инкубационный период (\tau{inc}), период заразности (\tau{inf}) (соответственно (\sigma=1/\tau{inc},\gamma=1/\tau{inf})), базовая вероятность передачи/контактная скорость (\beta).Клинико‑эпидемиологические данные: время до госпитализации, доля симптоматических, IFR, доля бессимптомных.Наблюдаемые данные для калибровки/валидации: тесты/положительные, госпитализации, ICU, смерти, серопревалентность, подвижность (мобильные данные).Интервенции: даты и степень НПИ (маски, дистанция, закрытия), уровень тестирования, трассировка, вакцинация (темп, эффективность по исходам и по заразности).Параметры поведения: уровень соблюдения, сезонность, импорт случаев.4) Стохастические факторы и неопределённости
Стохастика передачи при контакте (биномиальная/показательная): исходы заражения случайны.Вариабельность периодов (инкубация, заразность) — распределения (логнорм/гамма), не константы.Суперраспространение — распределение вторичных случаев с высокой дисперсией (негативное биномиальное с параметром (k)).Импорт/веса случайных всплесков (попадание случая извне).Изменчивость поведения населения во времени (случайные изменения соблюдения НПИ).Ошибки наблюдений: недоучтённость/задержки тестирования, систематические смещения в данных.Пространственные и сетевые эффекты (локальная гетерогенность).В ABM все эти факторы моделируются естественно; в ODE вводят стохастику через случайные флуктуации или многопопуляционные/стохастические дифференциальные уравнения.
5) Критерии валидации модели
Сопоставление с независимыми наблюдениями:Кривые случаев, госпитализаций, ICU, смертей по времени (RMSE, MAE).Серологические данные (общая атак‑рейт).Возрастная структура случаев и госпитализаций.Пространственное распространение (карты, локальные пики).Эпидемиологические метрики:
Восстановление эффективного (R_t) и его доверительные интервалы.Вторичные показатели: вторичная атака в домохозяйствах, распределение интервала серийности.Статистические критерии:
Ликели‑ход и байесовская подгонка (posterior predictive checks), CRPS для прогнозов, покрытие наблюдаемых точек доверительными интервалами.Hindcasting: калибровка на раннем периоде, проверка предсказаний на последующем периоде.Чувствительность к структурным предположениям: сравнить несколько реализаций модели (ABM vs ODE) на одних данных.
6) Оценка неопределённости результатов
Метод Монте‑Карло: множество прогонов с выборкой параметров из априорных распределений → эмпирические интервалы прогнозов (перцентили 5–95% и т. п.).Байесовский подход: MCMC/Particle MCMC/SMC для получения постериорных распределений параметров и прогнозов → доверительные/кредибельные интервалы.Квази‑создание ансамблей: разные реалистичные сценарии (варианты поведения, эффективности НПИ, импорт) — сценарный анализ.Глобальная чувствительность: Sobol‑индексы или FAST для определения влияния входных параметров на вариативность выходов.Локальная чувствительность: частные производные/градиенты или PRCC (partial rank correlation coefficients).Бутстрэппинг наблюдений и параметрическая бутстрэппинг для оценки погрешности из данных.Эмуляторы/метамодели (Gaussian Process) для ускорения UQ при дорогих ABM.Отчётность: показывать медиану + 50/95% интервалы, долю прогонов, когда ключевые события (пик, перегрузка ИВЛ) происходят.7) Практический рабочий процесс (рекомендации)
Шаг 1: собрать и предобработать данные (демография, контакты, наблюдения).Шаг 2: сделать быстрый агрегированный SEIR для первичных оценок чувствительности и грубых сценариев.Шаг 3: калибровать на наблюдаемых данных (максимальное правдоподобие или байес).Шаг 4: построить ABM для детальной оценки ключевых интервенций; использовать результаты SEIR для априорных диапазонов параметров.Шаг 5: выполнить многозарядный UQ (MC, MCMC, сценарии), глобальную чувствительность.Шаг 6: валидация через hindcasting, сравнение с независимыми датасетами (серология, госпитализации).Шаг 7: подготовить отчёт с медианой, интервалами, чувствительностью и четким описанием ограничений модели.8) Выходы модели (ключевые метрики для принятия решений)
Прогноз ежедневных случаев, госпитализаций, ИВЛ, смертей.Время и величина пика, суммарный атак‑рейт, нагрузка на систему здравоохранения.Эффект интервенций: снижение пиков/сдвиг пиков, число предотвращённых госпитализаций.Пространственное распределение риска и группы высокого риска.Коротко о компромиссе: ODE — быстрый, прозрачный, хорош для сценариев и калибровки; ABM — дорогой по ресурсам, но необходим для оценки локальных мер и сетевых эффектов. Надёжность выводов достигается сочетанием: начать с ODE, затем детализировать критические сценарии в ABM и систематически оценивать неопределённость через ансамбли и байесовские методы.