Моделирование и симуляции: вам поручено смоделировать распространение новой инфекции в городе с 100k жителями для оценки вмешательств — сравните агентно‑ориентированную и компартментную модели (SIR/SEIR) по точности, затратам вычислений и способности учитывать поведение людей; опишите подход валидации модели на неполных данных и методы чувствительности к параметрам

12 Окт в 08:16
3 +3
0
Ответы
1

Ниже — сжатое практическое руководство по моделированию распространения новой инфекции в городе ~100 000 жителей с упором на сравнение агентно‑ориентированной ABMABMABM и компартментной SIR/SEIRSIR/SEIRSIR/SEIR моделей, валидацию при неполных данных и методы чувствительности к параметрам.

1) Краткое описание подходов

Компартментные модели SIR/SEIRSIR/SEIRSIR/SEIR

Средняя по популяции скорость инфицирования через контактную интенсивность и долю инфицированных. Может быть детализирована по возрасту/локациям метапопуляцияметапопуляцияметапопуляция, включать временные изменения βttt, стахастичность.Преимущества: простота, быстрое выполнение, прозрачность параметров, хорошо подходят для быстрого скрининга сценариев.Ограничения: усреднение, ограниченная способность учесть гетерогенности контактов, сетевых эффектов, индивидуального поведения и пространственной структуры.

Агентно‑ориентированная модель ABMABMABM

Моделирует отдельных агентов с их атрибутами возраст,домохозяйство,рабочееместо,поведениевозраст, домохозяйство, рабочее место, поведениевозраст,домохозяйство,рабочееместо,поведение и сетями контактов. Инфекция распространяется через траектории контактов.Преимущества: гибкость в учете гетерогенности контактов, поведения, вмешательств локальныемеры,закрытия,тест‑трейсинглокальные меры, закрытия, тест‑трейсинглокальныемеры,закрытия,тесттрейсинг, возможность моделировать адаптивное поведение, локальные вспышки.Ограничения: сложнее валидация и калибровка, выше требования к данным и вычислениям, результаты более чутки на допущения о поведении и сети.

2) Точность vs вычисления vs поведение

Точность

ABM потенциально точнее там, где ключевую роль играют сети контактов, кластерные вспышки, неравномерное внедрение мер, целенаправленные интервенции закрытиешкол,работающиеудаленнозакрытие школ, работающие удаленнозакрытиешкол,работающиеудаленно. Но "потенциально": её достижение зависит от качества входных данных контактов,мобильности,поведенияконтактов, мобильности, поведенияконтактов,мобильности,поведения.SIR/SEIR даёт корректные агрегированные прогнозы при однородных популяциях или когда главное — средние эффекты например,влияниесниженияβнапикенапример, влияние снижения β на пикенапример,влияниесниженияβнапике. Можно получить хорошие прогнозы для показателей типа общей доли инфицированных, пикового времени при корректной калибровке.

Вычислительные затраты

Для города 100k:Компартментная модель детализированнаяповозрасту/локациям,стохастическаядетализированная по возрасту/локациям, стохастическаядетализированнаяповозрасту/локациям,стохастическая — одна симуляция: миллисекунды–секунды на обычном ПК; тысячи прогонов для неопределённости — минутное/часовое время.Простая ABM 100kагентов,дневныешаги,простаялогика100k агентов, дневные шаги, простая логика100kагентов,дневныешаги,простаялогика — одна симуляция: от несколько секунд оптимизированныйC++/Juliaоптимизированный C++/JuliaоптимизированныйC++/Julia до десятков минут неоптимизированныйPythonнеоптимизированный PythonнеоптимизированныйPython. При сложной логике детализованныемаршруты,контактныесети,тесты/трейсингдетализованные маршруты, контактные сети, тесты/трейсингдетализованныемаршруты,контактныесети,тесты/трейсинг — десятки минут–часов на один прогон.Калибровка/анализ чувствительности требует сотен–тысяч прогонов: для ABM это требует HPC/кластеров, параллелизации, или построения эммуляторов surrogatemodelssurrogate modelssurrogatemodels.Практический вывод: для быстрой разведки — SIR/SEIR; для детального анализа критичных сценариев — ABM, но с инвестициями в вычисления и сокращением размера экспериментальной выборки см.эммуляторысм. эммуляторысм.эммуляторы.

Учет поведения людей

ABM: естественная поддержка сложного поведения адаптация,гетерогеннаяприверженность,тестирование,карантины,изменениясетиконтактоввответнарискадаптация, гетерогенная приверженность, тестирование, карантины, изменения сети контактов в ответ на рискадаптация,гетерогеннаяприверженность,тестирование,карантины,изменениясетиконтактоввответнариск. Можно вводить правила, обучение агентов, влияние информации/социальных сетей.Компартментные модели: поведение можно учитывать косвенно (временные β(t), функции зависимости β от полезной информации или показателей заболеваемости, отдельные "поведенческие" компартменты: compliant/non‑compliant). Но гибкость и детализация ограничены.

3) Рекомендованная рабочая стратегия практическаяпрактическаяпрактическая

Фазовый подход:
Старт: быстрые SIR/SEIR сценарии детализированныеповозрасту/работе/школьникам/пространствудетализированные по возрасту/работе/школьникам/пространствудетализированныеповозрасту/работе/школьникам/пространству для выявления основных чувствительных параметров R0,долябессимптомных,времязаразностиR0, доля бессимптомных, время заразностиR0,долябессимптомных,времязаразности и грубой оценки интервенций.Детализация: если решения требуют учета сетей/локальной политики/трассировки — разработать ABM для конечного набора сценариев например,5–10ключевыхкомбинациймернапример, 5–10 ключевых комбинаций мернапример,5–10ключевыхкомбинациймер.Калибровка: параллельно калибровать обе модели на имеющихся данных; использовать вывод из SIR для уменьшения пространства параметров ABM.Эммуляция: для ABM построить эмульгатор GaussianProcess,RandomForestGaussian Process, Random ForestGaussianProcess,RandomForest для быстрого проведения чувствительности и оценки неопределенности.

4) Калибровка и валидация при неполных/шумных данных

Какие данные обычно доступны: подтверждённые случаи, госпитализации, смерти, эпидемиологические расследования, результаты тестирования, мобильность, серопробы ограниченноограниченноограниченно.

Проблемы: недоучёт случаев, задержки в отчётах, изменение тестирования во времени, непредставительная серология.

Практические шаги валидации и калибровки:

Предварительная диагностика данных: оценить покрытие тестирования, задержки, последовательность изменений в политике тестирования.Включить в модель процесс наблюдения:
Параметр/функция выявляемости ascertainmentascertainmentascertainment — доля и задержка от заражения до регистрации.Множественные наблюдаемые величины cases,hospitalizations,deaths,seroprevalencecases, hospitalizations, deaths, seroprevalencecases,hospitalizations,deaths,seroprevalence используются одновременно — улучшает идентифицируемость.Байесовская калибровка/инференция:
Использовать MCMC / particle‑MCMC / SMC / плагин‑подходы для оценки постериорных распределений параметров с учётом неопределённости в наблюдении.Если likelihood трудно задавать — Approximate Bayesian Computation ABCABCABC или synthetic likelihood.Фильтрация и ассимиляция данных:
Particle filter / ensemble Kalman filter для онлайн‑калибровки и краткосрочного прогнозирования при поступлении новых данных.Валидация:
Разделить данные по времени: калибровать на исходной части, валидировать прогнозами на holdout‑периоде.Posterior predictive checks: сравнить распределения прогнозов с наблюдаемыми coverage,biascoverage, biascoverage,bias.Сравнение нескольких независимых метрик incidence,peaktime,hospitalbedsincidence, peak time, hospital bedsincidence,peaktime,hospitalbeds.Кросс‑валидация между моделями: проверить, согласуются ли SIR и ABM по ключевым выводам после калибровки.Работа с недостающими данными:
Именуйте недостающие величины как параметры с априорными распределениями.Используйте внешние источники и экспертные мнения для априорных распределений например,надолюбессимптомныхнапример, на долю бессимптомныхнапример,надолюбессимптомных.Дополнительные данные мобильность,опросыоповедении,серологическиевыборкимобильность, опросы о поведении, серологические выборкимобильность,опросыоповедении,серологическиевыборки очень повышают способность калибровки — планируйте целевые небольшие исследования, если это возможно.

5) Методы и практики анализа чувствительности и неопределённости

Цели: понять, какие параметры влияют на ключевые выходы пиковаязаболеваемость,общийатак,времяпика,потребностьвгоспиталяхпиковая заболеваемость, общий атак, время пика, потребность в госпиталяхпиковаязаболеваемость,общийатак,времяпика,потребностьвгоспиталях и какие выводы устойчивы.Подходы:
Локальная чувствительность One‑at‑a‑time,OATOne‑at‑a‑time, OATOneatatime,OAT: меняют каждый параметр вокруг базовой точки — быстрый, но не учитывает взаимодействия.Глобальная чувствительность:Latin Hypercube Sampling LHSLHSLHS для генерации параметров.Методы вариансного разложения: Sobol полнаявариацияивзаимодействияполная вариация и взаимодействияполнаявариацияивзаимодействия.Morris method screeningscreeningscreening — быстрый, определяет важные параметры.Partial Rank Correlation Coefficients PRCCPRCCPRCC — корреляционный анализ по выборке LHS, даёт направление и силу влияния.Эмпирические методы:Построение эмулея для ABM GaussianProcess,RandomForestGaussian Process, Random ForestGaussianProcess,RandomForest и проведение глобального анализа на эмулее.Идентифицируемость:Профиль‑похожесть profilelikelihoodprofile likelihoodprofilelikelihood и/или постериорные корреляции: обнаружение несмещённых/неидентифицируемых параметров.Визуализация неопределённости:Прогнозные интервалы например,95например, 95% PIнапример,95, tornado plots для ранжирования влияния параметров, scatter plots вход‑выход.Практика для ABM:
Поскольку ABM стохастичен, для каждой точки параметрического пространства нужно обеспечить несколько прогонов для оценки внутренней вариативности.Планировать анализ чувствительности с учётом затрат: сначала screening MorrisMorrisMorris с малым числом прогона, затем Sobol/PRCC на сокращённом наборе важных параметров.

6) Конкретные параметры, на которые стоит обратить внимание

R0 илиначальнаяβили начальная βилиначальнаяβ, время латентности/инфекциозности incubation/generationtimeincubation/generation timeincubation/generationtime, доля бессимптомных, их передаваемость, время до изоляции, доля выявляемости и её временная динамика, контактные матрицы дом/работа/школа/другоедом/работа/школа/другоедом/работа/школа/другое, уровень соблюдения мер, параметры тестирования/трассинга, миграция/мобильность внутри города.

7) Метрики качества модели и проверки прогностической способности

Качество подгонки: RMSE, MAE, CRPS дляпредсказательнойплотностидля предсказательной плотностидляпредсказательнойплотности, coverage долянаблюдений,попадающихвпредельныеинтервалыдоля наблюдений, попадающих в предельные интервалыдолянаблюдений,попадающихвпредельныеинтервалы, log‑likelihood.Прогностическая способность: Brier score, ROC/AUC для бинарных исходов.Сопоставление с независимыми данными: серологические опросы, госпитализации, данные по возрастной структуре больных.

8) Практические рекомендации по реализации

Инструменты:
Компартментные: R deSolve,pomp,EpiModeldeSolve, pomp, EpiModeldeSolve,pomp,EpiModel, Python scipy.integrate,epipyscipy.integrate, epipyscipy.integrate,epipy, Stan/pymc для байесовской инференции.ABM: Mesa PythonPythonPython, Repast, GAMA, FRED, AnyLogic коммерческийкоммерческийкоммерческий, C++/Julia для скоростных реализаций.Калибровка/инференция: MCMC Stan,pymcStan, pymcStan,pymc, particle MCMC libBi,pomplibBi, pomplibBi,pomp, ABC ABCpyABCpyABCpy, data assimilation EnKFEnKFEnKF, SALib чувствительностьчувствительностьчувствительность.Производительность:
Параллелизация прогона сценариев и кросс‑валидации.Профилирование и оптимизация узких мест: хранение контактов, векторизация, использование эффективных структур данных.Для ABM: рассмотреть уменьшение детализации псевдо‑агенты,агрегированиеподомохозяйствампсевдо‑агенты, агрегирование по домохозяйствампсевдоагенты,агрегированиеподомохозяйствам, чтобы снизить вычислительную нагрузку.

9) Рекомендации по интерпретации результатов

Всегда указывать неопределённости: сценарии должны сопровождаться интервалами по ключевым выходам.Сравнивать выводы двух моделей: если обе модели сходятся в ключевом заключении — доверие выше; если расходятся — исследовать причины структурныедопущения,данныеструктурные допущения, данныеструктурныедопущения,данные.Для принятия решений используйте "пороговую устойчивость": какие решения остаются оптимальными при вариации ключевых параметров.

10) Конкретный пример рабочего плана для города 100k соценкамивременис оценками временисоценкамивремени

День 0–7: соберите данные случаи,госпитализации,тестирование,мобильность,демографияслучаи, госпитализации, тестирование, мобильность, демографияслучаи,госпитализации,тестирование,мобильность,демография. Постройте возрастную SEEEIR и сделайте первоначальные сценарии — 1–3 дня.Неделя 2–4: калибровка SEEEIR MCMC/ABCMCMC/ABCMCMC/ABC, первичный анализ чувствительности LHS,PRCC,MorrisLHS, PRCC, MorrisLHS,PRCC,Morris — несколько дней на обычном ПК.Месяц 1–2: разработка ABM минимальной рабочей версии домохозяйства,работа/школа,простаясетьдомохозяйства, работа/школа, простая сетьдомохозяйства,работа/школа,простаясеть, калибровка по ключевым показателям; один прогон ABM PythonPythonPython: 1–20 мин; 1000 прогонов HPCилипараллельноHPC или параллельноHPCилипараллельно — дни–недели.Параллельно: построение эмулера для ABM неделянеделянеделя + глобальная чувствительность по эмулеру дниднидни.Итог: представить сравнительный отчёт SEEEIR vs ABM для набора интервенций с неопределённостям и рекомендациями.

Короткое резюме

Для быстрого, ресурсоэкономного скрининга — компартментные модели.Для детального анализа интервенций, где важны сети и поведение — ABM, но готовьтесь к большим затратам на данные, валидацию и вычисления; используйте ABM там, где он даст добавленную ценность.Валидация на неполных данных требует моделирования процесса наблюдения, комбинирования разных источников данных, байесовской инференции/частичной ассимиляции и posterior predictive checks.Для анализа чувствительности используйте комбинированный подход: Morris/LHS для screening, Sobol/PRCC для глубокого анализа; для ABM — применять эмулейторы, чтобы сделать глобальный анализ практичным.

Если хотите, могу:

Предложить конкретную структуру SEEEIR модели с наборами приоритетных параметров и априорными распределениями для вашей задачи;Спроектировать простую ABM‑архитектуру дом,работа,школа,случайныеконтактыдом, работа, школа, случайные контактыдом,работа,школа,случайныеконтакты и оценить примерное время прогона на конкретном железе;Описать пошагово процедуру калибровки с использованием particle filter или ABC под ваши данные.
12 Окт в 08:51
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир