Спроектируйте план экспериментальной верификации агентного эпидемиологического моделирования (SIR-подобная модель с мобильными агентами): какие параметры и сценарии имитировать, как оценивать устойчивость результатов к стохастическим флуктуациям и какие методы калибровки и валидации данных вы примените

22 Окт в 14:40
7 +1
0
Ответы
1
Краткий план экспериментальной верификации агентной SIR-подобной модели с мобильными агентами.
1) Формулировка цели и метрик
- Цель: проверить корректность динамики, чувствительность к параметрам, устойчивость к стохастике и качество подгонки под данные.
- Основные выходные метрики: суммарная заражаемость (attack rate) AAA, пиковая заболеваемость Imax⁡I_{\max}Imax , время до пика tmax⁡t_{\max}tmax , эффективный репродукционный коэффициент RtR_tRt , кумулятивные случаи по времени C(t)C(t)C(t).
2) Параметры модели для имитаций
- эпидемиологические: вероятность передачи при контакте ptransp_{\text{trans}}ptrans , длительность инфективности / скорость восстановления γ\gammaγ (в стационарной среде можно сверить с E[Tinf]=1/γ\mathrm{E}[T_{\text{inf}}]=1/\gammaE[Tinf ]=1/γ); базовый R0R_0R0 через среднее число контактов kkk: R0=k⋅ptrans⋅(1/γ)R_0 = k \cdot p_{\text{trans}} \cdot (1/\gamma)R0 =kptrans (1/γ);
- мобильность/контакты: средняя скорость/длина шага vvv, радиус контакта rcr_crc , распределение направлений/тип движения (лучевая, случайная блуждание, привязка к узлам); плотность агентов ρ\rhoρ; смешивание: фракция домашних/рабочих мест;
- гетерогенность: распределение восприимчивости/инфективности, доля суперапредателей fssf_{\text{ss}}fss , различие по возрастам/контактам;
- интервенции: маски (уменьшают ptransp_{\text{trans}}ptrans ), локдауны (уменьшают vvv или контакты), тест/изоляция (уменьшают период инфективности или долю контактов);
- начальные условия: число и местоположение начальных инфицированных I0I_0I0 , начальное иммунитет/вакцинация V0V_0V0 .
3) Сценарии имитаций (экспериментальный дизайн)
- базовый сценарий (референс): средние/оценочные параметры;
- вариации по отдельно одному параметру (one-at-a-time) для первичного понимания;
- факторный дизайн (полный или дробный) для ключевых параметров: {ptrans,v,rc,ρ,γ}\{p_{\text{trans}}, v, r_c, \rho, \gamma\}{ptrans ,v,rc ,ρ,γ};
- латин-гиперквадрат (LHS) или случайная сэмплинг-стратегия для глобального охвата пространства параметров;
- стресс-сценарии: высокая мобильность, высокая плотность, наличие суперапредателей, частичные/полные NPIs;
- сценарии проверки калибровки: синтетические "ground-truth" данные (генерируете данные из модели с известными параметрами) для тестирования методов оценки.
4) Оценка устойчивости к стохастическим флуктуациям
- повторения: для каждой точки в пространстве параметров выполнить NNN независимых прогонов; средние и стандартные ошибки по метрикам. Оценка числа прогонов через правило Монте-Карло: стандартная ошибка оценки среднего SE=σ/NSE = \sigma/\sqrt{N}SE=σ/N , требуемое NNN задают по допустимому SESESE. Например целевой SESESE для Imax⁡I_{\max}Imax .
- кривые ансамбля: показывать ансамбль траекторий и доверительные интервалы (например, 95% квантильный интервал).
- количественные показатели устойчивости: коэффициент вариации CV=σ/μCV = \sigma/\muCV=σ/μ для метрик; доверительный интервал покрытие; тесты различимости (KS-тест, сравнение распределений) между сценариями.
- анализ сходимости: проверять, стабилизируются ли оценки при росте NNN (построить график среднего и доверительного интервала по NNN).
- декомпозиция дисперсии: ANOVA / вариационный разбор / Sobol-индексы для выделения доли дисперсии, объясняемой параметрами vs стохастикой. Первый порядок Sobol-индекса: Si=VarXi(E[Y∣Xi])Var(Y)S_i = \dfrac{\mathrm{Var}_{X_i}(\mathbb{E}[Y|X_i])}{\mathrm{Var}(Y)}Si =Var(Y)VarXi (E[YXi ]) .
- бутстрэп: оценивать неопределённость статистик бутстрэп-репликациями внутри набора прогонов.
5) Методы калибровки (подгонки) параметров
- если доступны агрегированные данные (временные ряды случаев/госпитализаций):
- Байесовская калибровка + ABC (Approximate Bayesian Computation) с подходящими дистанционными метриками по суммарным статистикам (пиковое значение, время до пика, кумулятивные случаи);
- последовательный Monte Carlo ABC / SMC-ABC для эффективности;
- частично-аналитические: particle filter / iterated filtering если можно задать вероятностную функцию наблюдения;
- градиент-несвёрнутые оптимизаторы (CMA-ES, Nelder–Mead) для поиска ММП/МНК при отображении модели → метрика ошибки (RMSE или лог-вероятность).
- если доступны индивидуальные данные (контакты, мобильность): использовать формализованные likelihood-функции и фильтры (particle MCMC) или смешанные методы (Ensemble Kalman Filter for parameters).
- выбор статистик в качестве «суммарных признаков» для ABC: {A,Imax⁡,tmax⁡,C(t) на нескольких t}\{A, I_{\max}, t_{\max}, C(t)\text{ на нескольких }t\}{A,Imax ,tmax ,C(t) на нескольких t}. Использовать нормализацию ошибок по дисперсии эмпирических данных.
6) Валидация модели
- синтетическая валидация (проверка идентифицируемости): генерировать данные с известными параметрами и проверять, восстанавливаются ли они.
- кросс-валидация по времени: калибровать на первых TtrainT_{\text{train}}Ttrain днях, валидировать на следующих TtestT_{\text{test}}Ttest днях; оценивать RMSE, MAE, CRPS и покрытие доверительных интервалов.
- валидация на независимых наборах данных (географические кластеры, другие волны).
- posterior predictive checks: сравнить распределения наблюдаемых статистик с предсказанными распределениями из апостериорного распределения параметров.
- чувствительность к модельным допущениям (movement model, контактная геометрия): менять модели движения и смотреть стабильность выводов.
7) Критерии приемлемости и отчётность
- количественные пороги: например, покрытие 95%-интервала для наблюдаемых временных рядов ≥ 95%95\%95% (или выбранный уровень), CV для ключевых метрик < допустимого значения (например CV<0.1CV < 0.1CV<0.1 для Imax⁡I_{\max}Imax , если требуется высокая точность) — пороги задавать по прикладным требованиям.
- документировать: версии кода, RNG seed, параметры, наборы сценариев, формат выходных данных. Хранить репозитории результатов и сценариев.
8) Практические рекомендации по реализации
- набор прогонов: для первичной оценки N∈[100,1000]N\in[100,1000]N[100,1000] прогонов на точку; для окончательной оценки ансамбля и неопределённости увеличить до N≥1000N\ge 1000N1000 при возможности; все числовые цели оформлять в KaTeX: например N=1000N=1000N=1000.
- параллелизация и контейнеризация для воспроизводимости; журналирование seed'ов и метаданных.
- визуализация: ансамблевые полосы, плотности пиков, тепловые карты зависимости метрик от пары параметров, графики Sobol-индексов.
Кратко: комбинируйте детерминированные и глобальные методы анализа чувствительности (factorial, LHS, Sobol), многократные прогонки и бутстрэп для учёта стохастики, синтетическую и временную валидацию для проверки калибровки, и байес/ABC/particle‑filter методы для оценки параметров с учётом наблюдательной ошибки.
22 Окт в 15:02
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир