Спроектируйте план экспериментальной верификации агентного эпидемиологического моделирования (SIR-подобная модель с мобильными агентами): какие параметры и сценарии имитировать, как оценивать устойчивость результатов к стохастическим флуктуациям и какие методы калибровки и валидации данных вы примените
Краткий план экспериментальной верификации агентной SIR-подобной модели с мобильными агентами. 1) Формулировка цели и метрик - Цель: проверить корректность динамики, чувствительность к параметрам, устойчивость к стохастике и качество подгонки под данные. - Основные выходные метрики: суммарная заражаемость (attack rate) AAA, пиковая заболеваемость ImaxI_{\max}Imax, время до пика tmaxt_{\max}tmax, эффективный репродукционный коэффициент RtR_tRt, кумулятивные случаи по времени C(t)C(t)C(t). 2) Параметры модели для имитаций - эпидемиологические: вероятность передачи при контакте ptransp_{\text{trans}}ptrans, длительность инфективности / скорость восстановления γ\gammaγ (в стационарной среде можно сверить с E[Tinf]=1/γ\mathrm{E}[T_{\text{inf}}]=1/\gammaE[Tinf]=1/γ); базовый R0R_0R0 через среднее число контактов kkk: R0=k⋅ptrans⋅(1/γ)R_0 = k \cdot p_{\text{trans}} \cdot (1/\gamma)R0=k⋅ptrans⋅(1/γ); - мобильность/контакты: средняя скорость/длина шага vvv, радиус контакта rcr_crc, распределение направлений/тип движения (лучевая, случайная блуждание, привязка к узлам); плотность агентов ρ\rhoρ; смешивание: фракция домашних/рабочих мест; - гетерогенность: распределение восприимчивости/инфективности, доля суперапредателей fssf_{\text{ss}}fss, различие по возрастам/контактам; - интервенции: маски (уменьшают ptransp_{\text{trans}}ptrans), локдауны (уменьшают vvv или контакты), тест/изоляция (уменьшают период инфективности или долю контактов); - начальные условия: число и местоположение начальных инфицированных I0I_0I0, начальное иммунитет/вакцинация V0V_0V0. 3) Сценарии имитаций (экспериментальный дизайн) - базовый сценарий (референс): средние/оценочные параметры; - вариации по отдельно одному параметру (one-at-a-time) для первичного понимания; - факторный дизайн (полный или дробный) для ключевых параметров: {ptrans,v,rc,ρ,γ}\{p_{\text{trans}}, v, r_c, \rho, \gamma\}{ptrans,v,rc,ρ,γ}; - латин-гиперквадрат (LHS) или случайная сэмплинг-стратегия для глобального охвата пространства параметров; - стресс-сценарии: высокая мобильность, высокая плотность, наличие суперапредателей, частичные/полные NPIs; - сценарии проверки калибровки: синтетические "ground-truth" данные (генерируете данные из модели с известными параметрами) для тестирования методов оценки. 4) Оценка устойчивости к стохастическим флуктуациям - повторения: для каждой точки в пространстве параметров выполнить NNN независимых прогонов; средние и стандартные ошибки по метрикам. Оценка числа прогонов через правило Монте-Карло: стандартная ошибка оценки среднего SE=σ/NSE = \sigma/\sqrt{N}SE=σ/N, требуемое NNN задают по допустимому SESESE. Например целевой SESESE для ImaxI_{\max}Imax. - кривые ансамбля: показывать ансамбль траекторий и доверительные интервалы (например, 95% квантильный интервал). - количественные показатели устойчивости: коэффициент вариации CV=σ/μCV = \sigma/\muCV=σ/μ для метрик; доверительный интервал покрытие; тесты различимости (KS-тест, сравнение распределений) между сценариями. - анализ сходимости: проверять, стабилизируются ли оценки при росте NNN (построить график среднего и доверительного интервала по NNN). - декомпозиция дисперсии: ANOVA / вариационный разбор / Sobol-индексы для выделения доли дисперсии, объясняемой параметрами vs стохастикой. Первый порядок Sobol-индекса: Si=VarXi(E[Y∣Xi])Var(Y)S_i = \dfrac{\mathrm{Var}_{X_i}(\mathbb{E}[Y|X_i])}{\mathrm{Var}(Y)}Si=Var(Y)VarXi(E[Y∣Xi]). - бутстрэп: оценивать неопределённость статистик бутстрэп-репликациями внутри набора прогонов. 5) Методы калибровки (подгонки) параметров - если доступны агрегированные данные (временные ряды случаев/госпитализаций): - Байесовская калибровка + ABC (Approximate Bayesian Computation) с подходящими дистанционными метриками по суммарным статистикам (пиковое значение, время до пика, кумулятивные случаи); - последовательный Monte Carlo ABC / SMC-ABC для эффективности; - частично-аналитические: particle filter / iterated filtering если можно задать вероятностную функцию наблюдения; - градиент-несвёрнутые оптимизаторы (CMA-ES, Nelder–Mead) для поиска ММП/МНК при отображении модели → метрика ошибки (RMSE или лог-вероятность). - если доступны индивидуальные данные (контакты, мобильность): использовать формализованные likelihood-функции и фильтры (particle MCMC) или смешанные методы (Ensemble Kalman Filter for parameters). - выбор статистик в качестве «суммарных признаков» для ABC: {A,Imax,tmax,C(t) на нескольких t}\{A, I_{\max}, t_{\max}, C(t)\text{ на нескольких }t\}{A,Imax,tmax,C(t)нанесколькихt}. Использовать нормализацию ошибок по дисперсии эмпирических данных. 6) Валидация модели - синтетическая валидация (проверка идентифицируемости): генерировать данные с известными параметрами и проверять, восстанавливаются ли они. - кросс-валидация по времени: калибровать на первых TtrainT_{\text{train}}Ttrain днях, валидировать на следующих TtestT_{\text{test}}Ttest днях; оценивать RMSE, MAE, CRPS и покрытие доверительных интервалов. - валидация на независимых наборах данных (географические кластеры, другие волны). - posterior predictive checks: сравнить распределения наблюдаемых статистик с предсказанными распределениями из апостериорного распределения параметров. - чувствительность к модельным допущениям (movement model, контактная геометрия): менять модели движения и смотреть стабильность выводов. 7) Критерии приемлемости и отчётность - количественные пороги: например, покрытие 95%-интервала для наблюдаемых временных рядов ≥ 95%95\%95% (или выбранный уровень), CV для ключевых метрик < допустимого значения (например CV<0.1CV < 0.1CV<0.1 для ImaxI_{\max}Imax, если требуется высокая точность) — пороги задавать по прикладным требованиям. - документировать: версии кода, RNG seed, параметры, наборы сценариев, формат выходных данных. Хранить репозитории результатов и сценариев. 8) Практические рекомендации по реализации - набор прогонов: для первичной оценки N∈[100,1000]N\in[100,1000]N∈[100,1000] прогонов на точку; для окончательной оценки ансамбля и неопределённости увеличить до N≥1000N\ge 1000N≥1000 при возможности; все числовые цели оформлять в KaTeX: например N=1000N=1000N=1000. - параллелизация и контейнеризация для воспроизводимости; журналирование seed'ов и метаданных. - визуализация: ансамблевые полосы, плотности пиков, тепловые карты зависимости метрик от пары параметров, графики Sobol-индексов. Кратко: комбинируйте детерминированные и глобальные методы анализа чувствительности (factorial, LHS, Sobol), многократные прогонки и бутстрэп для учёта стохастики, синтетическую и временную валидацию для проверки калибровки, и байес/ABC/particle‑filter методы для оценки параметров с учётом наблюдательной ошибки.
1) Формулировка цели и метрик
- Цель: проверить корректность динамики, чувствительность к параметрам, устойчивость к стохастике и качество подгонки под данные.
- Основные выходные метрики: суммарная заражаемость (attack rate) AAA, пиковая заболеваемость ImaxI_{\max}Imax , время до пика tmaxt_{\max}tmax , эффективный репродукционный коэффициент RtR_tRt , кумулятивные случаи по времени C(t)C(t)C(t).
2) Параметры модели для имитаций
- эпидемиологические: вероятность передачи при контакте ptransp_{\text{trans}}ptrans , длительность инфективности / скорость восстановления γ\gammaγ (в стационарной среде можно сверить с E[Tinf]=1/γ\mathrm{E}[T_{\text{inf}}]=1/\gammaE[Tinf ]=1/γ); базовый R0R_0R0 через среднее число контактов kkk: R0=k⋅ptrans⋅(1/γ)R_0 = k \cdot p_{\text{trans}} \cdot (1/\gamma)R0 =k⋅ptrans ⋅(1/γ);
- мобильность/контакты: средняя скорость/длина шага vvv, радиус контакта rcr_crc , распределение направлений/тип движения (лучевая, случайная блуждание, привязка к узлам); плотность агентов ρ\rhoρ; смешивание: фракция домашних/рабочих мест;
- гетерогенность: распределение восприимчивости/инфективности, доля суперапредателей fssf_{\text{ss}}fss , различие по возрастам/контактам;
- интервенции: маски (уменьшают ptransp_{\text{trans}}ptrans ), локдауны (уменьшают vvv или контакты), тест/изоляция (уменьшают период инфективности или долю контактов);
- начальные условия: число и местоположение начальных инфицированных I0I_0I0 , начальное иммунитет/вакцинация V0V_0V0 .
3) Сценарии имитаций (экспериментальный дизайн)
- базовый сценарий (референс): средние/оценочные параметры;
- вариации по отдельно одному параметру (one-at-a-time) для первичного понимания;
- факторный дизайн (полный или дробный) для ключевых параметров: {ptrans,v,rc,ρ,γ}\{p_{\text{trans}}, v, r_c, \rho, \gamma\}{ptrans ,v,rc ,ρ,γ};
- латин-гиперквадрат (LHS) или случайная сэмплинг-стратегия для глобального охвата пространства параметров;
- стресс-сценарии: высокая мобильность, высокая плотность, наличие суперапредателей, частичные/полные NPIs;
- сценарии проверки калибровки: синтетические "ground-truth" данные (генерируете данные из модели с известными параметрами) для тестирования методов оценки.
4) Оценка устойчивости к стохастическим флуктуациям
- повторения: для каждой точки в пространстве параметров выполнить NNN независимых прогонов; средние и стандартные ошибки по метрикам. Оценка числа прогонов через правило Монте-Карло: стандартная ошибка оценки среднего SE=σ/NSE = \sigma/\sqrt{N}SE=σ/N , требуемое NNN задают по допустимому SESESE. Например целевой SESESE для ImaxI_{\max}Imax .
- кривые ансамбля: показывать ансамбль траекторий и доверительные интервалы (например, 95% квантильный интервал).
- количественные показатели устойчивости: коэффициент вариации CV=σ/μCV = \sigma/\muCV=σ/μ для метрик; доверительный интервал покрытие; тесты различимости (KS-тест, сравнение распределений) между сценариями.
- анализ сходимости: проверять, стабилизируются ли оценки при росте NNN (построить график среднего и доверительного интервала по NNN).
- декомпозиция дисперсии: ANOVA / вариационный разбор / Sobol-индексы для выделения доли дисперсии, объясняемой параметрами vs стохастикой. Первый порядок Sobol-индекса: Si=VarXi(E[Y∣Xi])Var(Y)S_i = \dfrac{\mathrm{Var}_{X_i}(\mathbb{E}[Y|X_i])}{\mathrm{Var}(Y)}Si =Var(Y)VarXi (E[Y∣Xi ]) .
- бутстрэп: оценивать неопределённость статистик бутстрэп-репликациями внутри набора прогонов.
5) Методы калибровки (подгонки) параметров
- если доступны агрегированные данные (временные ряды случаев/госпитализаций):
- Байесовская калибровка + ABC (Approximate Bayesian Computation) с подходящими дистанционными метриками по суммарным статистикам (пиковое значение, время до пика, кумулятивные случаи);
- последовательный Monte Carlo ABC / SMC-ABC для эффективности;
- частично-аналитические: particle filter / iterated filtering если можно задать вероятностную функцию наблюдения;
- градиент-несвёрнутые оптимизаторы (CMA-ES, Nelder–Mead) для поиска ММП/МНК при отображении модели → метрика ошибки (RMSE или лог-вероятность).
- если доступны индивидуальные данные (контакты, мобильность): использовать формализованные likelihood-функции и фильтры (particle MCMC) или смешанные методы (Ensemble Kalman Filter for parameters).
- выбор статистик в качестве «суммарных признаков» для ABC: {A,Imax,tmax,C(t) на нескольких t}\{A, I_{\max}, t_{\max}, C(t)\text{ на нескольких }t\}{A,Imax ,tmax ,C(t) на нескольких t}. Использовать нормализацию ошибок по дисперсии эмпирических данных.
6) Валидация модели
- синтетическая валидация (проверка идентифицируемости): генерировать данные с известными параметрами и проверять, восстанавливаются ли они.
- кросс-валидация по времени: калибровать на первых TtrainT_{\text{train}}Ttrain днях, валидировать на следующих TtestT_{\text{test}}Ttest днях; оценивать RMSE, MAE, CRPS и покрытие доверительных интервалов.
- валидация на независимых наборах данных (географические кластеры, другие волны).
- posterior predictive checks: сравнить распределения наблюдаемых статистик с предсказанными распределениями из апостериорного распределения параметров.
- чувствительность к модельным допущениям (movement model, контактная геометрия): менять модели движения и смотреть стабильность выводов.
7) Критерии приемлемости и отчётность
- количественные пороги: например, покрытие 95%-интервала для наблюдаемых временных рядов ≥ 95%95\%95% (или выбранный уровень), CV для ключевых метрик < допустимого значения (например CV<0.1CV < 0.1CV<0.1 для ImaxI_{\max}Imax , если требуется высокая точность) — пороги задавать по прикладным требованиям.
- документировать: версии кода, RNG seed, параметры, наборы сценариев, формат выходных данных. Хранить репозитории результатов и сценариев.
8) Практические рекомендации по реализации
- набор прогонов: для первичной оценки N∈[100,1000]N\in[100,1000]N∈[100,1000] прогонов на точку; для окончательной оценки ансамбля и неопределённости увеличить до N≥1000N\ge 1000N≥1000 при возможности; все числовые цели оформлять в KaTeX: например N=1000N=1000N=1000.
- параллелизация и контейнеризация для воспроизводимости; журналирование seed'ов и метаданных.
- визуализация: ансамблевые полосы, плотности пиков, тепловые карты зависимости метрик от пары параметров, графики Sobol-индексов.
Кратко: комбинируйте детерминированные и глобальные методы анализа чувствительности (factorial, LHS, Sobol), многократные прогонки и бутстрэп для учёта стохастики, синтетическую и временную валидацию для проверки калибровки, и байес/ABC/particle‑filter методы для оценки параметров с учётом наблюдательной ошибки.