Спроектируйте план экспериментальной верификации агентного эпидемиологического моделирования (SIR-подобная модель с мобильными агентами): какие параметры и сценарии имитировать, как оценивать устойчивость результатов к стохастическим флуктуациям и какие методы калибровки и валидации данных вы примените
Предыдущий
вопрос Следующий
вопрос

Question

Спроектируйте план экспериментальной верификации агентного эпидемиологического моделирования (SIR-подобная модель с мобильными агентами): какие параметры и сценарии имитировать, как оценивать устойчивость результатов к стохастическим флуктуациям и какие методы калибровки и валидации данных вы примените
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

Спроектируйте план э...

eva

22 Окт в 14:40

7 +1

0

Helper · Answer 1

Краткий план экспериментальной верификации агентной SIR-подобной модели с мобильными агентами.
1) Формулировка цели и метрик
- Цель: проверить корректность динамики, чувствительность к параметрам, устойчивость к стохастике и качество подгонки под данные.
- Основные выходные метрики: суммарная заражаемость (attack rate)

A

, пиковая заболеваемость

I_{\max}

, время до пика

t_{\max}

, эффективный репродукционный коэффициент

R_t

, кумулятивные случаи по времени

C (t)

.
2) Параметры модели для имитаций
- эпидемиологические: вероятность передачи при контакте

ptransp_{\text{trans}}

, длительность инфективности / скорость восстановления

γ\gamma

(в стационарной среде можно сверить с

E[Tinf]=1/γ\mathrm{E}[T_{\text{inf}}]=1/\gamma

); базовый

R_0

через среднее число контактов

k

:

R0=k⋅ptrans⋅(1/γ)R_0 = k \cdot p_{\text{trans}} \cdot (1/\gamma)

;
- мобильность/контакты: средняя скорость/длина шага

v

, радиус контакта

r_c

, распределение направлений/тип движения (лучевая, случайная блуждание, привязка к узлам); плотность агентов

ρ\rho

; смешивание: фракция домашних/рабочих мест;
- гетерогенность: распределение восприимчивости/инфективности, доля суперапредателей

fssf_{\text{ss}}

, различие по возрастам/контактам;
- интервенции: маски (уменьшают

ptransp_{\text{trans}}

), локдауны (уменьшают

v

или контакты), тест/изоляция (уменьшают период инфективности или долю контактов);
- начальные условия: число и местоположение начальных инфицированных

I_0

, начальное иммунитет/вакцинация

V_0

.
3) Сценарии имитаций (экспериментальный дизайн)
- базовый сценарий (референс): средние/оценочные параметры;
- вариации по отдельно одному параметру (one-at-a-time) для первичного понимания;
- факторный дизайн (полный или дробный) для ключевых параметров:

{ptrans,v,rc,ρ,γ}\{p_{\text{trans}}, v, r_c, \rho, \gamma\}

;
- латин-гиперквадрат (LHS) или случайная сэмплинг-стратегия для глобального охвата пространства параметров;
- стресс-сценарии: высокая мобильность, высокая плотность, наличие суперапредателей, частичные/полные NPIs;
- сценарии проверки калибровки: синтетические "ground-truth" данные (генерируете данные из модели с известными параметрами) для тестирования методов оценки.
4) Оценка устойчивости к стохастическим флуктуациям
- повторения: для каждой точки в пространстве параметров выполнить

N

независимых прогонов; средние и стандартные ошибки по метрикам. Оценка числа прогонов через правило Монте-Карло: стандартная ошибка оценки среднего

\sigma/\sqrt{N}

, требуемое

N

задают по допустимому

SE

. Например целевой

SE

для

I_{\max}

.
- кривые ансамбля: показывать ансамбль траекторий и доверительные интервалы (например, 95% квантильный интервал).
- количественные показатели устойчивости: коэффициент вариации

\sigma/\mu

для метрик; доверительный интервал покрытие; тесты различимости (KS-тест, сравнение распределений) между сценариями.
- анализ сходимости: проверять, стабилизируются ли оценки при росте

N

(построить график среднего и доверительного интервала по

N

).
- декомпозиция дисперсии: ANOVA / вариационный разбор / Sobol-индексы для выделения доли дисперсии, объясняемой параметрами vs стохастикой. Первый порядок Sobol-индекса:

Si=VarXi(E[Y∣Xi])Var(Y)S_i = \dfrac{\mathrm{Var}_{X_i}(\mathbb{E}[Y|X_i])}{\mathrm{Var}(Y)}

.
- бутстрэп: оценивать неопределённость статистик бутстрэп-репликациями внутри набора прогонов.
5) Методы калибровки (подгонки) параметров
- если доступны агрегированные данные (временные ряды случаев/госпитализаций):
- Байесовская калибровка + ABC (Approximate Bayesian Computation) с подходящими дистанционными метриками по суммарным статистикам (пиковое значение, время до пика, кумулятивные случаи);
- последовательный Monte Carlo ABC / SMC-ABC для эффективности;
- частично-аналитические: particle filter / iterated filtering если можно задать вероятностную функцию наблюдения;
- градиент-несвёрнутые оптимизаторы (CMA-ES, Nelder–Mead) для поиска ММП/МНК при отображении модели → метрика ошибки (RMSE или лог-вероятность).
- если доступны индивидуальные данные (контакты, мобильность): использовать формализованные likelihood-функции и фильтры (particle MCMC) или смешанные методы (Ensemble Kalman Filter for parameters).
- выбор статистик в качестве «суммарных признаков» для ABC:

t}\{A, I_{\max}, t_{\max}, C(t)\text{ на нескольких }t\}

. Использовать нормализацию ошибок по дисперсии эмпирических данных.
6) Валидация модели
- синтетическая валидация (проверка идентифицируемости): генерировать данные с известными параметрами и проверять, восстанавливаются ли они.
- кросс-валидация по времени: калибровать на первых

TtrainT_{\text{train}}

днях, валидировать на следующих

TtestT_{\text{test}}

днях; оценивать RMSE, MAE, CRPS и покрытие доверительных интервалов.
- валидация на независимых наборах данных (географические кластеры, другие волны).
- posterior predictive checks: сравнить распределения наблюдаемых статистик с предсказанными распределениями из апостериорного распределения параметров.
- чувствительность к модельным допущениям (movement model, контактная геометрия): менять модели движения и смотреть стабильность выводов.
7) Критерии приемлемости и отчётность
- количественные пороги: например, покрытие 95%-интервала для наблюдаемых временных рядов ≥

95%95\%

(или выбранный уровень), CV для ключевых метрик < допустимого значения (например

C V < 0.1

для

I_{\max}

, если требуется высокая точность) — пороги задавать по прикладным требованиям.
- документировать: версии кода, RNG seed, параметры, наборы сценариев, формат выходных данных. Хранить репозитории результатов и сценариев.
8) Практические рекомендации по реализации
- набор прогонов: для первичной оценки

N∈[100,1000]N\in[100,1000]

прогонов на точку; для окончательной оценки ансамбля и неопределённости увеличить до

N≥1000N\ge 1000

при возможности; все числовые цели оформлять в KaTeX: например

N = 1000

.
- параллелизация и контейнеризация для воспроизводимости; журналирование seed'ов и метаданных.
- визуализация: ансамблевые полосы, плотности пиков, тепловые карты зависимости метрик от пары параметров, графики Sobol-индексов.
Кратко: комбинируйте детерминированные и глобальные методы анализа чувствительности (factorial, LHS, Sobol), многократные прогонки и бутстрэп для учёта стохастики, синтетическую и временную валидацию для проверки калибровки, и байес/ABC/particle‑filter методы для оценки параметров с учётом наблюдательной ошибки.

Другие вопросы eva

Другие вопросы
eva