Спроектируйте модель агентного моделирования распространения инфекции (SIR-подобной) в небольшом городе с учётом дневной миграции, вакцин и неравномерного контакта — какие параметры включить, как оценить достоверность результата и какие эксперименты провести для проверки чувствительности
Кратко и по сути: структура модели, набор параметров (с обозначениями), как оценивать достоверность и какие эксперименты чувствительности проводить. 1) Структура модели (ключевые идеи) - Агентный SIR-подобный с дневной миграцией: каждый агент имеет дом (ночь) и место дневной активности (работа/школа/соц. места). Контакты формируются по месту пребывания в каждый момент времени. - Заболевание: стадии (подверженность → латентность → инфекционный → выздоровление/серьёзное/умир). Учесть бессимптомных и симптомных с разной заразностью. - Вакцинация: статус у каждого агента (доза, время вакцинации, эффективность, угасание). - Контактная неоднородность: домохозяйства, работа/учёба, случайные контакты, распределение степени контактов и сверхраспространители. 2) Основные параметры (с обозначениями) - Демография: - общее население NNN, - возрастная структура ageaage_aagea для агента aaa, - домохозяйственные группы. - Миграция/мобильность: - матрица потоков/вероятностей дневного перемещения Mij(t)M_{ij}(t)Mij(t) (доля жителей района iii, проводящих день в месте jjj), - доля ежедневных мигрантов/коммутеров mmm. - Контакты: - матрица контактов по возрасту/месту CabsettingC_{ab}^{setting}Cabsetting (контакты между возрастами a,ba,ba,b в сеттинге), - среднее число контактов в сеттинге csettingc_{setting}csetting, - распределение степеней (напр. отрицательное биномиальное с дисперсией/параметром перегруппировки kdispk_{disp}kdisp). - Трансмиссия и натура болезни: - вероятность передачи при контакте ptransp_{trans}ptrans (можно разделить на phome,pwork,pcommunityp_{home}, p_{work}, p_{community}phome,pwork,pcommunity), - профиль заразности во времени g(t)g(t)g(t), - средняя продолжительность латентного периода τL\tau_LτL и инфекционного периода τI\tau_IτI (или скорости σ=1/τL, γ=1/τI\sigma=1/\tau_L,\ \gamma=1/\tau_Iσ=1/τL,γ=1/τI), - доля бессимптомных α\alphaα и их относительная заразность ρ\rhoρ. - Вакцинация: - покрытие по возрастам va(t)v_a(t)va(t), - эффективность по механизмам: против заражения VEsVE_sVEs, против передачи VEiVE_iVEi, против симптомов/тяжести VEdVE_dVEd, - скорость выведения иммунитета/усадка эффективности (ванинг) ω\omegaω. - Интервенции и поведение: - вероятность выявления/тестирования ptestp_{test}ptest, задержка теста Δtest\Delta_{test}Δtest, - доля изоляции/карантина pisop_{iso}piso и эффективность снижения контактов. - Инициация: - число и размещение первичных случаев I0I_0I0, время начала. 3) Математическая формулировка силы инфекции (пример) - Для агента aaa в момент ttt сила инфекции (приближенно): λa(t)=1−∏s∈Sa(t)∏b∈contactss(a,t)(1−ptranss⋅χb(t)),
\lambda_a(t) = 1 - \prod_{s\in S_a(t)}\prod_{b\in contacts_s(a,t)}\big(1 - p_{trans}^{s}\cdot \chi_b(t)\big), λa(t)=1−s∈Sa(t)∏b∈contactss(a,t)∏(1−ptranss⋅χb(t)),
где Sa(t)S_a(t)Sa(t) — сеттинги (дом, работа, общество), ptranssp_{trans}^{s}ptranss — вероятность передачи в сеттинге sss, χb(t)\chi_b(t)χb(t) — заразность контакта bbb (включая эффекты вакцины: χb(t)=Ib(t)⋅(1−VEi(b))⋅gb(t)\chi_b(t)=I_b(t)\cdot(1-VE_i^{(b)})\cdot g_b(t)χb(t)=Ib(t)⋅(1−VEi(b))⋅gb(t)). 4) Оценка достоверности (валидация и калибровка) - Данные для калибровки: временные ряды подтверждённых случаев, госпитализаций, смертей, серопревалентность, мобильность (анонимные данные), данные по вакцинaции. - Методы калибровки: - байесовский подход (MCMC/SMC/Particle Filter) или Approximate Bayesian Computation (ABC) для стохастической модели, - оптимизация по правдоподобию (если возможно) или минимизация ошибки (RMSE/MAE) между наблюдением и медианой/квантили симуляций. - Метрики качества: - RMSE/MAE по времени для случаев/госпитализаций, - покрытие доверительных интервалов (проверить, что реальные данные попадают в, например, 95% предсказательный интервал), - логарифмический правдоподобный скор или WAIC/BIC для сравнительных моделей. - Проверки: - posterior predictive checks (генерировать данные из апостериорного распределения и сравнить с наблюдаемыми), - кросс-валидация по временным окнам (fit на раннем периоде, проверить на holdout), - чувствительность к начальному посеву (размещение I_0). - Идентифицируемость параметров: - профильные вероятности, корреляции параметров; фиксировать плохоидентифицируемые параметры по данным из литературы. 5) Учет неопределённости - Выполнять много стохастических прогонов (≥200\ge 200≥200, для точности оценки квантилей — ∼500 \sim 500∼500–100010001000 при ресурсах). - Отчёт интервалов: медиана и 95%95\%95% предсказательные интервалы для ключевых выходов. 6) Эксперименты по проверке чувствительности (рекомендуемые) - Локальная/единичная чувствительность: - поочерёдная варьировка ключевых параметров на ±10%10\%10%, ±20%20\%20%: ptrans,τI,τL,VEs,VEi,m,kdispp_{trans}, \tau_I, \tau_L, VE_s, VE_i, m, k_{disp}ptrans,τI,τL,VEs,VEi,m,kdisp. - Глобальная чувствительность: - Latin Hypercube Sampling (LHS) + Partial Rank Correlation Coefficients (PRCC), - Sobol-индейсы для оценки вкладов в дисперсию выхода (attack rate, peak incidence, time-to-peak). - Сценарные анализы: - вариация дневной миграции: уменьшить/увеличить mmm на фиксированные множители (напр. 0.5×,1×,2×0.5\times, 1\times, 2\times0.5×,1×,2×), - вакцинные стратегии: приоритет по возрасту vs. по степени контактов vs. равномерно; смена покрытия vav_ava (0–100%), - изменение VE (варианты возмущения: снижение эффективности на 20%20\%20%, полный уход эффективности), - влияние сверхраспространителей: варьировать kdispk_{disp}kdisp (переход от пуассоновского к сильно скошенному), - вмешательства: закрытие школ/работа на удалёнке (редукция csettingc_{setting}csetting), тестинг/изоляция (увеличение ptest,pisop_{test}, p_{iso}ptest,piso). - Робастность к структурным допущениям: - заменять реализацию контактов (полносвязная случайная встреча vs. сетевой граф vs. матрица контактов) и смотреть изменение выводов. - Чувствительность к входным данным: - варьировать начальное количество инфицированных I0I_0I0 и распределение по локациям, - учесть задержки в отчётности/недоучёт (умножать данные наблюдения на фактор недооценки). - Проверка стохастичности: - запускать много реплик и оценивать CV (коэффициент вариации) ключевых выходов; если CV велик — выводы нестабильны. 7) Ключевые выходы для анализа - Кумулятивная доля инфицированных (attack rate), - Пик инцидентности и время до пика, - Нагрузка на госпитали (если моделируется), - Эффект вакцинации: случаи/госпитализации предотвращённые, - Эволюция эффективного репродукционного числа RtR_tRt (оценить из модели). 8) Практические рекомендации по реализации и проверке - Начните с упрощённой модели (малые города, небольшой набор сеттингов) и постепенно добавляйте слои (вакцина, миграция, субпопуляции). - Сохраняйте воспроизводимость: фиксируйте seed, версионируйте данные и код. - Документируйте источники значений фиксируемых параметров (литература, локальные данные). - Автоматизируйте набор экспериментов (скрипты для LHS/Sobol, сбор результатов) и визуализацию предсказательных интервалов. Если нужно, могу дать конкретный перечень параметров с типичными диапазонами значений и пример плана экспериментов (LHS+Sobol) для заданного размера города.
1) Структура модели (ключевые идеи)
- Агентный SIR-подобный с дневной миграцией: каждый агент имеет дом (ночь) и место дневной активности (работа/школа/соц. места). Контакты формируются по месту пребывания в каждый момент времени.
- Заболевание: стадии (подверженность → латентность → инфекционный → выздоровление/серьёзное/умир). Учесть бессимптомных и симптомных с разной заразностью.
- Вакцинация: статус у каждого агента (доза, время вакцинации, эффективность, угасание).
- Контактная неоднородность: домохозяйства, работа/учёба, случайные контакты, распределение степени контактов и сверхраспространители.
2) Основные параметры (с обозначениями)
- Демография:
- общее население NNN,
- возрастная структура ageaage_aagea для агента aaa,
- домохозяйственные группы.
- Миграция/мобильность:
- матрица потоков/вероятностей дневного перемещения Mij(t)M_{ij}(t)Mij (t) (доля жителей района iii, проводящих день в месте jjj),
- доля ежедневных мигрантов/коммутеров mmm.
- Контакты:
- матрица контактов по возрасту/месту CabsettingC_{ab}^{setting}Cabsetting (контакты между возрастами a,ba,ba,b в сеттинге),
- среднее число контактов в сеттинге csettingc_{setting}csetting ,
- распределение степеней (напр. отрицательное биномиальное с дисперсией/параметром перегруппировки kdispk_{disp}kdisp ).
- Трансмиссия и натура болезни:
- вероятность передачи при контакте ptransp_{trans}ptrans (можно разделить на phome,pwork,pcommunityp_{home}, p_{work}, p_{community}phome ,pwork ,pcommunity ),
- профиль заразности во времени g(t)g(t)g(t),
- средняя продолжительность латентного периода τL\tau_LτL и инфекционного периода τI\tau_IτI (или скорости σ=1/τL, γ=1/τI\sigma=1/\tau_L,\ \gamma=1/\tau_Iσ=1/τL , γ=1/τI ),
- доля бессимптомных α\alphaα и их относительная заразность ρ\rhoρ.
- Вакцинация:
- покрытие по возрастам va(t)v_a(t)va (t),
- эффективность по механизмам: против заражения VEsVE_sVEs , против передачи VEiVE_iVEi , против симптомов/тяжести VEdVE_dVEd ,
- скорость выведения иммунитета/усадка эффективности (ванинг) ω\omegaω.
- Интервенции и поведение:
- вероятность выявления/тестирования ptestp_{test}ptest , задержка теста Δtest\Delta_{test}Δtest ,
- доля изоляции/карантина pisop_{iso}piso и эффективность снижения контактов.
- Инициация:
- число и размещение первичных случаев I0I_0I0 , время начала.
3) Математическая формулировка силы инфекции (пример)
- Для агента aaa в момент ttt сила инфекции (приближенно):
λa(t)=1−∏s∈Sa(t)∏b∈contactss(a,t)(1−ptranss⋅χb(t)), \lambda_a(t) = 1 - \prod_{s\in S_a(t)}\prod_{b\in contacts_s(a,t)}\big(1 - p_{trans}^{s}\cdot \chi_b(t)\big),
λa (t)=1−s∈Sa (t)∏ b∈contactss (a,t)∏ (1−ptranss ⋅χb (t)), где Sa(t)S_a(t)Sa (t) — сеттинги (дом, работа, общество), ptranssp_{trans}^{s}ptranss — вероятность передачи в сеттинге sss, χb(t)\chi_b(t)χb (t) — заразность контакта bbb (включая эффекты вакцины: χb(t)=Ib(t)⋅(1−VEi(b))⋅gb(t)\chi_b(t)=I_b(t)\cdot(1-VE_i^{(b)})\cdot g_b(t)χb (t)=Ib (t)⋅(1−VEi(b) )⋅gb (t)).
4) Оценка достоверности (валидация и калибровка)
- Данные для калибровки: временные ряды подтверждённых случаев, госпитализаций, смертей, серопревалентность, мобильность (анонимные данные), данные по вакцинaции.
- Методы калибровки:
- байесовский подход (MCMC/SMC/Particle Filter) или Approximate Bayesian Computation (ABC) для стохастической модели,
- оптимизация по правдоподобию (если возможно) или минимизация ошибки (RMSE/MAE) между наблюдением и медианой/квантили симуляций.
- Метрики качества:
- RMSE/MAE по времени для случаев/госпитализаций,
- покрытие доверительных интервалов (проверить, что реальные данные попадают в, например, 95% предсказательный интервал),
- логарифмический правдоподобный скор или WAIC/BIC для сравнительных моделей.
- Проверки:
- posterior predictive checks (генерировать данные из апостериорного распределения и сравнить с наблюдаемыми),
- кросс-валидация по временным окнам (fit на раннем периоде, проверить на holdout),
- чувствительность к начальному посеву (размещение I_0).
- Идентифицируемость параметров:
- профильные вероятности, корреляции параметров; фиксировать плохоидентифицируемые параметры по данным из литературы.
5) Учет неопределённости
- Выполнять много стохастических прогонов (≥200\ge 200≥200, для точности оценки квантилей — ∼500 \sim 500∼500–100010001000 при ресурсах).
- Отчёт интервалов: медиана и 95%95\%95% предсказательные интервалы для ключевых выходов.
6) Эксперименты по проверке чувствительности (рекомендуемые)
- Локальная/единичная чувствительность:
- поочерёдная варьировка ключевых параметров на ±10%10\%10%, ±20%20\%20%: ptrans,τI,τL,VEs,VEi,m,kdispp_{trans}, \tau_I, \tau_L, VE_s, VE_i, m, k_{disp}ptrans ,τI ,τL ,VEs ,VEi ,m,kdisp .
- Глобальная чувствительность:
- Latin Hypercube Sampling (LHS) + Partial Rank Correlation Coefficients (PRCC),
- Sobol-индейсы для оценки вкладов в дисперсию выхода (attack rate, peak incidence, time-to-peak).
- Сценарные анализы:
- вариация дневной миграции: уменьшить/увеличить mmm на фиксированные множители (напр. 0.5×,1×,2×0.5\times, 1\times, 2\times0.5×,1×,2×),
- вакцинные стратегии: приоритет по возрасту vs. по степени контактов vs. равномерно; смена покрытия vav_ava (0–100%),
- изменение VE (варианты возмущения: снижение эффективности на 20%20\%20%, полный уход эффективности),
- влияние сверхраспространителей: варьировать kdispk_{disp}kdisp (переход от пуассоновского к сильно скошенному),
- вмешательства: закрытие школ/работа на удалёнке (редукция csettingc_{setting}csetting ), тестинг/изоляция (увеличение ptest,pisop_{test}, p_{iso}ptest ,piso ).
- Робастность к структурным допущениям:
- заменять реализацию контактов (полносвязная случайная встреча vs. сетевой граф vs. матрица контактов) и смотреть изменение выводов.
- Чувствительность к входным данным:
- варьировать начальное количество инфицированных I0I_0I0 и распределение по локациям,
- учесть задержки в отчётности/недоучёт (умножать данные наблюдения на фактор недооценки).
- Проверка стохастичности:
- запускать много реплик и оценивать CV (коэффициент вариации) ключевых выходов; если CV велик — выводы нестабильны.
7) Ключевые выходы для анализа
- Кумулятивная доля инфицированных (attack rate),
- Пик инцидентности и время до пика,
- Нагрузка на госпитали (если моделируется),
- Эффект вакцинации: случаи/госпитализации предотвращённые,
- Эволюция эффективного репродукционного числа RtR_tRt (оценить из модели).
8) Практические рекомендации по реализации и проверке
- Начните с упрощённой модели (малые города, небольшой набор сеттингов) и постепенно добавляйте слои (вакцина, миграция, субпопуляции).
- Сохраняйте воспроизводимость: фиксируйте seed, версионируйте данные и код.
- Документируйте источники значений фиксируемых параметров (литература, локальные данные).
- Автоматизируйте набор экспериментов (скрипты для LHS/Sobol, сбор результатов) и визуализацию предсказательных интервалов.
Если нужно, могу дать конкретный перечень параметров с типичными диапазонами значений и пример плана экспериментов (LHS+Sobol) для заданного размера города.