Спроектируйте экспериментальный протокол для проверки новой гипотезы в физике (например, поиска лёгких слабо взаимодействующих частиц): какие контролируемые условия, статистические методы и тесты воспроизводимости вы предложите, и как выявить и учесть систематические ошибки?
Ниже — подробный, практический протокол для проведения экспериментальной проверки новой физической гипотезы включаяпример:поисклёгкихслабовзаимодействующихчастиц—WISPsвключая пример: поиск лёгких слабо взаимодействующих частиц — WISPsвключаяпример:поисклёгкихслабовзаимодействующихчастиц—WISPs. Протокол покрывает: контролируемые условия, план сбора и проверки данных, статистические методы для открытия/ограничений, тесты воспроизводимости и систематическую оценку/учёт.
Формулировка гипотезы и измеримой сигнатуры
Чётко записать H0 фон/нетсигналафон/нет сигналафон/нетсигнала и H1 сигнал+фонсигнал + фонсигнал+фон: какие наблюдаемые величины меняются энергия,временнаяструктура,угловоераспределение,исчезающиемероприятияит.п.энергия, временная структура, угловое распределение, исчезающие мероприятия и т. п.энергия,временнаяструктура,угловоераспределение,исчезающиемероприятияит.п..Описать сигнатуру сигнала в детекторе и ожидаемые побочные проявления.Составить список потенциальных фоновых процессов и их ожидаемую величину/форму.
Управляемые условия и мониторинг
Управляемые параметры эксперимента: энергия/поток пучка, интенсивность, разрядное напряжение HVHVHV, температура/влажность, магнитные поля, геометрия экрана/мишени, состав среды.Непрерывный мониторинг: логирование всех параметров с метками времени, статистикой и тревогами при выходе за допустимые пределы.Специальные контрольные режимы:"Off-target" или пустая-мишень backgroundonlybackground onlybackgroundonly.Различные мощности/энергии пучка для проверки масштаба сигнала ∝ интенсивности.Смены конфигурации напр.,включение/выключениеэкранированиянапр., включение/выключение экранированиянапр.,включение/выключениеэкранирования для проверки отклика на систему.Калибровочные данные: регулярные калибровочные запуски источники,тестовыеимпульсы,космическиемюоны,тест−бимыисточники, тестовые импульсы, космические мюоны, тест-бимыисточники,тестовыеимпульсы,космическиемюоны,тест−бимы для восстановления энергоразрешения, временной синхронизации, эффективностей.
Дизайн набора данных и стратегия "слепого" анализа
Предрегистрация анализа: задокументировать в репозитории критерии отбора, статистическую модель, тестовую статистику и критерий открытия до снятия "слепоты".Blinding: скрыть сигнал-область при разработке выбора и систематик например,случайнаямаскировкачисласобытийвсигнал−окнеилисмещениеключевойвеличинынапример, случайная маскировка числа событий в сигнал-окне или смещение ключевой величинынапример,случайнаямаскировкачисласобытийвсигнал−окнеилисмещениеключевойвеличины.Разделение данных: контрольная часть для разработки/калибровок, валидационная сайдбэндсайдбэндсайдбэнд и сигнал-высыпаемая часть; либо k-fold перекрестная проверка."Injection tests": добавление синтетического сигнала в сырые данные blindinjectionsblind injectionsblindinjections, выполняемое одним участником и распознавание другим, чтобы проверить чувствительность и отсутствие бага в анализе.
Оценка фонов — комбинированный подход
Модели из MC + корректировки из данных: настроить MC на контрольных регионах sidebandssidebandssidebands с вычислением scale factors и их неопределённостей.Data-driven методы: sideband-fitting, ABCD-метод двенезависимыепеременныедве независимые переменныедвенезависимыепеременные, control-region extrapolation, template-fitting.Нелинейные фоны/редкие фоны: использовать специализированные контрольные прогоны например,off−targetнапример, off-targetнапример,off−target или внешние измерения.Проверка устойчивости: сравнить несколько независимых методов оценки фона; различия включить как систематику.
Статистическая модель и процедуры вывода
Построить полную вероятностную функцию likelihoodlikelihoodlikelihood Ldata∣μ,θdata | μ, θdata∣μ,θ, где μ — сила сигнала interestparameterinterest parameterinterestparameter, θ — набор nuisance-параметров систематикисистематикисистематики.Для событийного счёта с малыми числами: использовать Poisson likelihood, сохранять целостность дискретности.Оценка параметров:Частотный подход: профильный likelihood ratio λμμμ для оценки μ и построения доверительных интервалов; использовать асимптотические приближения Wilks,WaldWilks, WaldWilks,Wald только после проверки на адекватность; при малых статистиках — строить распределения тест-статистики с помощью MC toyMCtoy MCtoyMC.Bayesian подход: если выбран, явно оговорить априор на μ и θ; интегрировать маргинализироватьмаргинализироватьмаргинализировать nuisance-параметры.Критерий открытия: прескриптовано — 5σ locallocallocal для объявления открытия; учитывать look-elsewhere effect LEELEELEE при поиске по диапазону параметров см.нижесм. нижесм.ниже.Ограничения: для неудачи в обнаружении — строить верхние пределы μ_up с доверительностью 90%/95% частотный:profilelikelihoodCLsилиFeldman–Cousins;Bayesian:credibleintervalsприоговорённомаприоречастотный: profile likelihood CLs или Feldman–Cousins; Bayesian: credible intervals при оговорённом априоречастотный:profilelikelihoodCLsилиFeldman–Cousins;Bayesian:credibleintervalsприоговорённомаприоре.CLs метод рекомендуется для предотвращения чрезмерно строгих исключений при флуктуациях фона.Комбинация каналов: комбинировать likelihood’и, учитывая корреляции систематик совместныйнаборnuisanceскорреляционнойматрицейсовместный набор nuisance с корреляционной матрицейсовместныйнаборnuisanceскорреляционнойматрицей.
Обработка nuisance-параметров и систематик
Классификация систематик:Нормировочные падение/увеличениечисласобытийпадение/увеличение числа событийпадение/увеличениечисласобытий — e.g., эффективность, интегральная интенсивность.Формовые shapeshapeshape — искажение распределений.Детекторные — энергошкалирование, разрешение, тайминг.Фоновые моделирования — кросс-секции, спектры.Описание в модели: ввести nuisance-параметры θ с априорными распределениями частотный:constraintterms,Gaussian/Log−normal;Bayesian:priorsчастотный: constraint terms, Gaussian/Log-normal; Bayesian: priorsчастотный:constraintterms,Gaussian/Log−normal;Bayesian:priors.Оценка величин систематик:Из калибровок, контрольных областей, независимых измерений, сравнений разных MC и вариаций модели.Для формовых систематик: создать альтернативные шаблоны и включить интерполяцию morphingmorphingmorphing в likelihood.Пропагирование: профилирование частотныйчастотныйчастотный или маргинализация BayesianBayesianBayesian по θ в итоговых интервалах.Валидация: делать "pull" и "constraint" диагностические графики после фитирования, чтобы убедиться, что nuisance-параметры не "прилипают" к крайним значениям или не получают противоречивых значений.Таблица систематик: для публикации обязательно представить полный бюджет: источник, метод оценки, влияние на сигнал/ограничения абсолютноеиотносительноеабсолютное и относительноеабсолютноеиотносительное.
Тесты устойчивости и проверки воспроизводимости
Robustness checks:Варьировать критерии отбора cutvariationscut variationscutvariations и показать стабильность результата.Альтернативная реконструкция/алгоритмы PID / алгоритмы кластеризации.Разделение данных по времени, по диапазонам детектора или по конфигурациям оборудования.Null tests:Проверки в областях, где сигнала не ожидают sidebands,off−targetsidebands, off-targetsidebands,off−target.Permutation/randomization tests.Reproducibility:Наличие независимого анализа втораякоманда/анализервторая команда/анализервтораякоманда/анализер, blind cross-check.Полная версия кода, конфигураций, MC и описаний сохранённая в системе контроля версий gitgitgit и контейнеризированная Docker/SingularityDocker/SingularityDocker/Singularity, чтобы любой мог воспроизвести.Логирование окружения версиибиблиотек,компиляторовверсии библиотек, компиляторовверсиибиблиотек,компиляторов.Сохранённые «snapshot» данных и условий metadatametadatametadata.Публичные публикации вспомогательных материалов кодыоткликадетектора,таблицысистематик,likelihood−файлы/workspaceкоды отклика детектора, таблицы систематик, likelihood-файлы / workspaceкодыоткликадетектора,таблицысистематик,likelihood−файлы/workspace, если возможно.
Обработка эффекта "look-elsewhere" и множественных сравнений
Если поиск сканирует по параметру масса,константасвязимасса, константа связимасса,константасвязи, оценить локальные p-values и затем скорректировать до глобальных p-values:Метод MC: генерировать большое число псевдо-выборок без сигнала, находить максимум тест-статистики в сканируемом диапазоне, и оценивать долю превышений — прямой способ.При больших вычислительных затратах — аппроксимации (Gross & Vitells).Для множества независимых тестов использовать поправки BonferroniкакгрубаяоценкаBonferroni как грубая оценкаBonferroniкакгрубаяоценка, но MC даёт наиболее корректную коррекцию.
Малые числа событий — точные методы и проверка покрываемости
При небольших счетах применять точные конструкции Feldman–CousinsFeldman–CousinsFeldman–Cousins для доверительных интервалов, или строить частотные интервалы через Neyman-конструкцию с Toy MC, чтобы контролировать покрываемость.Для Poisson с фоновым вкладом учитывать неопределённость фона поэтомунужныконсервативныеподходыилиMC−профилированиепоэтому нужны консервативные подходы или MC-профилированиепоэтомунужныконсервативныеподходыилиMC−профилирование.
Диагностика и тесты качества модели
Goodness-of-fit: χ²/ndf, Kolmogorov–Smirnov, likelihood-ratio GOF тесты; использовать MC для калибровки распределений тест-статистики.Pull- и residual-плотности для шаблонов и данных.Верификация покрываемости: пропускать наборы синтетических данных со встроленным сигналом/без сигнала и проверять, что частотные интервалы покрывают истинное значение с нужной вероятностью.Sensitivity studies: Asimov dataset для расчёта ожидаемой значимости/пределов; скан чувствительности по вариациям систематик.
Документация и распространение результатов
Перед снятием слепоты: зафиксировать в электронном лог-файле версии кода, критерии отбора, описания систематик и ожидаемую чувствительность.При публикации: изложить все предположения, complete likelihood model илиworkspaceили workspaceилиworkspace, таблицы систематик, корреляции, детализированные описания контрольных регионов и тестов.Релизы данных и анализ-репозиториев повозможностипо возможностиповозможности для внешней верификации.
Практические дополнительные рекомендации/инструменты
Используемые пакеты: ROOT/RooFit/RooStats, pyhf открытыйlikelihoodоткрытый likelihoodоткрытыйlikelihood, BAT, Stan/PyMC3 для байесовских анализов; но выбор зависит от эксперимента.Автоматизация: pipeline для продуктивного и верификационного анализа CI/CDCI/CDCI/CD, unit-тесты для ключевых функций.Резервное копирование и архивация данных/работочих пространств.
Пример рабочего сценария для поиска WISP конкретизацияконкретизацияконкретизация
Дизайн: использовать beam-dump / fixed-target; искать фотон-исчезновение/новые частицы через восстановление недостающей энергии/временной задержки.Контролируемые режимы: пустая мишень, varying shielding, low/high beam intensity.Фоновые оценки: cosmics, нейтральные пучки, рассеяние, вторичные частицы — data-driven sidebands + MC tuned to calibration runs.Stat: профильный likelihood; discovery threshold 5σ local с последующей оценкой LEE; CLs при установлении пределов; toy-MC для маленьких ночей.Систематики: детекторная эффективность изисточниковиз источниковизисточников, моделирование передачи изтест−бимаиз тест-бимаизтест−бима, beam normalization мониторинтенсивностиснезависимойкалибровкоймонитор интенсивности с независимой калибровкоймониторинтенсивностиснезависимойкалибровкой.
Контроль ошибок check−listcheck-listcheck−list
Были ли пред-зарегистрированы критерии?Есть ли слепой этап и процедура unblinding?Получены ли независимые проверки втораякомандавторая командавтораякоманда?Проведены ли injection / blind-injection тесты?Оценены ли и декомпозированы все систематические ошибки?Проверена ли покрываемость и коррекция LEE?Сохранены ли все материалы код/данныекод/данныекод/данные для воспроизводимости?
Заключение Хорошая экспериментальная процедура — это сочетание строгой предрегистрации анализа, слепого подхода, многоуровневой оценки фонов MC+data−drivenMC + data-drivenMC+data−driven, корректного учета систематик через nuisance-параметры и профилирование/маргинализацию, проверки стабильности вариацииcut’ов,альтернативныеалгоритмы,независимыеанализывариации cut’ов, альтернативные алгоритмы, независимые анализывариацииcut’ов,альтернативныеалгоритмы,независимыеанализы и воспроизводимости версионирование,контейнеризация,открытыеauxiliary−dataверсионирование, контейнеризация, открытые auxiliary-dataверсионирование,контейнеризация,открытыеauxiliary−data. Для сложных и чувствительных поисков какWISPкак WISPкакWISP ключевыми являются контроль фоновых источников и тщательная проверка эффекта look-elsewhere.
Если хотите, могу:
Составить конкретный чек-лист/шаблон для протокола вашего эксперимента.Предложить пример likelihood модели формулыформулыформулы и примерный код RooFit/pyhfRooFit/pyhfRooFit/pyhf для демонстрации.
Ниже — подробный, практический протокол для проведения экспериментальной проверки новой физической гипотезы включаяпример:поисклёгкихслабовзаимодействующихчастиц—WISPsвключая пример: поиск лёгких слабо взаимодействующих частиц — WISPsвключаяпример:поисклёгкихслабовзаимодействующихчастиц—WISPs. Протокол покрывает: контролируемые условия, план сбора и проверки данных, статистические методы для открытия/ограничений, тесты воспроизводимости и систематическую оценку/учёт.
Формулировка гипотезы и измеримой сигнатуры
Чётко записать H0 фон/нетсигналафон/нет сигналафон/нетсигнала и H1 сигнал+фонсигнал + фонсигнал+фон: какие наблюдаемые величины меняются энергия,временнаяструктура,угловоераспределение,исчезающиемероприятияит.п.энергия, временная структура, угловое распределение, исчезающие мероприятия и т. п.энергия,временнаяструктура,угловоераспределение,исчезающиемероприятияит.п..Описать сигнатуру сигнала в детекторе и ожидаемые побочные проявления.Составить список потенциальных фоновых процессов и их ожидаемую величину/форму.Управляемые условия и мониторинг
Управляемые параметры эксперимента: энергия/поток пучка, интенсивность, разрядное напряжение HVHVHV, температура/влажность, магнитные поля, геометрия экрана/мишени, состав среды.Непрерывный мониторинг: логирование всех параметров с метками времени, статистикой и тревогами при выходе за допустимые пределы.Специальные контрольные режимы:"Off-target" или пустая-мишень backgroundonlybackground onlybackgroundonly.Различные мощности/энергии пучка для проверки масштаба сигнала ∝ интенсивности.Смены конфигурации напр.,включение/выключениеэкранированиянапр., включение/выключение экранированиянапр.,включение/выключениеэкранирования для проверки отклика на систему.Калибровочные данные: регулярные калибровочные запуски источники,тестовыеимпульсы,космическиемюоны,тест−бимыисточники, тестовые импульсы, космические мюоны, тест-бимыисточники,тестовыеимпульсы,космическиемюоны,тест−бимы для восстановления энергоразрешения, временной синхронизации, эффективностей.Дизайн набора данных и стратегия "слепого" анализа
Предрегистрация анализа: задокументировать в репозитории критерии отбора, статистическую модель, тестовую статистику и критерий открытия до снятия "слепоты".Blinding: скрыть сигнал-область при разработке выбора и систематик например,случайнаямаскировкачисласобытийвсигнал−окнеилисмещениеключевойвеличинынапример, случайная маскировка числа событий в сигнал-окне или смещение ключевой величинынапример,случайнаямаскировкачисласобытийвсигнал−окнеилисмещениеключевойвеличины.Разделение данных: контрольная часть для разработки/калибровок, валидационная сайдбэндсайдбэндсайдбэнд и сигнал-высыпаемая часть; либо k-fold перекрестная проверка."Injection tests": добавление синтетического сигнала в сырые данные blindinjectionsblind injectionsblindinjections, выполняемое одним участником и распознавание другим, чтобы проверить чувствительность и отсутствие бага в анализе.Оценка фонов — комбинированный подход
Модели из MC + корректировки из данных: настроить MC на контрольных регионах sidebandssidebandssidebands с вычислением scale factors и их неопределённостей.Data-driven методы: sideband-fitting, ABCD-метод двенезависимыепеременныедве независимые переменныедвенезависимыепеременные, control-region extrapolation, template-fitting.Нелинейные фоны/редкие фоны: использовать специализированные контрольные прогоны например,off−targetнапример, off-targetнапример,off−target или внешние измерения.Проверка устойчивости: сравнить несколько независимых методов оценки фона; различия включить как систематику.Статистическая модель и процедуры вывода
Построить полную вероятностную функцию likelihoodlikelihoodlikelihood Ldata∣μ,θdata | μ, θdata∣μ,θ, где μ — сила сигнала interestparameterinterest parameterinterestparameter, θ — набор nuisance-параметров систематикисистематикисистематики.Для событийного счёта с малыми числами: использовать Poisson likelihood, сохранять целостность дискретности.Оценка параметров:Частотный подход: профильный likelihood ratio λμμμ для оценки μ и построения доверительных интервалов; использовать асимптотические приближения Wilks,WaldWilks, WaldWilks,Wald только после проверки на адекватность; при малых статистиках — строить распределения тест-статистики с помощью MC toyMCtoy MCtoyMC.Bayesian подход: если выбран, явно оговорить априор на μ и θ; интегрировать маргинализироватьмаргинализироватьмаргинализировать nuisance-параметры.Критерий открытия: прескриптовано — 5σ locallocallocal для объявления открытия; учитывать look-elsewhere effect LEELEELEE при поиске по диапазону параметров см.нижесм. нижесм.ниже.Ограничения: для неудачи в обнаружении — строить верхние пределы μ_up с доверительностью 90%/95% частотный:profilelikelihoodCLsилиFeldman–Cousins;Bayesian:credibleintervalsприоговорённомаприоречастотный: profile likelihood CLs или Feldman–Cousins; Bayesian: credible intervals при оговорённом априоречастотный:profilelikelihoodCLsилиFeldman–Cousins;Bayesian:credibleintervalsприоговорённомаприоре.CLs метод рекомендуется для предотвращения чрезмерно строгих исключений при флуктуациях фона.Комбинация каналов: комбинировать likelihood’и, учитывая корреляции систематик совместныйнаборnuisanceскорреляционнойматрицейсовместный набор nuisance с корреляционной матрицейсовместныйнаборnuisanceскорреляционнойматрицей.Обработка nuisance-параметров и систематик
Классификация систематик:Нормировочные падение/увеличениечисласобытийпадение/увеличение числа событийпадение/увеличениечисласобытий — e.g., эффективность, интегральная интенсивность.Формовые shapeshapeshape — искажение распределений.Детекторные — энергошкалирование, разрешение, тайминг.Фоновые моделирования — кросс-секции, спектры.Описание в модели: ввести nuisance-параметры θ с априорными распределениями частотный:constraintterms,Gaussian/Log−normal;Bayesian:priorsчастотный: constraint terms, Gaussian/Log-normal; Bayesian: priorsчастотный:constraintterms,Gaussian/Log−normal;Bayesian:priors.Оценка величин систематик:Из калибровок, контрольных областей, независимых измерений, сравнений разных MC и вариаций модели.Для формовых систематик: создать альтернативные шаблоны и включить интерполяцию morphingmorphingmorphing в likelihood.Пропагирование: профилирование частотныйчастотныйчастотный или маргинализация BayesianBayesianBayesian по θ в итоговых интервалах.Валидация: делать "pull" и "constraint" диагностические графики после фитирования, чтобы убедиться, что nuisance-параметры не "прилипают" к крайним значениям или не получают противоречивых значений.Таблица систематик: для публикации обязательно представить полный бюджет: источник, метод оценки, влияние на сигнал/ограничения абсолютноеиотносительноеабсолютное и относительноеабсолютноеиотносительное.Тесты устойчивости и проверки воспроизводимости
Robustness checks:Варьировать критерии отбора cutvariationscut variationscutvariations и показать стабильность результата.Альтернативная реконструкция/алгоритмы PID / алгоритмы кластеризации.Разделение данных по времени, по диапазонам детектора или по конфигурациям оборудования.Null tests:Проверки в областях, где сигнала не ожидают sidebands,off−targetsidebands, off-targetsidebands,off−target.Permutation/randomization tests.Reproducibility:Наличие независимого анализа втораякоманда/анализервторая команда/анализервтораякоманда/анализер, blind cross-check.Полная версия кода, конфигураций, MC и описаний сохранённая в системе контроля версий gitgitgit и контейнеризированная Docker/SingularityDocker/SingularityDocker/Singularity, чтобы любой мог воспроизвести.Логирование окружения версиибиблиотек,компиляторовверсии библиотек, компиляторовверсиибиблиотек,компиляторов.Сохранённые «snapshot» данных и условий metadatametadatametadata.Публичные публикации вспомогательных материалов кодыоткликадетектора,таблицысистематик,likelihood−файлы/workspaceкоды отклика детектора, таблицы систематик, likelihood-файлы / workspaceкодыоткликадетектора,таблицысистематик,likelihood−файлы/workspace, если возможно.Обработка эффекта "look-elsewhere" и множественных сравнений
Если поиск сканирует по параметру масса,константасвязимасса, константа связимасса,константасвязи, оценить локальные p-values и затем скорректировать до глобальных p-values:Метод MC: генерировать большое число псевдо-выборок без сигнала, находить максимум тест-статистики в сканируемом диапазоне, и оценивать долю превышений — прямой способ.При больших вычислительных затратах — аппроксимации (Gross & Vitells).Для множества независимых тестов использовать поправки BonferroniкакгрубаяоценкаBonferroni как грубая оценкаBonferroniкакгрубаяоценка, но MC даёт наиболее корректную коррекцию.Малые числа событий — точные методы и проверка покрываемости
При небольших счетах применять точные конструкции Feldman–CousinsFeldman–CousinsFeldman–Cousins для доверительных интервалов, или строить частотные интервалы через Neyman-конструкцию с Toy MC, чтобы контролировать покрываемость.Для Poisson с фоновым вкладом учитывать неопределённость фона поэтомунужныконсервативныеподходыилиMC−профилированиепоэтому нужны консервативные подходы или MC-профилированиепоэтомунужныконсервативныеподходыилиMC−профилирование.Диагностика и тесты качества модели
Goodness-of-fit: χ²/ndf, Kolmogorov–Smirnov, likelihood-ratio GOF тесты; использовать MC для калибровки распределений тест-статистики.Pull- и residual-плотности для шаблонов и данных.Верификация покрываемости: пропускать наборы синтетических данных со встроленным сигналом/без сигнала и проверять, что частотные интервалы покрывают истинное значение с нужной вероятностью.Sensitivity studies: Asimov dataset для расчёта ожидаемой значимости/пределов; скан чувствительности по вариациям систематик.Документация и распространение результатов
Перед снятием слепоты: зафиксировать в электронном лог-файле версии кода, критерии отбора, описания систематик и ожидаемую чувствительность.При публикации: изложить все предположения, complete likelihood model илиworkspaceили workspaceилиworkspace, таблицы систематик, корреляции, детализированные описания контрольных регионов и тестов.Релизы данных и анализ-репозиториев повозможностипо возможностиповозможности для внешней верификации.Практические дополнительные рекомендации/инструменты
Используемые пакеты: ROOT/RooFit/RooStats, pyhf открытыйlikelihoodоткрытый likelihoodоткрытыйlikelihood, BAT, Stan/PyMC3 для байесовских анализов; но выбор зависит от эксперимента.Автоматизация: pipeline для продуктивного и верификационного анализа CI/CDCI/CDCI/CD, unit-тесты для ключевых функций.Резервное копирование и архивация данных/работочих пространств.Пример рабочего сценария для поиска WISP конкретизацияконкретизацияконкретизация
Дизайн: использовать beam-dump / fixed-target; искать фотон-исчезновение/новые частицы через восстановление недостающей энергии/временной задержки.Контролируемые режимы: пустая мишень, varying shielding, low/high beam intensity.Фоновые оценки: cosmics, нейтральные пучки, рассеяние, вторичные частицы — data-driven sidebands + MC tuned to calibration runs.Stat: профильный likelihood; discovery threshold 5σ local с последующей оценкой LEE; CLs при установлении пределов; toy-MC для маленьких ночей.Систематики: детекторная эффективность изисточниковиз источниковизисточников, моделирование передачи изтест−бимаиз тест-бимаизтест−бима, beam normalization мониторинтенсивностиснезависимойкалибровкоймонитор интенсивности с независимой калибровкоймониторинтенсивностиснезависимойкалибровкой.Контроль ошибок check−listcheck-listcheck−list
Были ли пред-зарегистрированы критерии?Есть ли слепой этап и процедура unblinding?Получены ли независимые проверки втораякомандавторая командавтораякоманда?Проведены ли injection / blind-injection тесты?Оценены ли и декомпозированы все систематические ошибки?Проверена ли покрываемость и коррекция LEE?Сохранены ли все материалы код/данныекод/данныекод/данные для воспроизводимости?Заключение
Хорошая экспериментальная процедура — это сочетание строгой предрегистрации анализа, слепого подхода, многоуровневой оценки фонов MC+data−drivenMC + data-drivenMC+data−driven, корректного учета систематик через nuisance-параметры и профилирование/маргинализацию, проверки стабильности вариацииcut’ов,альтернативныеалгоритмы,независимыеанализывариации cut’ов, альтернативные алгоритмы, независимые анализывариацииcut’ов,альтернативныеалгоритмы,независимыеанализы и воспроизводимости версионирование,контейнеризация,открытыеauxiliary−dataверсионирование, контейнеризация, открытые auxiliary-dataверсионирование,контейнеризация,открытыеauxiliary−data. Для сложных и чувствительных поисков какWISPкак WISPкакWISP ключевыми являются контроль фоновых источников и тщательная проверка эффекта look-elsewhere.
Если хотите, могу:
Составить конкретный чек-лист/шаблон для протокола вашего эксперимента.Предложить пример likelihood модели формулыформулыформулы и примерный код RooFit/pyhfRooFit/pyhfRooFit/pyhf для демонстрации.