На примере данных миссии Kepler выполните анализ световой кривой с транзитами и ограниченными шумами: как различать систематические шумы, звездную вариабельность и истинные транзиты малых планет
Краткий, практический план анализа кривой блеска Kepler для отделения систематик, звездной вариабельности и истинных транзитов малых планет, с объяснениями и ключевыми формулами. 1) Предобработка данных - Удалить каденции с флагами качества (safe mode, momentum dumps). - Сшить кварталы, приведя к единой шкале (нормализация по медиане каждого квартала). - Учесть каденс долгой съемки: Δt=29.4 min\Delta t = 29.4\ \mathrm{min}Δt=29.4min (Kepler LC). 2) Первичная оценка шума и сигналов - Оценить стандартное отклонение вне транзитов: σ\sigmaσ (per-cadence). - Ожидаемая глубина малого тела: δ=(RpR∗)2\delta = \left(\dfrac{R_p}{R_*}\right)^2δ=(R∗Rp)2. - Приближённое SNR для кандидата: SNR=δσNtr⋅TdurΔt,
\mathrm{SNR} = \dfrac{\delta}{\sigma}\sqrt{N_{\mathrm{tr}}\cdot \dfrac{T_{\mathrm{dur}}}{\Delta t}}, SNR=σδNtr⋅ΔtTdur,
где NtrN_{\mathrm{tr}}Ntr — число транзитов, TdurT_{\mathrm{dur}}Tdur — продолжительность транзита. 3) Детрэндинг, сохраняющий транзиты - Маскировать предполагаемые транзиты (или использовать итеративный подход). - Методы: локальная полиномиальная фильтрация/LOESS, Savitzky–Golay с окном >2 − 3 Tdur> 2\!-\!3\,T_{\mathrm{dur}}>2−3Tdur, или фильтр CoFiAM/Wotan. - Более гибко: модель GP для звездной вариабельности (см. п.5). 4) Удаление инструментальных систематик - Использовать общие тренды других звёзд (cotending basis vectors — CBVs) или PCA/SVD на наборе соседних звёзд: систематики проявляются ко-вариантно. - Признаки систематики: резкие скачки в масштабе всего кадра, квартальные стыки, периодичность, совпадающая по времени у многих звёзд. - Проверить, исчезает ли сигнал после удаления CBV; если да — вероятно систематика. 5) Моделирование звездной вариабельности (GP) - Подходит для спотов и ротационной модуляции. Часто используют квази-периодическое ядро: k(τ)=A2exp (−τ22λ2−Γsin2 (πτProt)),
k(\tau)=A^2\exp\!\left(-\frac{\tau^2}{2\lambda^2}-\Gamma\sin^2\!\left(\frac{\pi\tau}{P_{\mathrm{rot}}}\right)\right), k(τ)=A2exp(−2λ2τ2−Γsin2(Protπτ)),
где τ\tauτ — лаг, ProtP_{\mathrm{rot}}Prot — период вращения, A,λ,ΓA,\lambda,\GammaA,λ,Γ — параметры. - GP позволяет отделить гладкую вариабельность от коротких острых транзитов. 6) Поиск транзитов - BLS (box least squares) или Transit Least Squares (TLS, лучше для малых планет — учитывает форму транзита). - Оценивают SDE/MES; Kepler традиционно использовал порог MES≥7.1\mathrm{MES}\ge 7.1MES≥7.1. - Фолдинг по найденному периоду и просмотр развернутой фазы. 7) Визуальный и автоматизированный ветринг (vetting) - Odd–even тест: сравнить глубины нечетных и четных транзитов (проверка на двукратный период — ЭБ). - Поиск вторичного парного сигнала в фолдинге (secondary eclipse) — у планеты глубокого вторичного не должно быть. - Анализ фазовой кривой: наличие V-образного сигнала типично для эб, не U-образного для планеты. - Центроидная проверка: изменение положения центра света во время транзита указывает на фонового эб/контаминацию. - Проверить соседние пенты апертуры: сигнал у источника-мишени или у соседних пикселей. 8) Фитинг транзита - Модель Mandel & Agol с учетoм лимб-дауннинга; параметры: Rp/R∗R_p/R_*Rp/R∗, a/R∗a/R_*a/R∗, bbb, PPP, T0T_0T0. - Оценить погрешности MCMC/NUTS. - Теоретическая продолжительность для круговой орбиты (приближенно): Tdur≈PR∗πa1−b2.
T_{\mathrm{dur}} \approx \dfrac{P R_*}{\pi a}\sqrt{1-b^2}. Tdur≈πaPR∗1−b2.
Связь полуоси aaa с периодом: a≈(GM∗P24π2)1/3.
a \approx \left(\dfrac{G M_* P^2}{4\pi^2}\right)^{1/3}. a≈(4π2GM∗P2)1/3. 9) Статистические критерии и модельное сравнение - Сравнить модели «GP + транзит» и «GP только» по BIC/AIC/логарифму правдоподобия: BIC=klnn−2lnL^,
\mathrm{BIC}=k\ln n - 2\ln\hat{L}, BIC=klnn−2lnL^,
где kkk — число параметров, nnn — число точек, L^\hat{L}L^ — максимум правдоподобия. - Использовать бутстрэп/перестановки для оценки ложных срабатываний и FAP. 10) Валидация низко-SNR сигналов - Инъекция и восстановление: ввести синтетические транзиты с разными δ,P\delta,Pδ,P в исходную кривую, прогнать весь пайплайн и оценить recovery rate. - Если восстановление неустойчиво при похожих параметрах — вероятность ложного обнаружения высока. 11) Признаки систематики против звездной вариабельности против транзита (резюме) - Систематика: ко-вариантность у множества звёзд, совпадение с известными событиями (технические), исчезает при CBV/PCA. - Звёздная вариабельность: часто квазипериодична, синусоидальные/ассиметричные формы, хорошо моделируется GP/гармониками, времена изменений связаны с ProtP_{\mathrm{rot}}Prot. - Истинный транзит: короткая, регулярная, U-образная глубина постоянна, центр не смещается в кадре, проходит проверки odd–even и absence of secondary, форма согласуется с моделями затмения, устойчив к разным методам детрэндинга, проходит injection‑recovery. 12) Практические советы - Использовать несколько методов детрэндинга и требовать согласованности кандидата. - Маскировать транзиты перед детрэндингом или применять методы, konservирующие короткие сигналы. - Для малых планет ориентироваться на TLS + GP + injection‑recovery. - Проверять centroid/pixel-level lightcurves для выявления контаминации. Если нужно, могу прислать пример рабочего пайплайна (псевдокод) с использованием конкретных шагов (загрузка Kepler, CBV, GP, TLS, MCMC) и ссылками на популярные библиотеки.
1) Предобработка данных
- Удалить каденции с флагами качества (safe mode, momentum dumps).
- Сшить кварталы, приведя к единой шкале (нормализация по медиане каждого квартала).
- Учесть каденс долгой съемки: Δt=29.4 min\Delta t = 29.4\ \mathrm{min}Δt=29.4 min (Kepler LC).
2) Первичная оценка шума и сигналов
- Оценить стандартное отклонение вне транзитов: σ\sigmaσ (per-cadence).
- Ожидаемая глубина малого тела: δ=(RpR∗)2\delta = \left(\dfrac{R_p}{R_*}\right)^2δ=(R∗ Rp )2.
- Приближённое SNR для кандидата:
SNR=δσNtr⋅TdurΔt, \mathrm{SNR} = \dfrac{\delta}{\sigma}\sqrt{N_{\mathrm{tr}}\cdot \dfrac{T_{\mathrm{dur}}}{\Delta t}},
SNR=σδ Ntr ⋅ΔtTdur , где NtrN_{\mathrm{tr}}Ntr — число транзитов, TdurT_{\mathrm{dur}}Tdur — продолжительность транзита.
3) Детрэндинг, сохраняющий транзиты
- Маскировать предполагаемые транзиты (или использовать итеративный подход).
- Методы: локальная полиномиальная фильтрация/LOESS, Savitzky–Golay с окном >2 − 3 Tdur> 2\!-\!3\,T_{\mathrm{dur}}>2−3Tdur , или фильтр CoFiAM/Wotan.
- Более гибко: модель GP для звездной вариабельности (см. п.5).
4) Удаление инструментальных систематик
- Использовать общие тренды других звёзд (cotending basis vectors — CBVs) или PCA/SVD на наборе соседних звёзд: систематики проявляются ко-вариантно.
- Признаки систематики: резкие скачки в масштабе всего кадра, квартальные стыки, периодичность, совпадающая по времени у многих звёзд.
- Проверить, исчезает ли сигнал после удаления CBV; если да — вероятно систематика.
5) Моделирование звездной вариабельности (GP)
- Подходит для спотов и ротационной модуляции. Часто используют квази-периодическое ядро:
k(τ)=A2exp (−τ22λ2−Γsin2 (πτProt)), k(\tau)=A^2\exp\!\left(-\frac{\tau^2}{2\lambda^2}-\Gamma\sin^2\!\left(\frac{\pi\tau}{P_{\mathrm{rot}}}\right)\right),
k(τ)=A2exp(−2λ2τ2 −Γsin2(Prot πτ )), где τ\tauτ — лаг, ProtP_{\mathrm{rot}}Prot — период вращения, A,λ,ΓA,\lambda,\GammaA,λ,Γ — параметры.
- GP позволяет отделить гладкую вариабельность от коротких острых транзитов.
6) Поиск транзитов
- BLS (box least squares) или Transit Least Squares (TLS, лучше для малых планет — учитывает форму транзита).
- Оценивают SDE/MES; Kepler традиционно использовал порог MES≥7.1\mathrm{MES}\ge 7.1MES≥7.1.
- Фолдинг по найденному периоду и просмотр развернутой фазы.
7) Визуальный и автоматизированный ветринг (vetting)
- Odd–even тест: сравнить глубины нечетных и четных транзитов (проверка на двукратный период — ЭБ).
- Поиск вторичного парного сигнала в фолдинге (secondary eclipse) — у планеты глубокого вторичного не должно быть.
- Анализ фазовой кривой: наличие V-образного сигнала типично для эб, не U-образного для планеты.
- Центроидная проверка: изменение положения центра света во время транзита указывает на фонового эб/контаминацию.
- Проверить соседние пенты апертуры: сигнал у источника-мишени или у соседних пикселей.
8) Фитинг транзита
- Модель Mandel & Agol с учетoм лимб-дауннинга; параметры: Rp/R∗R_p/R_*Rp /R∗ , a/R∗a/R_*a/R∗ , bbb, PPP, T0T_0T0 .
- Оценить погрешности MCMC/NUTS.
- Теоретическая продолжительность для круговой орбиты (приближенно):
Tdur≈PR∗πa1−b2. T_{\mathrm{dur}} \approx \dfrac{P R_*}{\pi a}\sqrt{1-b^2}.
Tdur ≈πaPR∗ 1−b2 . Связь полуоси aaa с периодом:
a≈(GM∗P24π2)1/3. a \approx \left(\dfrac{G M_* P^2}{4\pi^2}\right)^{1/3}.
a≈(4π2GM∗ P2 )1/3.
9) Статистические критерии и модельное сравнение
- Сравнить модели «GP + транзит» и «GP только» по BIC/AIC/логарифму правдоподобия:
BIC=klnn−2lnL^, \mathrm{BIC}=k\ln n - 2\ln\hat{L},
BIC=klnn−2lnL^, где kkk — число параметров, nnn — число точек, L^\hat{L}L^ — максимум правдоподобия.
- Использовать бутстрэп/перестановки для оценки ложных срабатываний и FAP.
10) Валидация низко-SNR сигналов
- Инъекция и восстановление: ввести синтетические транзиты с разными δ,P\delta,Pδ,P в исходную кривую, прогнать весь пайплайн и оценить recovery rate.
- Если восстановление неустойчиво при похожих параметрах — вероятность ложного обнаружения высока.
11) Признаки систематики против звездной вариабельности против транзита (резюме)
- Систематика: ко-вариантность у множества звёзд, совпадение с известными событиями (технические), исчезает при CBV/PCA.
- Звёздная вариабельность: часто квазипериодична, синусоидальные/ассиметричные формы, хорошо моделируется GP/гармониками, времена изменений связаны с ProtP_{\mathrm{rot}}Prot .
- Истинный транзит: короткая, регулярная, U-образная глубина постоянна, центр не смещается в кадре, проходит проверки odd–even и absence of secondary, форма согласуется с моделями затмения, устойчив к разным методам детрэндинга, проходит injection‑recovery.
12) Практические советы
- Использовать несколько методов детрэндинга и требовать согласованности кандидата.
- Маскировать транзиты перед детрэндингом или применять методы, konservирующие короткие сигналы.
- Для малых планет ориентироваться на TLS + GP + injection‑recovery.
- Проверять centroid/pixel-level lightcurves для выявления контаминации.
Если нужно, могу прислать пример рабочего пайплайна (псевдокод) с использованием конкретных шагов (загрузка Kepler, CBV, GP, TLS, MCMC) и ссылками на популярные библиотеки.