Дан фоторяды с аэрофотосъёмки и спутниковыми снимками одного и того же промышленного полигона в разные годы; как с помощью фотограмметрии и дистанционного зондирования выявить динамику загрязнений почвы и вод, какие индексы или методы обработки примените и как оцените погрешности результата?
Кратко — последовательность действий, набор индексов/методов и оценка погрешностей. 1) Подготовка данных (обязательна) - Геокоррекция и точная ко-регистрация всех снимков (ошибка сдвига должна быть << размера пикселя интересующей детали). - Радиометрическая калибровка и атмосферная коррекция (DOS, 6S, Sen2Cor для Sentinel‑2) и приведение к единым единицам отражательной способности ρ\rhoρ. - Для аэрофотосъёмки выполнить фотограмметрию: построить ортомозаики, DSM/DTM и плотный point‑cloud; удалить теневые артефакты, нормализовать освещение/BRDF. 2) Индексы и спектральные признаки (с формулами) - Вегетационные индексы (стресс растительности → косвенный индикатор загрязнения): - NDVI: NDVI=ρNIR−ρREDρNIR+ρRED\mathrm{NDVI}=\dfrac{\rho_{\mathrm{NIR}}-\rho_{\mathrm{RED}}}{\rho_{\mathrm{NIR}}+\rho_{\mathrm{RED}}}NDVI=ρNIR+ρREDρNIR−ρRED. - SAVI (при низкой биомассе): SAVI=(1+L)(ρNIR−ρRED)ρNIR+ρRED+L\mathrm{SAVI}=\dfrac{(1+L)(\rho_{\mathrm{NIR}}-\rho_{\mathrm{RED}})}{\rho_{\mathrm{NIR}}+\rho_{\mathrm{RED}}+L}SAVI=ρNIR+ρRED+L(1+L)(ρNIR−ρRED) (обычно L=0.5L=0.5L=0.5). - Водные индексы: - NDWI (McFeeters): NDWI=ρGREEN−ρNIRρGREEN+ρNIR\mathrm{NDWI}=\dfrac{\rho_{\mathrm{GREEN}}-\rho_{\mathrm{NIR}}}{\rho_{\mathrm{GREEN}}+\rho_{\mathrm{NIR}}}NDWI=ρGREEN+ρNIRρGREEN−ρNIR — выделение водных поверхностей. - MNDWI (лучше отделяет городские шумы): MNDWI=ρGREEN−ρSWIRρGREEN+ρSWIR\mathrm{MNDWI}=\dfrac{\rho_{\mathrm{GREEN}}-\rho_{\mathrm{SWIR}}}{\rho_{\mathrm{GREEN}}+\rho_{\mathrm{SWIR}}}MNDWI=ρGREEN+ρSWIRρGREEN−ρSWIR. - Индекс мутности / взвешенных частиц (пример эмпирической модели): TSM=a+b⋅ρred\mathrm{TSM}=a + b\cdot \rho_{\mathrm{red}}TSM=a+b⋅ρred (коэффициенты калибруются по полевым пробам). - Нефтяные/углеводородные загрязнения (на воде/почве): NDTI / разности полос: - NDTI (турбидность/масляные плёнки): NDTI=ρRED−ρGREENρRED+ρGREEN\mathrm{NDTI}=\dfrac{\rho_{\mathrm{RED}}-\rho_{\mathrm{GREEN}}}{\rho_{\mathrm{RED}}+\rho_{\mathrm{GREEN}}}NDTI=ρRED+ρGREENρRED−ρGREEN. - FAI (плавающие водоросли/масла): FAI=ρNIR−ρNIRbaseline\mathrm{FAI}=\rho_{\mathrm{NIR}} - \rho_{\mathrm{NIR}}^{\mathrm{baseline}}FAI=ρNIR−ρNIRbaseline (линейная интерполяция между RED и SWIR). - Почвенные индексы: - BSI (Bare Soil Index): BSI=ρSWIR+ρRED−ρNIR−ρBLUEρSWIR+ρRED+ρNIR+ρBLUE\mathrm{BSI}=\dfrac{\rho_{\mathrm{SWIR}}+\rho_{\mathrm{RED}}-\rho_{\mathrm{NIR}}-\rho_{\mathrm{BLUE}}}{\rho_{\mathrm{SWIR}}+\rho_{\mathrm{RED}}+\rho_{\mathrm{NIR}}+\rho_{\mathrm{BLUE}}}BSI=ρSWIR+ρRED+ρNIR+ρBLUEρSWIR+ρRED−ρNIR−ρBLUE. - MSI (Moisture Stress Index): MSI=ρSWIRρNIR\mathrm{MSI}=\dfrac{\rho_{\mathrm{SWIR}}}{\rho_{\mathrm{NIR}}}MSI=ρNIRρSWIR — влагозапасы/влажность почвы. - Гиперспектрально: спектральные индексы/характеристики аккуратно для детекции загрязняющих веществ (пики поглощения/рефлективности для нефтепродуктов, солей, металлов и т.д.) и спектральное разложение (spectral unmixing). 3) Методы обработки и выявления динамики - Пост-классификация и сравнение по годам: обученная классификация (Random Forest, SVM) или OBIA → матрица переходов классов (например: чистая почва → загрязнённая, вода → нефтяная плёнка). - Change detection: - Разность индексов по временам: ΔNDVI=NDVIt2−NDVIt1\Delta \mathrm{NDVI}=\mathrm{NDVI}_{t2}-\mathrm{NDVI}_{t1}ΔNDVI=NDVIt2−NDVIt1 и статистический анализ существенности изменений. - Пост‑классификация (сравнение карт) — даёт качественные изменения и переходы классов. - PCA/TSM/Сингулярный анализ временных рядов и тренд‑тест (Mann–Kendall) для многолетних серий. - Количественные оценки загрязнения воды (TSM, хлорофилл, нефтяные концентрации) — эмпирические модели/регрессии спектр → концентрация, откалиброванные по полевым измерениям. - Использование DSM/DTM: оценка накопления/размыва пород, путей стока загрязнений, выявление прудов/ям, где аккумулируются загрязнения. 4) Валидация и оценка погрешностей - Полевая валидация: сбор проб почвы/воды с GPS, лабораторный анализ (концентрации нефтепродуктов, металлов, TSS, хлорофилл). Необходима независимая выборка для обучения/теста. - Метрики для классификации: confusion matrix, Overall Accuracy, Producer’s Accuracy, User’s Accuracy, Kappa. Пусть TP, FP, FN обозначают — тогда Producer’s = TPTP+FN\dfrac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}}TP+FNTP, User’s = TPTP+FP\dfrac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FP}}TP+FPTP. - Метрики для регрессии (количественные оценки концентраций): RMSE, MAE, R2R^2R2: - RMSE=1n∑i=1n(yi−y^i)2\mathrm{RMSE}=\sqrt{\dfrac{1}{n}\sum_{i=1}^n (y_i-\hat y_i)^2}RMSE=n1∑i=1n(yi−y^i)2. - MAE=1n∑i=1n∣yi−y^i∣\mathrm{MAE}=\dfrac{1}{n}\sum_{i=1}^n |y_i-\hat y_i|MAE=n1∑i=1n∣yi−y^i∣. - R2=1−∑(yi−y^i)2∑(yi−yˉ)2R^2=1-\dfrac{\sum (y_i-\hat y_i)^2}{\sum (y_i-\bar y)^2}R2=1−∑(yi−yˉ)2∑(yi−y^i)2. - Оценка погрешности индексов (приближённая через дифференцирование): для отношения I=A−BA+BI=\dfrac{A-B}{A+B}I=A+BA−B
- Var(I)≈4B2Var(A)+4A2Var(B)(A+B)4\mathrm{Var}(I)\approx \dfrac{4B^2\mathrm{Var}(A)+4A^2\mathrm{Var}(B)}{(A+B)^4}Var(I)≈(A+B)44B2Var(A)+4A2Var(B) (если ковариация пренебрежима). - Пропускание ошибок (Monte‑Carlo): задавать распределения шумов в спектральных каналах → прогонять модель много раз → доверительные интервалы на оценки загрязнений. - Статистическая проверка значимости изменений: Z‑тест, t‑test для средних значений индекса, Mann–Kendall для тренда в временах. 5) Основные источники ошибок и меры снижения - Ошибки ко-регистрации → применять субпиксельную ко-регистрацию; контролировать RMSE гео-привязки. - Атмосферные/сезонные и угловые эффекты → проводить атмосферную коррекцию и BRDF‑нормализацию; сравнивать снимки в одних сезонных условиях. - Различия сенсоров (спектральная чувствительность) → спектральная нормализация или использовать только сопоставимые полосы. - Недостаток полевых данных → увеличить число проб, стратифицированная выборка по классам/кумуляциям. 6) Рекомендуемый краткий рабочий сценарий 1. Построить ортофото и DTM для всех дат (фотограмметрия). 2. Атмосферно откорректировать и ко-регистровать снимки. 3. Рассчитать набор индексов (NDVI, SAVI, NDWI, MNDWI, NDTI, BSI, MSI, FAI и др.). 4. Выполнить классификацию/регрессию (RF/SVM/OBIA), оценить статистику по годам; провести детекцию изменений (Δиндексы и пост‑классификация). 5. Калибровать количественные модели загрязнения по полевым пробам; оценить RMSE, CI (через бутстрэп/MC). 6. Вывести карты изменений с масками достоверности (порог значимости) и карту ошибок. Если нужно — могу составить конкретную формулу регрессии и процедуру валидации для ваших конкретных датчиков (укажите набор полос: аэрофото — RGB/NIR, спутник — Sentinel‑2/Landsat/гиперспектр) и доступные полевые данные.
1) Подготовка данных (обязательна)
- Геокоррекция и точная ко-регистрация всех снимков (ошибка сдвига должна быть << размера пикселя интересующей детали).
- Радиометрическая калибровка и атмосферная коррекция (DOS, 6S, Sen2Cor для Sentinel‑2) и приведение к единым единицам отражательной способности ρ\rhoρ.
- Для аэрофотосъёмки выполнить фотограмметрию: построить ортомозаики, DSM/DTM и плотный point‑cloud; удалить теневые артефакты, нормализовать освещение/BRDF.
2) Индексы и спектральные признаки (с формулами)
- Вегетационные индексы (стресс растительности → косвенный индикатор загрязнения):
- NDVI: NDVI=ρNIR−ρREDρNIR+ρRED\mathrm{NDVI}=\dfrac{\rho_{\mathrm{NIR}}-\rho_{\mathrm{RED}}}{\rho_{\mathrm{NIR}}+\rho_{\mathrm{RED}}}NDVI=ρNIR +ρRED ρNIR −ρRED .
- SAVI (при низкой биомассе): SAVI=(1+L)(ρNIR−ρRED)ρNIR+ρRED+L\mathrm{SAVI}=\dfrac{(1+L)(\rho_{\mathrm{NIR}}-\rho_{\mathrm{RED}})}{\rho_{\mathrm{NIR}}+\rho_{\mathrm{RED}}+L}SAVI=ρNIR +ρRED +L(1+L)(ρNIR −ρRED ) (обычно L=0.5L=0.5L=0.5).
- Водные индексы:
- NDWI (McFeeters): NDWI=ρGREEN−ρNIRρGREEN+ρNIR\mathrm{NDWI}=\dfrac{\rho_{\mathrm{GREEN}}-\rho_{\mathrm{NIR}}}{\rho_{\mathrm{GREEN}}+\rho_{\mathrm{NIR}}}NDWI=ρGREEN +ρNIR ρGREEN −ρNIR — выделение водных поверхностей.
- MNDWI (лучше отделяет городские шумы): MNDWI=ρGREEN−ρSWIRρGREEN+ρSWIR\mathrm{MNDWI}=\dfrac{\rho_{\mathrm{GREEN}}-\rho_{\mathrm{SWIR}}}{\rho_{\mathrm{GREEN}}+\rho_{\mathrm{SWIR}}}MNDWI=ρGREEN +ρSWIR ρGREEN −ρSWIR .
- Индекс мутности / взвешенных частиц (пример эмпирической модели): TSM=a+b⋅ρred\mathrm{TSM}=a + b\cdot \rho_{\mathrm{red}}TSM=a+b⋅ρred (коэффициенты калибруются по полевым пробам).
- Нефтяные/углеводородные загрязнения (на воде/почве): NDTI / разности полос:
- NDTI (турбидность/масляные плёнки): NDTI=ρRED−ρGREENρRED+ρGREEN\mathrm{NDTI}=\dfrac{\rho_{\mathrm{RED}}-\rho_{\mathrm{GREEN}}}{\rho_{\mathrm{RED}}+\rho_{\mathrm{GREEN}}}NDTI=ρRED +ρGREEN ρRED −ρGREEN .
- FAI (плавающие водоросли/масла): FAI=ρNIR−ρNIRbaseline\mathrm{FAI}=\rho_{\mathrm{NIR}} - \rho_{\mathrm{NIR}}^{\mathrm{baseline}}FAI=ρNIR −ρNIRbaseline (линейная интерполяция между RED и SWIR).
- Почвенные индексы:
- BSI (Bare Soil Index): BSI=ρSWIR+ρRED−ρNIR−ρBLUEρSWIR+ρRED+ρNIR+ρBLUE\mathrm{BSI}=\dfrac{\rho_{\mathrm{SWIR}}+\rho_{\mathrm{RED}}-\rho_{\mathrm{NIR}}-\rho_{\mathrm{BLUE}}}{\rho_{\mathrm{SWIR}}+\rho_{\mathrm{RED}}+\rho_{\mathrm{NIR}}+\rho_{\mathrm{BLUE}}}BSI=ρSWIR +ρRED +ρNIR +ρBLUE ρSWIR +ρRED −ρNIR −ρBLUE .
- MSI (Moisture Stress Index): MSI=ρSWIRρNIR\mathrm{MSI}=\dfrac{\rho_{\mathrm{SWIR}}}{\rho_{\mathrm{NIR}}}MSI=ρNIR ρSWIR — влагозапасы/влажность почвы.
- Гиперспектрально: спектральные индексы/характеристики аккуратно для детекции загрязняющих веществ (пики поглощения/рефлективности для нефтепродуктов, солей, металлов и т.д.) и спектральное разложение (spectral unmixing).
3) Методы обработки и выявления динамики
- Пост-классификация и сравнение по годам: обученная классификация (Random Forest, SVM) или OBIA → матрица переходов классов (например: чистая почва → загрязнённая, вода → нефтяная плёнка).
- Change detection:
- Разность индексов по временам: ΔNDVI=NDVIt2−NDVIt1\Delta \mathrm{NDVI}=\mathrm{NDVI}_{t2}-\mathrm{NDVI}_{t1}ΔNDVI=NDVIt2 −NDVIt1 и статистический анализ существенности изменений.
- Пост‑классификация (сравнение карт) — даёт качественные изменения и переходы классов.
- PCA/TSM/Сингулярный анализ временных рядов и тренд‑тест (Mann–Kendall) для многолетних серий.
- Количественные оценки загрязнения воды (TSM, хлорофилл, нефтяные концентрации) — эмпирические модели/регрессии спектр → концентрация, откалиброванные по полевым измерениям.
- Использование DSM/DTM: оценка накопления/размыва пород, путей стока загрязнений, выявление прудов/ям, где аккумулируются загрязнения.
4) Валидация и оценка погрешностей
- Полевая валидация: сбор проб почвы/воды с GPS, лабораторный анализ (концентрации нефтепродуктов, металлов, TSS, хлорофилл). Необходима независимая выборка для обучения/теста.
- Метрики для классификации: confusion matrix, Overall Accuracy, Producer’s Accuracy, User’s Accuracy, Kappa. Пусть TP, FP, FN обозначают — тогда Producer’s = TPTP+FN\dfrac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}}TP+FNTP , User’s = TPTP+FP\dfrac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FP}}TP+FPTP .
- Метрики для регрессии (количественные оценки концентраций): RMSE, MAE, R2R^2R2:
- RMSE=1n∑i=1n(yi−y^i)2\mathrm{RMSE}=\sqrt{\dfrac{1}{n}\sum_{i=1}^n (y_i-\hat y_i)^2}RMSE=n1 ∑i=1n (yi −y^ i )2 .
- MAE=1n∑i=1n∣yi−y^i∣\mathrm{MAE}=\dfrac{1}{n}\sum_{i=1}^n |y_i-\hat y_i|MAE=n1 ∑i=1n ∣yi −y^ i ∣.
- R2=1−∑(yi−y^i)2∑(yi−yˉ)2R^2=1-\dfrac{\sum (y_i-\hat y_i)^2}{\sum (y_i-\bar y)^2}R2=1−∑(yi −yˉ )2∑(yi −y^ i )2 .
- Оценка погрешности индексов (приближённая через дифференцирование): для отношения I=A−BA+BI=\dfrac{A-B}{A+B}I=A+BA−B - Var(I)≈4B2Var(A)+4A2Var(B)(A+B)4\mathrm{Var}(I)\approx \dfrac{4B^2\mathrm{Var}(A)+4A^2\mathrm{Var}(B)}{(A+B)^4}Var(I)≈(A+B)44B2Var(A)+4A2Var(B) (если ковариация пренебрежима).
- Пропускание ошибок (Monte‑Carlo): задавать распределения шумов в спектральных каналах → прогонять модель много раз → доверительные интервалы на оценки загрязнений.
- Статистическая проверка значимости изменений: Z‑тест, t‑test для средних значений индекса, Mann–Kendall для тренда в временах.
5) Основные источники ошибок и меры снижения
- Ошибки ко-регистрации → применять субпиксельную ко-регистрацию; контролировать RMSE гео-привязки.
- Атмосферные/сезонные и угловые эффекты → проводить атмосферную коррекцию и BRDF‑нормализацию; сравнивать снимки в одних сезонных условиях.
- Различия сенсоров (спектральная чувствительность) → спектральная нормализация или использовать только сопоставимые полосы.
- Недостаток полевых данных → увеличить число проб, стратифицированная выборка по классам/кумуляциям.
6) Рекомендуемый краткий рабочий сценарий
1. Построить ортофото и DTM для всех дат (фотограмметрия).
2. Атмосферно откорректировать и ко-регистровать снимки.
3. Рассчитать набор индексов (NDVI, SAVI, NDWI, MNDWI, NDTI, BSI, MSI, FAI и др.).
4. Выполнить классификацию/регрессию (RF/SVM/OBIA), оценить статистику по годам; провести детекцию изменений (Δиндексы и пост‑классификация).
5. Калибровать количественные модели загрязнения по полевым пробам; оценить RMSE, CI (через бутстрэп/MC).
6. Вывести карты изменений с масками достоверности (порог значимости) и карту ошибок.
Если нужно — могу составить конкретную формулу регрессии и процедуру валидации для ваших конкретных датчиков (укажите набор полос: аэрофото — RGB/NIR, спутник — Sentinel‑2/Landsat/гиперспектр) и доступные полевые данные.