Даны два подхода к приближению интеграла от функции f(x) на отрезке [a,b]: метод трапеций и метод Монте-Карло. Приведите критерии выбора метода в зависимости от свойств f (гладкость, сингулярности, размерность задачи) и оценки погрешности, приведите пример функции, где очевидный аналитический метод хуже случайного подхода
Коротко — критерии выбора, оценки погрешности и наглядный пример.
1) Ошибка и асимптотика
Метод трапеций составнойсоставнойсоставной на отрезке a,ba,ba,b, шаг h=b−ab−ab−a/n. При f ∈ C^2[a,b][a,b][a,b] ошибка обозначается |ET| ≤ b−ab−ab−a h^2 /12 · max{a,ba,ba,b} |f''xxx|, т.е. порядок Oh2h^2h2. Для достижения точности ε нужно n = Oε−1/2ε^{−1/2}ε−1/2 точек в1Dв 1Dв1D. Для особо гладких/периодических функций с аналитичностью сходимость может быть гораздо быстрее спектральная,оченьмалыеошибкиприумеренномnспектральная, очень малые ошибки при умеренном nспектральная,оченьмалыеошибкиприумеренномn.
Метод Монте‑Карло обычныйMCобычный MCобычныйMC, выбор точек X_i ~ Unif[a,b][a,b][a,b] и оценка I_N = b−ab−ab−a·1/N1/N1/N Σ fXiX_iXi. По ЦПТ стандартная ошибка стандартноеотклонениеоценкистандартное отклонение оценкистандартноеотклонениеоценки
σINI_NIN = b−ab−ab−a · sqrtVar(f(X))Var(f(X))Var(f(X))/√N = ON−1/2N^{−1/2}N−1/2. Чтобы получить среднеквадратичную погрешность ~ε нужно N = Oε−2ε^{−2}ε−2. Зависимость от размерности отсутствует ошибка∝N−1/2независимоотdошибка ∝ N^{−1/2} независимо от dошибка∝N−1/2независимоотd.
2) Критерии выбора в зависимости от f и задачи
Низкая размерность d=1,2d = 1, 2d=1,2 и f гладкая C2илилучшеC^2 или лучшеC2илилучше, без разрывов и сильных локализаций: предпочитают детерминированную квадратуру трапеции,Симпсон,Гаусстрапеции, Симпсон, Гаусстрапеции,Симпсон,Гаусс — быстрее достижение малой ε n ε−1/2вместоN ε−2n ~ ε^{−1/2} вместо N ~ ε^{−2}nε−1/2вместоNε−2.Периодические и очень гладкие функции: составная трапецоидальная формула особенно эффективна быстрая/спектральнаясходимостьбыстрая/спектральная сходимостьбыстрая/спектральнаясходимость.Наличие сингулярностей/разрывов/неограниченных производных: обычный равномерный трапецоид может давать большие ошибки; лучше применять: преобразования переменной удалениесингулярностиудаление сингулярностиудалениесингулярности,адаптивную сетку или специальные правила квадратурaсвесомквадратурa с весомквадратурaсвесом,либо стохастический метод MCMCMC — он требует лишь интегрируемости и устойчив к локальным пикам.Высокая размерность d≥5...10d ≥ 5...10d≥5...10: решающее преимущество у Монте‑Карло: детерминированные решётки страдают «проклятием размерности» — число узлов ~ m^d. Для достижения точности ε композиционные правила требуют ~ε^{−d/2} оценок, тогда как MC требует ~ε^{−2}, независимо от d.Нелинейные/шумные/стоохастические f или дорогостоящая модель: MC совместим с методами уменьшения дисперсии importancesampling,stratification,controlvariatesimportance sampling, stratification, control variatesimportancesampling,stratification,controlvariates и даёт несмещённую оценку; при дорогих f пользуются вариационными методами и квазиномером QMCQMCQMC, чтобы снизить дисперсию.
3) Преимущества/недостатки сводным списком
Трапеции детерминированныедетерминированныедетерминированные: + высокая точность для гладких 1D функций, быстрый рост точности; − плохо при разрывах/сильных локальных пиках, неэффективно в высоких d.Монте‑Карло: + простота, устойчивость к размерности, работает при слабых требованиях к гладкости; − медленная сходимость ON−1/2N^{−1/2}N−1/2, требуется большой N для малых ε, результаты стохастичны нужнооцениватьдисперсиюнужно оценивать дисперсиюнужнооцениватьдисперсию.
4) Конкретный пример, где «очевидный» трапецоид хуже MC Рассмотрим интеграл на 0,10,10,1 функции, представляющей узкий пик: fxxx = 1, если x ∈ x0,x0+δx0, x0 + δx0,x0+δ, иначе 0, где δ очень мало, скажем δ = 10^{−6}, а x0 — произвольное число, не совпадающее с узлами сетки.
Интеграл I = δ = 10^{−6}.Составной трапецоид с n = 1000 h=10−3h = 10^{−3}h=10−3: узлы x_k = k·10^{−3}. Если интервал x0,x0+δx0, x0+δx0,x0+δ не содержит ни одного узла чтовполневероятноприслучайномx0что вполне вероятно при случайном x0чтовполневероятноприслучайномx0, значения f на всех узлах равны 0 и трапецоид даст оценку 0 — полная потеря сигнала ошибка=10−6,относительнаяошибка100ошибка = 10^{−6}, относительная ошибка 100%ошибка=10−6,относительнаяошибка100.Монте‑Карло с N = 10^6 случайных точек: ожидаемое число попаданий в пик ≈ N·δ = 1. Оценка интеграла ≈ #hits/N ≈ 1/10^6 ≈ 10^{−6} сбольшойдисперсией,новсреднемправильнас большой дисперсией, но в среднем правильнасбольшойдисперсией,новсреднемправильна. При увеличении N илиприменениистратификации/importancesamplingили применении стратификации/importance samplingилиприменениистратификации/importancesampling оценку можно улучшить.
Аналогично в d‑измерном кубе, если функция сосредоточена в очень маленьком объёме узкая«шаровая»областьузкая «шаровая» областьузкая«шаровая»область, детерминированные регулярные сетки с высокой вероятностью её пропустят, а MC илиQMCссоответствующейстратегиейили QMC с соответствующей стратегиейилиQMCссоответствующейстратегией обнаружит.
5) Практические рекомендации
Если задача 1D и f гладкая: используйте составную трапецоидальную/Симпсона/Гаусса правила; для особо гладких periodic f — трапецоид особенно выгоден.Если есть сингулярности: сначала подумайте о преобразовании переменных или адаптивной сетке; если это невозможно или функция лишь интегрируема — используйте MC.Для d крупного ≥5≥5≥5: MC или QMC практически всегда предпочтительнее.Для функций с локальными узкими пиками/индикаторов используйте MC с уменьшением дисперсии importancesampling,stratificationimportance sampling, stratificationimportancesampling,stratification или адаптивные детерминированные правила, специально нацеленные на пиковые области.
Если хотите, могу:
привести сравнение количества оценок nилиNn или NnилиN для заданной ε при разных d,показать численный пример кодкодкод иллюстрации случая с узким пиком и сравнения трапеций и MC.
Коротко — критерии выбора, оценки погрешности и наглядный пример.
1) Ошибка и асимптотика
Метод трапеций составнойсоставнойсоставной на отрезке a,ba,ba,b, шаг h=b−ab−ab−a/n. При f ∈ C^2[a,b][a,b][a,b] ошибка обозначается
|ET| ≤ b−ab−ab−a h^2 /12 · max{a,ba,ba,b} |f''xxx|,
т.е. порядок Oh2h^2h2. Для достижения точности ε нужно n = Oε−1/2ε^{−1/2}ε−1/2 точек в1Dв 1Dв1D.
Для особо гладких/периодических функций с аналитичностью сходимость может быть гораздо быстрее спектральная,оченьмалыеошибкиприумеренномnспектральная, очень малые ошибки при умеренном nспектральная,оченьмалыеошибкиприумеренномn.
Метод Монте‑Карло обычныйMCобычный MCобычныйMC, выбор точек X_i ~ Unif[a,b][a,b][a,b] и оценка I_N = b−ab−ab−a·1/N1/N1/N Σ fXiX_iXi . По ЦПТ стандартная ошибка стандартноеотклонениеоценкистандартное отклонение оценкистандартноеотклонениеоценки σINI_NIN = b−ab−ab−a · sqrtVar(f(X))Var(f(X))Var(f(X))/√N = ON−1/2N^{−1/2}N−1/2.
Чтобы получить среднеквадратичную погрешность ~ε нужно N = Oε−2ε^{−2}ε−2. Зависимость от размерности отсутствует ошибка∝N−1/2независимоотdошибка ∝ N^{−1/2} независимо от dошибка∝N−1/2независимоотd.
2) Критерии выбора в зависимости от f и задачи
Низкая размерность d=1,2d = 1, 2d=1,2 и f гладкая C2илилучшеC^2 или лучшеC2илилучше, без разрывов и сильных локализаций:предпочитают детерминированную квадратуру трапеции,Симпсон,Гаусстрапеции, Симпсон, Гаусстрапеции,Симпсон,Гаусс — быстрее достижение малой ε n ε−1/2вместоN ε−2n ~ ε^{−1/2} вместо N ~ ε^{−2}n ε−1/2вместоN ε−2.Периодические и очень гладкие функции:
составная трапецоидальная формула особенно эффективна быстрая/спектральнаясходимостьбыстрая/спектральная сходимостьбыстрая/спектральнаясходимость.Наличие сингулярностей/разрывов/неограниченных производных:
обычный равномерный трапецоид может давать большие ошибки; лучше применять:
преобразования переменной удалениесингулярностиудаление сингулярностиудалениесингулярности,адаптивную сетку или специальные правила квадратурaсвесомквадратурa с весомквадратурaсвесом,либо стохастический метод MCMCMC — он требует лишь интегрируемости и устойчив к локальным пикам.Высокая размерность d≥5...10d ≥ 5...10d≥5...10:
решающее преимущество у Монте‑Карло: детерминированные решётки страдают «проклятием размерности» — число узлов ~ m^d. Для достижения точности ε композиционные правила требуют ~ε^{−d/2} оценок, тогда как MC требует ~ε^{−2}, независимо от d.Нелинейные/шумные/стоохастические f или дорогостоящая модель:
MC совместим с методами уменьшения дисперсии importancesampling,stratification,controlvariatesimportance sampling, stratification, control variatesimportancesampling,stratification,controlvariates и даёт несмещённую оценку; при дорогих f пользуются вариационными методами и квазиномером QMCQMCQMC, чтобы снизить дисперсию.
3) Преимущества/недостатки сводным списком
Трапеции детерминированныедетерминированныедетерминированные: + высокая точность для гладких 1D функций, быстрый рост точности; − плохо при разрывах/сильных локальных пиках, неэффективно в высоких d.Монте‑Карло: + простота, устойчивость к размерности, работает при слабых требованиях к гладкости; − медленная сходимость ON−1/2N^{−1/2}N−1/2, требуется большой N для малых ε, результаты стохастичны нужнооцениватьдисперсиюнужно оценивать дисперсиюнужнооцениватьдисперсию.4) Конкретный пример, где «очевидный» трапецоид хуже MC
Интеграл I = δ = 10^{−6}.Составной трапецоид с n = 1000 h=10−3h = 10^{−3}h=10−3: узлы x_k = k·10^{−3}. Если интервал x0,x0+δx0, x0+δx0,x0+δ не содержит ни одного узла чтовполневероятноприслучайномx0что вполне вероятно при случайном x0чтовполневероятноприслучайномx0, значения f на всех узлах равны 0 и трапецоид даст оценку 0 — полная потеря сигнала ошибка=10−6,относительнаяошибка100ошибка = 10^{−6}, относительная ошибка 100%ошибка=10−6,относительнаяошибка100.Монте‑Карло с N = 10^6 случайных точек: ожидаемое число попаданий в пик ≈ N·δ = 1. Оценка интеграла ≈ #hits/N ≈ 1/10^6 ≈ 10^{−6} сбольшойдисперсией,новсреднемправильнас большой дисперсией, но в среднем правильнасбольшойдисперсией,новсреднемправильна. При увеличении N илиприменениистратификации/importancesamplingили применении стратификации/importance samplingилиприменениистратификации/importancesampling оценку можно улучшить.Рассмотрим интеграл на 0,10,10,1 функции, представляющей узкий пик:
fxxx = 1, если x ∈ x0,x0+δx0, x0 + δx0,x0+δ, иначе 0,
где δ очень мало, скажем δ = 10^{−6}, а x0 — произвольное число, не совпадающее с узлами сетки.
Аналогично в d‑измерном кубе, если функция сосредоточена в очень маленьком объёме узкая«шаровая»областьузкая «шаровая» областьузкая«шаровая»область, детерминированные регулярные сетки с высокой вероятностью её пропустят, а MC илиQMCссоответствующейстратегиейили QMC с соответствующей стратегиейилиQMCссоответствующейстратегией обнаружит.
5) Практические рекомендации
Если задача 1D и f гладкая: используйте составную трапецоидальную/Симпсона/Гаусса правила; для особо гладких periodic f — трапецоид особенно выгоден.Если есть сингулярности: сначала подумайте о преобразовании переменных или адаптивной сетке; если это невозможно или функция лишь интегрируема — используйте MC.Для d крупного ≥5≥5≥5: MC или QMC практически всегда предпочтительнее.Для функций с локальными узкими пиками/индикаторов используйте MC с уменьшением дисперсии importancesampling,stratificationimportance sampling, stratificationimportancesampling,stratification или адаптивные детерминированные правила, специально нацеленные на пиковые области.Если хотите, могу:
привести сравнение количества оценок nилиNn или NnилиN для заданной ε при разных d,показать численный пример кодкодкод иллюстрации случая с узким пиком и сравнения трапеций и MC.