Задано вероятностное пространство с дискретной распределением; предложите метод доказательства неравенства Чернова для оценки хвоста, объясните, в каких ситуациях применение Чернова эффективнее, чем использование неравенства Маркова или Чебышёва
Предыдущий
вопрос Следующий
вопрос

Question

Задано вероятностное пространство с дискретной распределением; предложите метод доказательства неравенства Чернова для оценки хвоста, объясните, в каких ситуациях применение Чернова эффективнее, чем использование неравенства Маркова или Чебышёва
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по математике

Задано вероятностное...

eva

4 Дек в 11:50

4 +4

0

Helper · Answer 1

Метод доказательства (обобщённая схема). Пусть

X

— дискретная случайная величина, нужно оценить правую хвостовую вероятность

P(X≥a)P(X\ge a)

. Применим неравенство Маркова к положительной функции

e^{tX}

при

t > 0

:

P(X\ge a)=P(e^{tX}\ge e^{ta})\le e^{-ta}\,E[e^{tX}].

Оптимизируя по

t > 0

, получаем общую форму неравенства Чернова:

P(X\ge a)\le \inf_{t>0} e^{-ta}M_X(t),\qquad M_X(t)=E[e^{tX}]\ (\text{моментоген. функция}).

Для суммы независимых величин

X=∑i=1nXiX=\sum_{i=1}^n X_i

используем независимость:

M_X(t)=\prod_{i=1}^n M_{X_i}(t),\qquadP\Big(\sum_{i=1}^n X_i\ge a\Big)\le \inf_{t>0} e^{-ta}\prod_{i=1}^n E[e^{tX_i}].

Пример (независимые бернулли

Xi∼Bern(pi)X_i\sim\mathrm{Bern}(p_i)

,

S=∑XiS=\sum X_i

,

μ=E[S]=∑pi\mu=E[S]=\sum p_i

). Для одинаковых

p_i=p

и

a=(1+δ)μa=(1+\delta)\mu

(

δ>0\delta>0

) стандартный вывод даёт

P(S\ge(1+\delta)\mu)\le \left(\frac{e^\delta}{(1+\delta)^{1+\delta}}\right)^{\mu},

что часто оценяют дальше в удобные экспоненциальные формы, напр.

P(S\ge(1+\delta)\mu)\le \exp\!\big(-\tfrac{\delta^2\mu}{3}\big)\quad(0<\delta\le1).

Альтернативная запись через дивергенцию:

P\big(S\ge k\big)\le \exp\big(-n\,D(k/n\|p)\big),\quadD(q\|p)=q\ln\frac{q}{p}+(1-q)\ln\frac{1-q}{1-p}.

Когда Чернов эффективнее Маркова/Чебышёва:
- Марков даёт только

P(X≥a)≤E[X]/aP(X\ge a)\le E[X]/a

(падает как

1/ a

); Чебышёв — только

P(∣X−μ∣≥t)≤Var(X)/t2P(|X-\mu|\ge t)\le\mathrm{Var}(X)/t^2

(падает как

1/t^2

). Оба используют лишь первый/второй моменты и дают полиномиально убывающие оценки.
- Чернов, при наличии независимости (или слабой зависимости) и конечной MGF (часто при ограниченных или подгауссовских с.в.), даёт экспоненциальное убывание вероятности хвоста по числу слагаемых

n

. Поэтому для сумм многих малых независимых вкладов (например, сумм Бернулли) Чернов значительно сильнее.
- Требования: существование/контроль MGF или ограниченность величин; независимость или подходящие условия отрицательной/слабой зависимости. Если распределение тяжёхвостое (MGF не существует) или зависимости сильны, Чернов может быть неприменим или неточным; тогда остаются более общие (но слабее) оценки Маркова/Чебышёва.
Краткое резюме: принцип — применить Марков к

e^{tX}

и оптимизировать по

t

. Чернов эффективен, когда суммируются многие независимые (или слабо зависимые), ограниченные или подгауссовские вклады: даёт экспоненциальные оценки хвоста, тогда как Марков/Чебышёв дают только полиномиальные оценки и используют меньше информации о распределении.

Другие вопросы eva

Другие вопросы
eva