Это не официальный сайт wikipedia.org 01.01.2023

Неравенство Гаусса — Википедия

Неравенство Гаусса

В теории вероятностей неравенство Гаусса даёт верхнюю границу вероятности того, что одномодальная случайная величина выходит за пределы интервала с центром в её моде.

Пусть X — одномодальная случайная величина с модой m и пусть τ 2 есть математическое ожидание (Xm)2. (τ2 может также быть выражено как (μm)2 + σ2, где μ и σ являются средним значением и стандартным отклонением X.)

Pr ( | X m | > k ) { ( 2 τ 3 k ) 2 , if  k 2 τ 3 ; 1 k τ 3 , if  0 k 2 τ 3 .

Эта теорема была впервые доказана Гауссом в 1823 году.

ДоказательствоПравить

Без ограничения общности можно считать, что мода находится в нуле, то есть m = 0  .

Переход к квантилямПравить

Рассмотрим вероятность того, что выполняется неравенство | X | x  , как функцию от x  :

p ( x ) = x x f ( z ) d z .  

Так как f ( x )   является неотрицательной функцией, то p ( x )  растёт с ростом x  .

Кроме того, по определению определённого интеграла:

p ( 0 ) = 0.  

В силу формулы Лейбница:

d p d x = f ( x ) + f ( x ) .  

Рассмотрим обратную функцию (квантиль) распределения случайной величины | X |  :

x = q ( p ) .  

В силу теоремы о производной обратной функции:

q ( p ) = d x d p = [ d p d x ] 1 = 1 f ( x ) + f ( x ) .  

Заметим, что с ростом p  возрастает и x  , в силу унимодальности с ростом по модулю x  функция f ( x )  не возрастает, значит с ростом x  функция q ( p )  не убывает.

Линеаризация функции q ( p )  Править

Выберем произвольную точку q 0 = q ( p 0 )   и линеаризуем q ( p )   точке p 0  , то есть рассмотрим уравнение касательной прямой к этой функции в данной точке:

L ( p ) = q ( p 0 ) + q ( p 0 ) ( p p 0 ) = q 0 + q ( p 0 ) ( p p 0 ) .  

Данное уравнение можно переписать следующим образом:

L ( p ) = q ( p 0 ) ( p p 1 ) ,  

где

p 1 = p 0 q 0 q ( p 0 ) = p 0 ( 1 q 0 p 0 q ( p 0 ) ) = g p 0 .  

Поскольку величины p 0  , q 0  и q ( p 0 )  являются неотрицательными, то

0 p 1 p 0 ,  

а значит

0 g 1.  

Так как q ( p )   не убывает с ростом p  , а L ( p ) = q ( p 0 ) = const ,  то разность q ( p ) L ( p )   имеет тот же знак, что p p 0  . Из этого следует, что величина q ( p ) L ( p )   всегда является неотрицательной, а следовательно:

q ( p ) L ( p ) .  

Поскольку q ( p ) 0   то из L ( p ) 0   (то есть из p p 1  ) следует

L 2 ( p ) q 2 ( p )  .

Получение оценкиПравить

Проинтегрируем последнее неравенство в пределах от p 1  до 1  :

p 1 1 L 2 ( p ) d p p 1 1 q 2 ( p ) d p 0 1 q 2 ( p ) d p = + x 2 f ( x ) d x .  

Последнее выражение обозначим как τ 2  :

τ 2 = + x 2 f ( x ) d x .  

Данная величина есть математическое ожидание квадрата случайной величины X  . По свойствам дисперсии:

τ 2 = μ 2 + σ 2 ,  

где σ 2  — дисперсия случайной величины X  , μ   — её математическое ожидание.

Вычислим теперь интеграл в левой части последнего неравенства:

p 1 1 L 2 ( p ) d p = p 1 1 [ q ( p 0 ) ] 2 ( p p 1 ) 2 d p = [ q ( p 0 ) ] 2 ( p p 1 ) 3 3 | p 1 1 = [ q ( p 0 ) ] 2 ( 1 p 1 ) 3 3 τ 2  
p 1 = p 0 q 0 q ( p 0 ) .  
p 0 p 1 = q 0 q ( p 0 )  
q ( p 0 ) = q 0 p 0 p 1  
[ q 0 p 0 p 1 ] 2 ( 1 p 1 ) 3 3 τ 2  

Преобразуем это неравенство к виду

q 0 2 τ 2 3 ( p 0 p 1 ) 2 ( 1 p 1 ) 3 = 3 ( p 0 g p 0 ) 2 ( 1 g p 0 ) 3 = 3 p 0 2 ( 1 g ) 2 ( 1 g p 0 ) 3 .  

Исследование верхней границыПравить

Исследуем верхнюю границу на экстремальные значения (в зависимости от значения g  ). Начнём с нахождения корней производной:

g [ 3 p 0 2 ( 1 g ) 2 ( 1 g p 0 ) 3 ] = = 3 p 0 2 2 ( 1 g ) ( 1 ) ( 1 g p 0 ) 3 ( 1 g ) 2 3 ( 1 g p 0 ) 2 ( p 0 ) ( 1 g p 0 ) 6 = = 3 p 0 2 ( 1 g ) ( 1 g p 0 ) 2 [ 2 ( 1 g p 0 ) + 3 ( 1 g ) p 0 ] ( 1 g p 0 ) 6 = = 3 p 0 2 ( 1 g ) ( 1 g p 0 ) 4 [ 2 + 2 g p 0 + 3 p 0 3 g p 0 ] = = 3 p 0 2 ( 1 g ) ( 1 g p 0 ) 4 [ 2 3 p 0 + g p 0 ]  

Множитель перед квадратными скобками всегда отрицателен. Определим, когда выражения в квадратных скобках обращается в нуль:

2 3 p 0 + g 0 p 0 = 0.  

Решая данное уравнение, получим:

g 0 p 0 = 3 p 0 2.  
g 0 = 3 2 p 0 .  

Величина g   также должно удовлетворять условию 0 g 1   :

0 3 2 p 0 1  

Решая данное неравенство, получим:

3 2 p 0 2  
2 2 p 0 3  
1 3 p 0 2 1 2  
2 3 p 0 1.  

Правое неравенство не даёт дополнительной информации. Левое же говорит, что корень будет принадлежать [ 0 ; 1 ]   только при p 0 2 3 .  

Рассмотрим сначала случай p 0 2 3  .

В этом случае всегда

g [ 3 p 0 2 ( 1 g ) 2 ( 1 g p 0 ) 3 ] 0 ,  

а следовательно максимум выражения в квадратных скобках достигается при g = 0  :

q 0 2 τ 2 3 p 0 2  

или

p 0 q 0 τ 3 .  

Если же p 0 > 2 3  , то максимум будет в точке g 0 = 3 2 p 0 = 3 p 0 2 p 0 .   Вычислим необходимые нам величины:

1 g 0 = 1 3 + 2 p 0 = 2 p 0 2 = 2 ( 1 p 0 ) p 0  

и

1 g 0 p 0 = 1 ( 3 p 0 2 ) = 3 ( 1 p 0 ) .  

Подставляя эти выражения в исследуемое неравенство, получим:

q 0 2 τ 2 3 p 0 2 ( 1 g ) 2 ( 1 g p 0 ) 3 = 3 p 0 2 3 3 ( 1 p 0 ) 3 2 2 ( 1 p 0 ) 2 p 0 2 = ( 2 3 ) 2 1 1 p 0  

или

1 p 0 ( 2 3 ) 2 τ 2 q 0 2 .  

Объединим полученные неравенства:

q 0 2 τ 2 { 3 p 0 2 , p 0 2 3 4 9 1 ( 1 p 0 ) , p 0 > 2 3  

Извлекая квадратный корень, окончательно получим:

q 0 τ { 3 p 0 , p 0 2 3 2 3 1 1 p 0 , p 0 > 2 3  

Обращение неравенствПравить

Если p 0 2 3  , то

q 0 2 τ 2 3 p 0 2 3 ( 2 3 ) 2 = 4 3 .  

Откуда получаем

q 0 2 τ 3 .  

Это позволяет получить следующее неравенство:

1 p 0 = { 1 q 0 3 τ , q 0 2 τ 3 4 9 τ 2 q 0 2 , q 0 2 τ 3  

Обозначая p 0 = p   и q 0 = x  , получим:

Pr { | X | > x } = { 1 x 3 τ , x 2 τ 3 4 9 τ 2 x 2 , x 2 τ 3 .  

Завершение доказательстваПравить

Выше мы предполагали, что мода случайной величины X   равна нулю. В случае произвольной моды m  , нужно приведённые выше рассуждения применить к случайной величине X m  , мода которой, очевидно, равна нулю. Тогда последняя формула примет вид:

Pr { | X m | > x } = { 1 x 3 τ , x 2 τ 3 4 9 τ 2 x 2 , x 2 τ 3 .  

Величина τ 2  перейдём, по свойствам математического ожидания и дисперсии, в

τ 2 = ( μ m ) 2 + σ 2 .  

Таким образом, теорема полностью доказана.

См. такжеПравить

СсылкиПравить