Это не официальный сайт wikipedia.org 01.01.2023

Неравенство Хёфдинга — Википедия

Неравенство Хёфдинга

Неравенство Хёфдинга даёт верхнюю границу вероятности того, что сумма случайных величин отклоняется от своего математического ожидания. Неравенство Хёфдинга было доказано Василием Хёфдингом[en] в 1963 году.[1] Неравенство Хёфдинга является частным случаем неравенства Адзума — Хёфдинга[en] и более общим случаем неравенства Бернштейна[en], доказанного Сергеем Бернштейном в 1923 году. Они также являются частными случаями неравенства МакДиармида.

Частный случай для случайных величин БернуллиПравить

Неравенство Хефдинга может быть применено к важному частному случаю одинаково распределенных бернуллиевских случайных величин, и, как неравенство, часто используется в комбинаторике и информатике. Рассматриваем смещённую монету, у которой орёл выпадает с вероятностью p   и решка — с вероятностью 1 p  . Мы бросаем монету n   раз. Математическое ожидание того, сколько раз монета упадет орлом, есть p n  . Далее, вероятность того, что монета упадет орлом не более k   раз, может быть точно оценена выражением:

Pr ( H ( n ) k ) = i = 0 k ( n i ) p i ( 1 p ) n i .  

В случае k = ( p ε ) n   для некоторого ε > 0   неравенство Хёфдинга ограничивает эту вероятность выражением, которое экспоненциально убывает от ε 2 n  :

Pr ( H ( n ) ( p ε ) n ) exp ( 2 ε 2 n ) .  

Похожим образом, в случае k = ( p + ε ) n   для некоторого ε > 0   неравенство Хёфдинга ограничивает вероятность того, что выпадет не меньше ε n   орлов, чем ожидаемо, выражением:

Pr ( H ( n ) ( p + ε ) n ) exp ( 2 ε 2 n ) .  

Таким образом, неравенство Хёфдинга означает, что число выпадений орла, концентрируется вокруг среднего, с экспоненциально малым хвостом.

Pr ( ( p ε ) n H ( n ) ( p + ε ) n ) 1 2 exp ( 2 ε 2 n ) .  

Общий случайПравить

Пусть X 1 , , X n   — независимые случайные величины.

Положим, что X i   являются почти достоверно ограниченными, то есть, положим для 1 i n  , что:

Pr ( X i [ a i , b i ] ) = 1.  

Мы определяем эмпирическое среднее этих переменных:

X ¯ = ( X 1 + + X n ) / n .  

Теорема 2 из Hoeffding (1963), доказывает неравенства:

Pr ( X ¯ E [ X ¯ ] t ) exp ( 2 t 2 n 2 i = 1 n ( b i a i ) 2 ) ,  
Pr ( | X ¯ E [ X ¯ ] | t ) 2 exp ( 2 t 2 n 2 i = 1 n ( b i a i ) 2 ) ,  

которые верны для всех положительных значений t. Здесь E [ X ¯ ]   является мат.ожиданием X ¯  .

Заметим, что неравенство также верно, если X i   были получены с использованием выборки без замены, в данном случае случайные переменные не являются больше независимыми. Доказательство этого утверждения можно найти в статье Хёфдинга. Для несколько лучших оценок границ в случае выборки без замены, см., например, статью, [2].

См. такжеПравить

ПримечанияПравить

СсылкиПравить