Это не официальный сайт wikipedia.org 01.01.2023

Критерий согласия Колмогорова — Википедия

Критерий согласия Колмогорова

Критерий согласия Колмогорова предназначен для проверки гипотезы о принадлежности выборки некоторому закону распределения, то есть проверки того, что эмпирическое распределение соответствует предполагаемой модели.

Критерий однородности Смирнова используется для проверки гипотезы о принадлежности двух независимых выборок одному закону распределения, то есть о том, что два эмпирических распределения соответствуют одному и тому же закону.

Эти критерии носят имена математиков Андрея Николаевича Колмогорова и Николая Васильевича Смирнова.

Критерий Смирнова о проверке гипотезы об однородности двух эмпирических законов распределения является одним из наиболее часто используемых непараметрических критериев.

ОписаниеПравить

Если в критерии χ 2   сопоставляются частоты двух распределений отдельно по каждому разряду, то здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, каждый раз сопоставляются накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и различия можно будет признать статистически достоверными. В формулу критерия λ    включается эта разность. Чем больше эмпирическое значение λ  , тем более существенными являются различия.

Статистика критерия КолмогороваПравить

Пусть эмпирическая функция распределения (ЭФР) F n  , построенная по выборке X = ( X 1 , , X n )  , имеет вид:

F n ( x ) = 1 n i = 1 n I X i x ,  

где I X i x   указывает, попало ли наблюдение X i   в область ( , x ]  :

I X i x = { 1 , X i x ; 0 , X i > x .  

Выполняется проверка того, является ли выборка порождённой случайной величиной ξ   с функцией распределения F ( x )  . Статистика критерия для эмпирической функции распределения F n ( x )   определяется следующим образом:

D n = sup x R | F n ( x ) F ( x ) | ,  

где под sup   понимается супремум функции | F n ( x ) F ( x ) |  .

Распределение статистики КолмогороваПравить

Обозначим нулевую гипотезу H 0  , как гипотезу о том, что выборка подчиняется распределению F ( X ) C 1 ( X )  . Тогда по теореме Колмогорова для введённой статистики справедливо:

t > 0 : lim n P ( n D n t ) = K ( t ) = j = + ( 1 ) j e 2 j 2 t 2 .  

Учтём, что критерий имеет правостороннюю критическую область.

  Принятие решения по критерию Колмогорова.
Если статистика n D n   превышает процентную точку распределения Колмогорова K α   заданного уровня значимости α  , то нулевая гипотеза H 0   (о соответствии закону F ( x )  ) отвергается. Иначе гипотеза принимается на уровне α  .

Если α   достаточно близко к 1, то K α   можно приблизительно рассчитать по формуле:

K α 1 2 ln 1 α 2 .  

Асимптотическая мощность критерия равна 1.


Обозначим теперь за нулевую гипотезу H 0   гипотезу о том, что две исследуемые выборки подчиняются одному распределению случайной величины ξ : F ( X ) C 1 ( X )  .

  Теорема Смирнова.
Пусть F 1 , n ( x ) , F 2 , m ( x )   — эмпирические функции распределения, построенные по независимым выборкам объёмом n   и m   случайной величины ξ  . Тогда, если F ( x ) C 1 ( X )  , то t > 0 : lim n , m P ( n m n + m D n , m t ) = K ( t ) = j = + ( 1 ) j e 2 j 2 t 2  , где D n , m = sup x | F 1 , n F 2 , m |  .

Теорема Смирнова позволяет построить критерий для проверки двух выборок на однородность.

  Принятие решения по критерию Смирнова.
Если статистика n m n + m D n , m   превышает квантиль распределения Колмогорова K α   для заданного уровня значимости α  , то нулевая гипотеза H 0   (об однородности выборок) отвергается. Иначе гипотеза принимается на уровне α  .

См. такжеПравить

Примечание 1Править

В критерии Колмогорова предпочтительней использование статистики с поправкой Большева в следующем виде n D n + 1 / ( 6 n )  . Распределение данной статистики уже не так сильно зависит от объема выборки. Зависимостью её распределения от объема выборки n   можно пренебречь при n > 25  .

Примечание 2Править

Классический критерий Колмогорова предназначен для проверки простых гипотез. Если проверяется гипотеза о согласии наблюдаемой выборки с законом, все параметры которого известны, то критерий Колмогорова является свободным от распределения: неважно, с каким законом проверяется согласие. Если проверяемая гипотеза справедлива, предельным распределением статистики Колмогорова является распределение Колмогорова K ( t )  .

Всё меняется при проверке сложных гипотез, когда по анализируемой выборке оцениваются параметры теоретического закона, согласие с которым проверяется. При проверке сложных гипотез свобода от распределения теряется. При проверке сложных гипотез и справедливости проверяемой гипотезы распределения статистик непараметрических критериев согласия (и критерия Колмогорова) зависят от ряда факторов: от вида наблюдаемого закона, соответствующего проверяемой гипотезе; от типа оцениваемого параметра и числа оцениваемых параметров; в некоторых случаях от конкретного значения параметра (например, в случае семейств гамма- и бета-распределений); от метода оценивания параметров. Различия в предельных распределениях той же самой статистики при проверке простых и сложных гипотез настолько существенны, что пренебрегать этим ни в коем случае нельзя.

О применении критерия Колмогорова при проверке сложных гипотезПравить

СсылкиПравить