Это не официальный сайт wikipedia.org 01.01.2023

Критерий Краскела — Уоллиса — Википедия

Критерий Краскела — Уоллиса

Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона — Манна — Уитни. Критерий Краскела — Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Известен также под названиями: H-критерий Краскела — Уоллиса, однофакторный дисперсионный анализ Краскела — Уоллиса (англ. Kruskal — Wallis one-way analysis of variance), тест Крускала — Уоллиса (англ. Kruskal — Wallis test). Назван в честь американских математиков Уильяма Краскела и Аллена Уоллиса.

Примеры задачПравить

Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом «Каковы шансы на победу сборной Украины?» до начала чемпионата. Вторая выборка —- после первой игры, третья — после второго матча и т. д. Значения в выборках — шансы Украины на победу по десятибалльной шкале (1 —- «никаких перспектив», 10 — «отвезти в Украину кубок —- дело времени»). Требуется проверить, зависят ли результаты опросов от хода чемпионата.

Описание критерияПравить

Заданы k   выборок:

x 1 n 1 = { x 11 , , x 1 n 1 } , , x k n k = { x k 1 , , x k n k }  .

Объединённая выборка будет иметь вид:

x = x 1 n 1 x 2 n 2 x k n k .  

Дополнительные предположения:

  1. все выборки простые, объединённая выборка независима;
  2. выборки взяты из неизвестных непрерывных распределений F 1 ( x ) , , F k ( x )  .

Проверяется нулевая гипотеза H 0 : F 1 ( x ) = = F k ( x )   при альтернативе H 1 : F 1 ( x ) = F 2 ( x Δ 1 ) = = F k ( x Δ k 1 )  .

Упорядочим все N = i = 1 k n i   элементов выборок по возрастанию и обозначим R i j   ранг j  -го элемента i  -й выборки в полученном вариационном ряду.

Статистика критерия Краскела — Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид:

H = i = 1 k ( 1 n i N ) { R ¯ i N + 1 2 ( N n i ) ( N + 1 ) 12 n i } 2 = 12 N ( N + 1 ) i = 1 k n i ( R ¯ i N + 1 2 ) 2 =  
= 12 N ( N + 1 ) i = 1 k R i 2 n i 3 ( N + 1 )  ,

где

R i = j = 1 n i R i j  ;
R ¯ i = 1 n i R i  .

Гипотеза сдвига отклоняется на уровне значимости α  , если H H α  , где H α   — критическое значение, при k 5   и n i 8   вычисляемое по таблицам. При бо́льших значениях применимы различные аппроксимации.

Аппроксимация Краскела — УоллисаПравить

Пусть

M = N 3 i = 1 k n i 3 N ( N + 1 )  ;
ν 1 = ( k 1 ) ( k 1 ) ( M k + 1 ) V 1 2 M V  ;
ν 2 = M k + 1 k 1 ν 1  ;
V = 2 ( k 1 ) 2 { 3 k 2 6 k + N ( 2 k 2 6 k + 1 ) } 5 N ( N + 1 ) 6 5 i = 1 k 1 n i  .

Тогда статистика F = H ( M k + 1 ) ( k 1 ) ( M H )   будет иметь при отсутствии сдвига F  -распределение с ν 1   и ν 2   степенями свободы. Таким образом, нулевая гипотеза отклоняется на уровне значимости α  , если F > F α ( ν 1 , ν 2 )  .

Аппроксимация Имана — ДавенпортаПравить

В соответствии с ней нулевая гипотеза сдвига отклоняется с достоверностью α  , если J J α  , где J = H 2 ( 1 + N k N 1 H )  ; J α = { ( k 1 ) F α ( k 1 ; N k ) + χ α 2 ( k 1 ) }  , F α ( f 1 ; f 2 )   и χ α 2 ( a )   — соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.

Это более точная аппроксимация, чем аппроксимация Краскела — Уоллиса. При наличии связанных рангов (то есть когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику H = H { 1 ( j = 1 q T j N 3 N ) } 1  , где T j = t j 3 t j  ; t j   — размер j  -й группы одинаковых элементов; q   — количество групп одинаковых элементов. При n i 20   справедлива аппроксимация распределения статистики H  ; χ 2  -распределением с f = k 1   степенями свободы, то есть нулевая гипотеза отклоняется, если H χ α 2 ( k 1 )  .

См. такжеПравить

ЛитератураПравить

  • Kruskal W. H., Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — pp. 583—621.
  • Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
  • Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.

СсылкиПравить