Это не официальный сайт wikipedia.org 01.01.2023

Критерий Граббса — Википедия

Критерий Граббса

Критерий Граббса — статистический тест, используемый для определения выбросов в одномерном наборе данных, подчиняющихся нормальному закону распределения. Был предложен в 1950 году Франком Граббсом[1].

ОпределениеПравить

Критерий Граббса основан на предположении о нормальном распределении. Таким образом, перед расчётом критерия Граббса необходимо проверить данные на нормальное распределение[2].

Критерий Граббса определяет один выброс за одну итерацию. Этот выброс исключается из набора данных и тест повторяется до тех пор, пока не будут обнаружены все выбросы. Тем не менее, множественные итерации изменяют вероятность определения и критерий не следует применять при 3 или менее значениях, так как в такой ситуации часто большинство точек оказываются идентифицированы как выбросы.

Критерий Граббса определён для гипотез:

H0: В наборе данных нет выбросов
Ha: В наборе данных присутствует как минимум один выброс

Критерий Граббса рассчитывается как:

G = max i = 1 , , N | Y i Y ¯ | s  

где Y ¯   и s   означают выборочное среднее и среднеквадратичное отклонение соответственно. Значение критерия Граббса показывает максимальное абсолютное отклонение от выборочного среднего в единицах среднеквадратичного отклонения.

Этот способ расчёта относится к двусторонней версии теста. Критерий Граббса также может быть определён как односторонний тест. Для определения того, является ли минимальное значение выбросом, рассчитывается критерий:

G = Y ¯ Y min s  

где Ymin означает минимальное значение. Для определения того, является ли максимальное значение выбросом, рассчитывается критерий:

G = Y max Y ¯ s  

где Ymax означает максимальное значение.

Для двустороннего теста  (англ.) (рус. гипотеза об отсутствии выбросов отклоняется с уровнем значимости α, если:

G > N 1 N t α / ( 2 N ) , N 2 2 N 2 + t α / ( 2 N ) , N 2 2  

где tα/(2N),N−2 означает максимальное критическое значение  (англ.) (рус. распределения Стьюдента с N − 2 степенями свободы и уровнем значимости α/(2N). Для одностороннего критерия α/(2N) следует заменить на α/N.

Сопутствующие методикиПравить

Некоторые статистические графики  (англ.) (рус. могут и должны использоваться для определения выбросов. Простой график выполняемой последовательности  (англ.) (рус., диаграмма размаха или гистограмма отображают очевидные выбросы. График нормального распределения  (англ.) (рус. также может быть полезен.

См. такжеПравить

ПримечанияПравить

  1. Grubbs, Frank E. Sample criteria for testing outlying observations (неопр.) // Annals of Mathematical Statistics  (англ.) (рус.. — 1950. — Т. 21, № 1. — С. 27—58. — doi:10.1214/aoms/1177729885(англ.)
  2. Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm Архивная копия от 19 июня 2019 на Wayback Machine (англ.)

СсылкиПравить

  • Grubbs, Frank. Procedures for Detecting Outlying Observations in Samples (англ.) // Technometrics  (англ.) (рус. : journal. — Technometrics, Vol. 11, No. 1, 1969. — February (vol. 11, no. 1). — P. 1—21. — doi:10.2307/1266761. — JSTOR 1266761(англ.)
  • Stefansky, W. Rejecting Outliers in Factorial Designs (англ.) // Technometrics  (англ.) (рус. : journal. — Technometrics, Vol. 14, No. 2, 1972. — Vol. 14, no. 2. — P. 469—479. — doi:10.2307/1267436. — JSTOR 1267436(англ.)