Критерий Граббса
Критерий Граббса — статистический тест, используемый для определения выбросов в одномерном наборе данных, подчиняющихся нормальному закону распределения. Был предложен в 1950 году Франком Граббсом[1].
ОпределениеПравить
Критерий Граббса основан на предположении о нормальном распределении. Таким образом, перед расчётом критерия Граббса необходимо проверить данные на нормальное распределение[2].
Критерий Граббса определяет один выброс за одну итерацию. Этот выброс исключается из набора данных и тест повторяется до тех пор, пока не будут обнаружены все выбросы. Тем не менее, множественные итерации изменяют вероятность определения и критерий не следует применять при 3 или менее значениях, так как в такой ситуации часто большинство точек оказываются идентифицированы как выбросы.
Критерий Граббса определён для гипотез:
- H0: В наборе данных нет выбросов
- Ha: В наборе данных присутствует как минимум один выброс
Критерий Граббса рассчитывается как:
где и означают выборочное среднее и среднеквадратичное отклонение соответственно. Значение критерия Граббса показывает максимальное абсолютное отклонение от выборочного среднего в единицах среднеквадратичного отклонения.
Этот способ расчёта относится к двусторонней версии теста. Критерий Граббса также может быть определён как односторонний тест. Для определения того, является ли минимальное значение выбросом, рассчитывается критерий:
где Ymin означает минимальное значение. Для определения того, является ли максимальное значение выбросом, рассчитывается критерий:
где Ymax означает максимальное значение.
Для двустороннего теста (англ.) (рус. гипотеза об отсутствии выбросов отклоняется с уровнем значимости α, если:
где tα/(2N),N−2 означает максимальное критическое значение (англ.) (рус. распределения Стьюдента с N − 2 степенями свободы и уровнем значимости α/(2N). Для одностороннего критерия α/(2N) следует заменить на α/N.
Сопутствующие методикиПравить
Некоторые статистические графики (англ.) (рус. могут и должны использоваться для определения выбросов. Простой график выполняемой последовательности (англ.) (рус., диаграмма размаха или гистограмма отображают очевидные выбросы. График нормального распределения (англ.) (рус. также может быть полезен.
См. такжеПравить
- Критерий Шовене (англ.) (рус.
- Критерий Пирса (англ.) (рус.
- Критерий Диксона (англ.) (рус.
ПримечанияПравить
Для улучшения этой статьи желательно:
|
- ↑ Grubbs, Frank E. Sample criteria for testing outlying observations (неопр.) // Annals of Mathematical Statistics (англ.) (рус.. — 1950. — Т. 21, № 1. — С. 27—58. — doi:10.1214/aoms/1177729885. (англ.)
- ↑ Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm Архивная копия от 19 июня 2019 на Wayback Machine (англ.)
СсылкиПравить
- Grubbs, Frank. Procedures for Detecting Outlying Observations in Samples (англ.) // Technometrics (англ.) (рус. : journal. — Technometrics, Vol. 11, No. 1, 1969. — February (vol. 11, no. 1). — P. 1—21. — doi:10.2307/1266761. — JSTOR 1266761. (англ.)
- Stefansky, W. Rejecting Outliers in Factorial Designs (англ.) // Technometrics (англ.) (рус. : journal. — Technometrics, Vol. 14, No. 2, 1972. — Vol. 14, no. 2. — P. 469—479. — doi:10.2307/1267436. — JSTOR 1267436. (англ.)