Критерий согласия Пирсона

Критерий согласия Пирсона или критерий согласия $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ $\chi ^{2}$ (хи-квадрат) — непараметрический метод, который позволяет оценить значимость различий между фактическим (выявленным в результате исследования) количеством исходов или качественных характеристик выборки, попадающих в каждую категорию, и теоретическим количеством, которое можно ожидать в изучаемых группах при справедливости нулевой гипотезы. Выражаясь проще, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).

Является наиболее часто употребляемым критерием для проверки гипотезы о принадлежности наблюдаемой выборки $\text{[math]}$ $\text{[math]}$ $x_{1},x_{2},...,x_{n}$ $x_{1},x_{2},...,x_{n}$ объёмом $\text{[math]}$ $\text{[math]}$ $n$ $n$ некоторому теоретическому закону распределения $\text{[math]}$ $\text{[math]}$ $F(x,\theta )$ $F(x,\theta )$ .

Критерий хи-квадрат для анализа таблиц сопряжённости был разработан и предложен в 1900 году основателем математической статистики английским учёным Карлом Пирсоном.

Критерий может использоваться при проверке простых гипотез вида

\text{[math]}

H_{0}:F_{n}(x)=F(x,\theta ),

H_{0}:F_{n}(x)=F(x,\theta ),

где $\text{[math]}$ $\text{[math]}$ $\theta$ $\theta$ — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида

\text{[math]}

H_{0}:F_{n}(x)\in \left\{F(x,\theta ),\theta \in \Theta \right\},

H_{0}:F_{n}(x)\in \left\{F(x,\theta ),\theta \in \Theta \right\},

когда оценка $\text{[math]}$ $\text{[math]}$ ${\hat {\theta }}$ ${\hat {\theta }}$ скалярного или векторного параметра распределения $\text{[math]}$ $\text{[math]}$ $F(x,\theta )$ $F(x,\theta )$ вычисляется по той же самой выборке.

Статистика критерияПравить

Процедура проверки гипотез с использованием критериев типа $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ предусматривает группирование наблюдений. Область определения случайной величины разбивают на $\text{[math]}$ $\text{[math]}$ $k$ непересекающихся интервалов граничными точками

\text{[math]}

x_{(0)},x_{(1)},...,x_{(k-1)},x_{(k)},

где $\text{[math]}$ $\text{[math]}$ $x_{(0)}$ — нижняя грань области определения случайной величины; $\text{[math]}$ $\text{[math]}$ $x_{(k)}$ — верхняя грань.

В соответствии с заданным разбиением подсчитывают число $\text{[math]}$ $\text{[math]}$ $n_{i}$ выборочных значений, попавших в $\text{[math]}$ $\text{[math]}$ $i$ -й интервал, и вероятности попадания в интервал

\text{[math]}

P_{i}(\theta )=F(x_{(i)},\theta )-F(x_{(i-1)},\theta ),

соответствующие теоретическому закону с функцией распределения $\text{[math]}$ $\text{[math]}$ $F(x,\theta ).$

При этом

\text{[math]}

n=\sum _{i=1}^{k}n_{i}

и

\text{[math]}

\sum _{i=1}^{k}P_{i}(\theta )=1.

При проверке простой гипотезы известны как вид закона $\text{[math]}$ $\text{[math]}$ $F(x,\theta )$ , так и все его параметры (известен скалярный или векторный параметр $\text{[math]}$ $\text{[math]}$ $\theta$ ).

В основе статистик, используемых в критериях согласия типа $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ , лежит измерение отклонений $\text{[math]}$ $\text{[math]}$ $n_{i}/n$ от $\text{[math]}$ $\text{[math]}$ $P_{i}(\theta )$ .

Статистика критерия согласия $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ Пирсона определяется соотношением

\text{[math]}

\chi ^{2}=n\sum _{i=1}^{k}{\frac {\left(n_{i}/n-P_{i}(\theta )\right)^{2}}{P_{i}(\theta )}}.

В случае проверки простой гипотезы, в пределе при $\text{[math]}$ $\text{[math]}$ $n\to \infty$ эта статистика подчиняется $\text{[math]}$ $\text{[math]}$ $\chi _{r}^{2}$ -распределению с $\text{[math]}$ $\text{[math]}$ $r=k-1$ степенями свободы, если верна проверяемая гипотеза $\text{[math]}$ $\text{[math]}$ $H_{0}$ . Плотность $\text{[math]}$ $\text{[math]}$ $\chi _{r}^{2}$ -распределения, которое является частным случаем гамма-распределения, описывается формулой

\text{[math]}

g(s)={\frac {1}{2^{r/2}\Gamma (r/2)}}s^{r/2-1}e^{-s/2}.

Проверяемая гипотеза $\text{[math]}$ $\text{[math]}$ $H_{0}$ отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики $\text{[math]}$ $\text{[math]}$ $\chi _{n}^{2}$ больше критического значения $\text{[math]}$ $\text{[math]}$ $\chi _{r,\alpha }^{2},$

\text{[math]}

P\left(\chi _{n}^{2}>\chi _{r,\alpha }^{2}\right)={\frac {1}{2^{r/2}\Gamma (r/2)}}\int _{\chi _{r,\alpha }^{2}}^{\infty }s^{r/2-1}e^{-s/2}ds

или достигнутый уровень значимости ( $\text{[math]}$ p-значение) меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) $\text{[math]}$ $\text{[math]}$ $\alpha$ .

Проверка сложных гипотезПравить

При проверке сложных гипотез, если параметры закона $\text{[math]}$ $\text{[math]}$ $F(x,\theta )$ по этой же выборке оцениваются в результате минимизации статистики $\text{[math]}$ $\text{[math]}$ $\chi _{n}^{2}$ или по сгруппированной выборке методом максимального правдоподобия, то статистика $\text{[math]}$ $\text{[math]}$ $\chi _{n}^{2}$ при справедливости проверяемой гипотезы подчиняется $\text{[math]}$ $\text{[math]}$ $\chi _{r}^{2}$ -распределению с $\text{[math]}$ $\text{[math]}$ $r=k-m-1$ степенями свободы, где $\text{[math]}$ $\text{[math]}$ $m$ — количество оценённых по выборке параметров.

Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться $\text{[math]}$ $\text{[math]}$ $\chi _{k-m-1}^{2}$ -распределением^[1]. Более того, распределения статистики при справедливости гипотезы $\text{[math]}$ $\text{[math]}$ $H_{0}$ будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы^[2].

При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ ^[3]^[4]^[5]^[6].

О мощности критерияПравить

При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону, а в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что критерий по-разному будет способен отличать от закона, соответствующего $\text{[math]}$ $\text{[math]}$ $H_{0}$ , близкие или далёкие от него законы. Если задать конкурирующую гипотезу $\text{[math]}$ $\text{[math]}$ $H_{1}$ и соответствующий ей некоторый конкурирующий закон $\text{[math]}$ $\text{[math]}$ $F_{1}(x,\theta )$ , то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы $\text{[math]}$ $\text{[math]}$ $H_{0}$ при её справедливости) и вероятности этой ошибки $\text{[math]}$ $\text{[math]}$ $\alpha$ , но и об ошибке 2-го рода (неотклонении $\text{[math]}$ $\text{[math]}$ $H_{0}$ при справедливости $\text{[math]}$ $\text{[math]}$ $H_{1}$ ) и вероятности этой ошибки $\text{[math]}$ $\text{[math]}$ $\beta$ .

Мощность критерия по отношению к конкурирующей гипотезе $\text{[math]}$ $\text{[math]}$ $H_{1}$ характеризуется величиной $\text{[math]}$ $\text{[math]}$ $1-\beta$ . Критерий тем лучше распознаёт пару конкурирующих гипотез $\text{[math]}$ $\text{[math]}$ $H_{0}$ и $\text{[math]}$ $\text{[math]}$ $H_{1}$ , чем выше его мощность.

Мощность критерия согласия $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ Пирсона существенно зависит от способа группирования^[7]^[8] и от выбранного числа интервалов^[8]^[9].

При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием), критерий согласия $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез^[10]^[8]^[9].

При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет^[11]^[12]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счёт выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия^[13].

См. такжеПравить

Точный критерий Фишера

ПримечанияПравить

↑ Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ test for goodness of fit (англ.) // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.
↑ Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ Пирсона и отношения правдоподобия от способа группирования данных (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 5. — С. 56-63.
↑ Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 583—591.
↑ Никулин М. С. О критерии хи-квадрат для непрерывных распределений (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 675—676.
↑ Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family (англ.) // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.
↑ Greenwood P. E., Nikulin M. S. A guide to chi-squared testing (англ.). — New York: John Wiley & Sons, 1996. — 280 p.
↑ Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 1. — С. 56—64.
↑ ¹ ² ³ Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2006. — 87 с.
↑ ¹ ² Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ (рус.) // Заводская лаборатория. Диагностика материалов. — 2003. — Т. 69, вып. 1. — С. 61—67.
↑ Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.
↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 2(34). — С. 96—111.
↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 4(36). — С. 78—93.
↑ Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н., Чимитова Е. В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход (рус.). — Новосибирск: Изд-во НГТУ, 2011. — 888 с. — (Монографии НГТУ). — ISBN 978-5-7782-1590-0. — Раздел 4.9.

ЛитератураПравить

Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.

См. такжеПравить

СсылкиПравить

[1] Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ test for goodness of fit (англ.) // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.

[2] Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ Пирсона и отношения правдоподобия от способа группирования данных (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 5. — С. 56-63.

[3] Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 583—591.

[4] Никулин М. С. О критерии хи-квадрат для непрерывных распределений (рус.) // Теория вероятностей и её применение. — 1973. — Т. XVIII, вып. 3. — С. 675—676.

[5] Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family (англ.) // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.

[6] Greenwood P. E., Nikulin M. S. A guide to chi-squared testing (англ.). — New York: John Wiley & Sons, 1996. — 280 p.

[7] Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия (рус.) // Заводская лаборатория. — 1998. — Т. 64, вып. 1. — С. 56—64.

[R50_1_033-8] ¹ ² ³ Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2006. — 87 с.

[Z_lab_8-9] ¹ ² Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа $\text{[math]}$ $\text{[math]}$ $\chi ^{2}$ (рус.) // Заводская лаборатория. Диагностика материалов. — 2003. — Т. 69, вып. 1. — С. 61—67.

[10] Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.

[11] Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 2(34). — С. 96—111.

[12] Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез (рус.) // Сибирский журнал индустриальной математики. — 2008. — Т. 11, вып. 4(36). — С. 78—93.

[13] Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н., Чимитова Е. В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход (рус.). — Новосибирск: Изд-во НГТУ, 2011. — 888 с. — (Монографии НГТУ). — ISBN 978-5-7782-1590-0. — Раздел 4.9.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]