Статистическая значимость

В статистике величину (значение) переменной называют статисти́чески зна́чимой, если мала вероятность случайного возникновения этой или ещё более крайних величин. Здесь под крайностью понимается степень отклонения тестовой статистики от нуль-гипотезы.

Разница называется статистически значимой, если появление имеющихся данных (или ещё более крайних данных) было бы маловероятно, если предположить, что эта разница отсутствует; это выражение не означает, что данная разница должна быть велика, важна, или значима в общем смысле этого слова.

Общая картина проблемы такова: дана выборка из некоторого пространства $\text{[math]}$ $\text{[math]}$ $\Omega$ $\Omega$ элементарных событий (например, список пациентов, прошедших обследование на некоторую болезнь) и, возможно, значения на этой выборке некоторых переменных (функций от $\text{[math]}$ $\text{[math]}$ $\omega \in \Omega$ $\omega \in \Omega$ , например — возраст пациента, интенсивность курения, количество часов физических упражнений и т. п.). Вероятностное распределение на $\text{[math]}$ $\text{[math]}$ $\Omega$ $\Omega$ не известно, а, наоборот, является здесь главным объектом поиска.

Различные гипотезы соответствуют различным возможным вероятностным распределениям на $\text{[math]}$ $\text{[math]}$ $\Omega$ $\Omega$ . Точный смысл термина «гипотеза» — набор утверждений, который содержит полное описание некоторого вероятностного распределения.

Проверка гипотезыПравить

Проверка гипотезы $\text{[math]}$ $\text{[math]}$ $H$ $H$ (задающей вероятностное распределение $\text{[math]}$ $\text{[math]}$ $P_{H}$ $P_{{H}}$ ) состоит в следующем. Выбирается событие $\text{[math]}$ $\text{[math]}$ $S\subset \Omega$ $S\subset \Omega$ (называемое статистическим критерием), которое (по каким-либо соображениям) «почти несовместимо» с гипотезой $\text{[math]}$ $\text{[math]}$ $H$ $H$ в том смысле, что условная вероятность $\text{[math]}$ $\text{[math]}$ $P_{H}(S)$ $P_{{H}}(S)$ события $\text{[math]}$ $\text{[math]}$ $S$ $S$ (при условии, что гипотеза $\text{[math]}$ $\text{[math]}$ $H$ $H$ верна) не превышает какого-то малого (по сравнению с единицей) числа $\text{[math]}$ $\text{[math]}$ $\alpha$ $\alpha$ , называемого уровнем значимости: $\text{[math]}$ $\text{[math]}$ $P_{H}(S)\leq \alpha$ $P_{H}(S)\leq \alpha$ . Затем проводится опыт. Если событие $\text{[math]}$ $\text{[math]}$ $S$ $S$ происходит, то гипотеза $\text{[math]}$ $\text{[math]}$ $H$ $H$ отвергается (говорят, что наблюдается отклонение от гипотезы на уровне значимости $\text{[math]}$ $\text{[math]}$ $\alpha$ $\alpha$ ). В противном случае, гипотеза не отвергается (однако никакой метод статистики, ни даже науки в целом, не может «окончательно доказать» гипотезу).

Таким образом, уровень $\text{[math]}$ $\text{[math]}$ $\alpha$ $\alpha$ значимости теста — вероятность отклонить гипотезу $\text{[math]}$ $\text{[math]}$ $H$ $H$ , если на самом деле она верна (решение известное как ошибка первого рода, или ложноположительное решение).

Популярными уровнями значимости являются 10 %, 5 %, 1 %, и 0,1 %.

Различные значения α-уровня имеют свои достоинства и недостатки. Меньшие α-уровни дают бо́льшую уверенность в том, что уже установленная альтернативная гипотеза значима, но при этом есть больший риск не отвергнуть ложную нулевую (или отвергнуть истинную альтернативную) гипотезу (ошибка второго рода, или «ложноотрицательное решение»), и таким образом меньшая статистическая мощность. Выбор α-уровня неизбежно требует компромисса между значимостью и мощностью, и следовательно между вероятностями ошибок первого и второго рода.

При использовании тестов на статистическую значимость нужно иметь в виду, что тест вовсе не дает оснований для принятия гипотезы^[1].

См. такжеПравить

ПримечанияПравить

↑ Keith M. Bower and James A. Colton. Why We Don’t «Accept» the Null Hypothesis Архивная копия от 22 декабря 2015 на Wayback Machine // American Society for Quality, Six Sigma Forum, July 2003.

ЛитератураПравить

Значимости уровень // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.
Тутубалин В. Н. Глава 1, параграф 7. // Теория вероятностей и случайных процессов. — 1992. Архивная копия от 5 ноября 2015 на Wayback Machine
George Casella, Roger L. Berger. Hypothesis Testing // Statistical Inference. — Second Edition. — Pacific Grove, CA: Duxbury, 2002. — С. 397. — 660 с. — ISBN 0-534-24312-6.

СсылкиПравить

О неправильном употреблении термина «достоверность» в российских научных психиатрических и общемедицинских статьях

[1] Keith M. Bower and James A. Colton. Why We Don’t «Accept» the Null Hypothesis Архивная копия от 22 декабря 2015 на Wayback Machine // American Society for Quality, Six Sigma Forum, July 2003.

[1]