Это не официальный сайт wikipedia.org 01.01.2023

Критерий знаков — Википедия

Критерий знаков

В математической статистике критерий знаков используется при проверке нулевой гипотезы о равенстве медианы некоторому заданному значению (для одной выборки) или о равенстве нулю медианы разности (для двух связанных выборок).[1] Это непараметрический критерий, то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность, чем более специализированные критерии.

Описание метода для двух выборокПравить

Рассмотрим две непрерывно распределенные случайные величины X и Y, и пусть нулевая гипотеза выполняется, то есть медиана их разности равна нулю. Тогда p = P ( X > Y ) = 0.5  . Иными словами, каждая из случайных величин равновероятно больше другой.

Рассмотрим пару связных выборок { ( x 1 , y 1 ) , , ( x n , y n ) }  . Будем считать, что в выборке нет элементов, для которых x i = y i   (иначе уберем эти элементы из выборки). Построим статистику w, равную числу элементов в выборке, при которых x i > y i  . При выполнении нулевой гипотезы, эта величина имеет биномиальное распределение: w B ( n , 0.5 )  .

Для применения критерия необходимо вычислить «левый хвост» биномиального распределения до w: b = 2 n i = 0 w C n i  . Согласно критерию, при уровне значимости α  :

  • против двусторонней альтернативной гипотезы p 0.5  
если b [ α / 2 , 1 α / 2 ]  , то нулевая гипотеза отвергается;
  • против альтернативы p < 0.5  
если b < α  , то нулевая гипотеза отвергается;
  • против альтернативы p > 0.5  
если b > 1 α  , то нулевая гипотеза отвергается;

Пример задачиПравить

Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения.

Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки и называются связанными.

Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Заданы две выборки одинаковой длины x n = ( x 1 , , x n ) , x i R ; y n = ( y 1 , , y n ) , y i R  .

Дополнительные предположения:

  • обе выборки простые;
  • выборки связные, то есть элементы x i , y i   соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза H 0 : P { x > y } = 1 / 2  .

Если в выборке имеются случаи x i = y i  , то их следует исключить из выборки, уменьшив число наблюдений. Статистика критерия — это число w элементов в выборке, при которых x i > y i  .

СсылкиПравить

  1. The Sign Test for a Median Архивная копия от 29 сентября 2017 на Wayback Machine // STAT 415 Intro Mathematical Statistics. Penn State University.