Это не официальный сайт wikipedia.org 01.01.2023

Парадокс Линдли — Википедия

Парадокс Линдли

Парадокс Линдли — это контринтуитивная ситуация в статистике, при которой байесовский и частотный[en] подходы к задаче проверки гипотез дают различные результаты при определённых выборах априорного распределения. Проблема разногласия между двумя подходами обсуждалась в книге Гарольда Джеффриса 1939 года[1]. Проблема стала известна как парадокс Линдли после того, как Деннис Линдли высказал несогласие с парадоксом в статье 1957[2].

Хотя ситуация описывается как парадокс, различие байесовского и частотного подходов можно объяснить как использования их для ответа на фундаментально различные вопросы, а не действительного разногласия между двумя методами.

Как бы то ни было, для большого класса априорные разности между частотным и байесовским подходами вызваны сохранением уровня значимости. Как Линдли понял: «теория не может обосновать практику сохранения уровня значимости» и даже «некоторые вычисления, сделанные профессором Пирсоном в обсуждении этой статьи подчёркивают, насколько уровень значимости может меняться с изменением размера выборки, если потери и априорные вероятности остаются неизменными»[2]. Фактически, если критичное значение растёт с ростом размера выборки достаточно быстро, рассогласование между частотным и байесовским подходами становится ничтожным[3][4].

Описание парадоксаПравить

Рассмотрим результат x   некоторого эксперимента с двумя возможными объяснениями, гипотезами H 0   и H 1  , и некоторым априорным распределением π  , представляющим неопределённость, какая гипотеза более точна перед рассмотрением x  .

Парадокс Линдли обнаруживается в случае:

  1. Результат x   оказывается «значимым» для частотного теста гипотезы H 0  , показывающим значимое свидетельство к отбрасыванию гипотезы H 0  , скажем, на уровне 5 %.
  2. Апостериорная вероятность гипотезы H 0  , задаваемая результатом x   высока, что убедительно свидетельствует о том, что гипотеза H 0   больше согласуется с x  , чем гипотеза H 1  .

Эти результаты могут случиться в одно и то же время, если H 0   очень специфично, H 1   более размыто, а априорное распределение не даёт предпочтения ни одному из них, как показано ниже.

Численный примерПравить

Мы можем проиллюстрировать парадокс Линдли численным примером. Представим себе город, в котором родились 49581 мальчиков и 48870 девочек за определённый период времени. Наблюдаемая доля x   мальчиков составляет 49581/98451 ≈ 0,5036. Мы предполагаем, что число рождений мальчиков является биномиальной переменной с параметром θ  . Мы хотим проверить, равно ли θ   0,5 или другому значению. То есть наша нулевая гипотеза гласит: H 0 : θ = 0 , 5  , а альтернативной гипотезой будет H 1 : θ 0 , 5  .

Частотный подходПравить

Частотный подход проверки H 0   заключается в вычислении p-значения, вероятности наблюдения доли мальчиков не менее x   в предположении, что гипотеза H 0   верна. Поскольку число рождений большое, мы можем использовать нормальную аппроксимацию для доли рождения мальчиков X N ( μ , σ 2 )  , с μ = n p = n θ = 98451 × 0 , 5 = 49225 , 5   и σ 2 = n θ ( 1 θ ) = 98451 × 0 , 5 × 0 , 5 = 24612 , 75   для вычисления

P ( X x μ = 49225 , 5 ) = x = 49581 98451 1 2 π σ 2 e ( u μ σ ) 2 / 2 d u = x = 49581 98451 1 2 π ( 24612 , 75 ) e ( u 49225 , 5 ) 2 24612 , 75 / 2 d u 0 , 0117.  

Мы также будем удивлены, если рассмотрим рождение 48870 девочек, то есть x 0 , 4964  , так что частотный тест обычно осуществаляет двухстороннюю проверку, для которой p-значение было бы p 2 × 0 , 0117 = 0 , 0235  . В обоих случаях p-значение меньше уровня значимости α   в 5%, так что частотный подход отвергает гипотезу H 0   как несогласующуюся с наблюдаемыми данными.

Байесовский подходПравить

Предполагая, что нет причин для предпочтения одной гипотезы другой, байесовский подход заключается в назначении априорных вероятностей π ( H 0 ) = π ( H 1 ) = 0 , 5  , однородного распределения для θ   для гипотезы H 1   и, затем, вычисления апостериорной вероятности для H 0   с помощью теоремы Байеса,

P ( H 0 k ) = P ( k H 0 ) π ( H 0 ) P ( k H 0 ) π ( H 0 ) + P ( k H 1 ) π ( H 1 ) .  

После наблюдения рождения k = 49581   мальчиков из n = 98451   новорождённых мы можем вычислить апостериорную вероятность каждой гипотезы с помощью функции распределения масс для биномиальной переменной,

P ( k H 0 ) = ( n k ) ( 0 , 5 ) k ( 1 0 , 5 ) n k 1 , 95 × 10 4 P ( k H 1 ) = 0 1 ( n k ) θ k ( 1 θ ) n k d θ = ( n k ) B ( k + 1 , n k + 1 ) = 1 / ( n + 1 ) 1 , 02 × 10 5  

где B ( a , b )   является бета-функцией.

Из этих значений мы находим апостериорную вероятность P ( H 0 k ) 0 , 95  , которая строго предпочитает H 0   перед H 1  .

Два подхода, частотный и байесовский, оказываются в конфликте, а это и есть «парадокс».

Примирение байесовского и частотного подходовПравить

Однако, по меньшей мере, в примере Линдли, если мы возьмём последовательность уровней значимости α n  , таких, что α n = n k   с k > 1 2  , то апостериорная вероятность нулевой гипотезы стремится к 0, что согласуется с отказом от нулевой гипотезы[3]. В нашем числовом примере, если принять k > 1 2  , в результате получим уровень значимости 0,00318, так что частотный подход не будет отбрасывать нулевую гипотезу, которая в общих чертах согласуется с байесовским подходом.

 
Распределение p при нулевой гипотезе и апостериорное распределение p.

Если используется информативное априорное распределение и проверка гипотезы, более похожей на гипотезу в частотном подходе, парадокс исчезает.

Например, если мы вычисляем апостериорное распределение P ( θ x , n )  , используя однородное априорное распределение с θ   (то есть π ( θ [ 0 , 1 ] ) = 1  ), мы получим

P ( θ k , n ) = B ( k + 1 , n k + 1 ) .  

Если мы используем это для проверки вероятности, что новорождённый более вероятно будет мальчиком, чем девочкой, то есть P ( θ > 0 , 5 k , n )  , мы получим:

0 , 5 1 B ( 49582 , 48871 ) 0 , 983.  

Другими словами, очень похоже, что пропорция рождения мальчиков выше 0,5.

Ни один из анализов не даёт оценку величины эффекта[en] прямо, но оба могут быть использованы для определения, например, является ли доля рождений мальчиков выше некоторого определённого порога.

Отсутствие действительного парадоксаПравить

Явное расхождение между двумя подходами вызвано комбинацией факторов. Во-первых, частотный подход проверяет H 0   выше без учёта H 1  . Байесовский подход вычисляет H 0   как альтернативу к H 1   и находит, что первая гипотеза больше согласуется с наблюдениями. Это потому, что последняя гипотеза существенно более размыта, так как значение θ   может быть любым в интервале [ 0 , 1 ]  , что приводит к очень низкой апостериорной вероятности. Чтобы понять, почему, полезно рассмотреть две гипотезы как генераторы наблюдений:

  • В гипотезе H 0   мы выбираем θ 0 , 500   и задаём вопрос, насколько правдоподобно видеть 49581 мальчика при 98451 новорождённом.
  • В гипотезе H 1   мы выбираем θ   случайно между 0 и 1 и задаём тот же вопрос.

Большинство возможных значений для θ   при гипотезе H 1   очень плохо поддерживаются наблюдениями. По существу, явное несогласие между методами вообще не является несогласием, а являются двумя различными утверждениями относительно данных:

  • Частотный подход находит, что H 0   плохо объясняется наблюдениями.
  • Байесовский подход находит, что гипотеза H 0   существенно лучше объясняется наблюдениями, чем гипотеза H 1  .

Отношение пола новорождённых в 50/50 (мальчиков/девочек) согласно частотному тесту неправдоподобно. Всё же отношение 50/50 является лучшим приближением, чем большинство, но не все другие отношения. Гипотеза θ 0 , 504   подходила бы наблюдениям много лучше, чем все другие отношения, включая θ 0 , 500  .


Например[5], из этого выбора гипотезы и априорной вероятности следует утверждение: «Если θ   > 0,49 и θ   < 0,51, то априорная вероятность θ   быть ровно 0,5 равна 0,50/0,51   98 %». Если дано такое сильное предпочтение для θ = 0 , 5  , легко видеть, что байесовский подход высказывается в пользу H 0  , учитывая, что x 0 , 5036  , даже когда наблюдаемое значение x   лежит в 2 , 28 σ   от 0,5. Отклонение более 2 σ   от H 0   считается значимым в частотном подходе, но значимость отклоняется априорной вероятностью в байесовском подходе.

Если смотреть в другую сторону, мы можем видеть, что априорное распределение существенно плоским с дельта-функцией в точке θ = 0 , 5  . Ясно, что является сомнительным. Фактически, если вы попробуете нарисовать вещественные числа как непрерывные, будет логично предположить, что невозможно для заданного параметра P ( θ = 0 , 5 ) = 0  .

Более реалистичное распределение для θ   на альтернативной гипотезе даёт менее удивительные результаты для апостериорной вероятности гипотезы H 0  . Например, если мы заменим H 1   на H 2 : θ = x  , то есть оценку максимального правдоподобия для θ  , апостериорная вероятность гипотезы H 0   будет только 0,07 по сравнению с 0,93 для гипотезы H 2   (конечно, нельзя использовать в действительности оценку максимального правдоподобия как часть априорного распределения).

Современное обсуждениеПравить

Парадокс продолжает активно обсуждаться[3][6][7].

См. такжеПравить

ПримечанияПравить

  1. Jeffreys, 1939.
  2. 1 2 Lindley, 1957, с. 187–192.
  3. 1 2 3 Spanos, 2013, с. 73–93.
  4. Naaman, 2016, с. 1526–1550.
  5. Данный раздел в английской версии подвергается критике как требующий полной переработки.
  6. Sprenger, 2013, с. 733–744.
  7. Robert, 2014.

ЛитератураПравить