Это не официальный сайт wikipedia.org 01.01.2023

Показатели центра распределения — Википедия

Показатели центра распределения

Для определения средних или наиболее типичных значений совокупности используются показатели центра распределения. Основные из них — математическое ожидание, среднее арифметическое, среднее геометрическое, среднее гармоническое, среднее степенное, взвешенные средние, центр сгиба, медиана, мода.

Расчёт средних величин производится разными способами, и, соответственно, применение их тоже зависит от исследуемой совокупности.

У симметричного одномерного унимодального распределения математическое ожидание, медиана и мода одинаковы.

Математическое ожиданиеПравить

M ξ = x f ξ ( x ) d x  .

В зарубежной литературе применяется обозначение E ξ  .

В случае дискретной величины x   и постоянной плотности f ξ ( x )   применяется выборочное среднее:

X ¯ = 1 n i = 1 n X i  .

Преимущества: если эксперимент повторяется многократно, а результаты суммируются (например, в страховании, азартных играх), математическое ожидание — естественный выбор.

Недостатки: не соответствует интуитивному пониманию «среднего»; меньшинство с аномальными значениями (долгожители, миллиардеры, бракованные изделия и т. д.) серьёзно смещают матожидание. В статистических расчётах рекомендуется отбрасывать такой «хвост».

МедианаПравить

У одномерного распределения медиана — квантиль уровня 0,5. Иными словами, медиана — это такое число m  , что P { ξ < m } = 0 , 5   или P { ξ <= m } = 0 , 5  .

Преимущества: Медиана согласуется с интуитивным пониманием «среднего». К тому же, даже очень «дикие» выбросы изменяют медиану незначительно. Например, если к сотне бедняков (доходы равномерно распределены от 0 до 1 $) добавить одного миллиардера (1 млрд $), среднее сместится от 0,5 $ до 10 млн $, в то время как медиана — от 0,5 $ до 0,505. Монотонная функция не изменяет медиану — для любой монотонной f ( x )   будет выполняться Med f ( ξ ) = f ( Med ξ )  .

Недостатки: плохо работает для многомерных распределений со сложной взаимосвязью компонентов. Сложна в расчёте.

МодаПравить

Мода — точка, в которой плотность распределения имеет локальный максимум. Распределение может иметь несколько мод.

Преимущества: позволяет работать с данными нечисловой природы.

Недостаток: не учитывает поведение распределения в других точках.