Метод k-медиан

Метод $\text{[math]}$ $\text{[math]}$ $k$ $k$ -медиан^[1]^[2] — применяемая в статистике и машинном обучении вариация метода $\text{[math]}$ $\text{[math]}$ $k$ $k$ -средних для задач кластеризации, где для определения центроида кластера вместо среднего вычисляется медиана. Такой подход соответствует минимизации ошибки по всем кластерам в метрике с 1-нормой, вместо метрики с 2-нормой, используемой в стандартном методе $\text{[math]}$ $\text{[math]}$ $k$ $k$ -средних.

Задача определения $\text{[math]}$ $\text{[math]}$ $k$ $k$ -медиан состоит в поиске таких $\text{[math]}$ $\text{[math]}$ $k$ $k$ центров, что сформированные по ним кластеры будут наиболее «компактными». Формально, при заданных точках данных $\text{[math]}$ $\text{[math]}$ $x_{i}$ $x_{i}$ , $\text{[math]}$ $\text{[math]}$ $k$ $k$ центров $\text{[math]}$ $\text{[math]}$ $c_{j}$ $c_{j}$ должны быть выбраны так, чтобы минимизировать сумму расстояний от каждой $\text{[math]}$ $\text{[math]}$ $x_{i}$ $x_{i}$ до ближайшего $\text{[math]}$ $\text{[math]}$ $c_{j}$ $c_{j}$ .

Метод иногда работает лучше, чем метод $\text{[math]}$ $\text{[math]}$ $k$ $k$ -средних, где минимизируется сумма квадратов расстояний. Критерий суммы расстояний широко используется для транспортных задач^[3].

Ещё альтернатива — метод $\text{[math]}$ $\text{[math]}$ $k$ $k$ -медоидов, в котором ищут оптимальный медоид, а не медиану кластера (медоид является одной из точек данных, в то время как медианы таковыми быть не обязаны).

СсылкиПравить

↑ A. K. Jain and R. C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.
↑ P. S. Bradley, O. L. Mangasarian, and W. N. Street, "Clustering via Concave Minimization, " in Advances in Neural Information Processing Systems, vol. 9, M. C. Mozer, M. I. Jordan, and T. Petsche, Eds. Cambridge, MA: MIT Press, 1997, pp. 368—374.
↑ Архивированная копия (неопр.). Дата обращения: 24 октября 2010. Архивировано 3 апреля 2022 года.

[1] A. K. Jain and R. C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.

[2] P. S. Bradley, O. L. Mangasarian, and W. N. Street, "Clustering via Concave Minimization, " in Advances in Neural Information Processing Systems, vol. 9, M. C. Mozer, M. I. Jordan, and T. Petsche, Eds. Cambridge, MA: MIT Press, 1997, pp. 368—374.

[3] Архивированная копия (неопр.). Дата обращения: 24 октября 2010. Архивировано 3 апреля 2022 года.

[1]

[2]

[3]