КОРА (алгоритм)

Алгоритм Кора́ (комбинаторного распознавания) — алгоритм классификации (взвешенного голосования правил), предложенный М. Вайнцвайгом и М. Бонгардом в 1973 г.^[1] (основы были заложены в одноимённой программе, разработка которой началась в 1961 г.) Применяется для классификации множества $\text{[math]}$ $\text{[math]}$ $M$ $M$ , характеризующегося вектором бинарных признаков $\text{[math]}$ $\text{[math]}$ $M_{i}=\{0,1\},i=1\ldots n$ $M_{i}=\{0,1\},i=1\ldots n$ , чаще всего, для задач с двумя непересекающимися классами. Данный алгоритм строит набор конъюнктивных закономерностей и доказал свою эффективность при решении практических задач.

ОписаниеПравить

В таблице $\text{[math]}$ $\text{[math]}$ $||a_{ij}||_{m\times n}$ , задающей объекты с известной классовой принадлежностью, пусть $\text{[math]}$ $\text{[math]}$ $S_{1},\ldots ,S_{q}\in K_{1}$ , $\text{[math]}$ $\text{[math]}$ $S_{q+1},\ldots ,S_{m}\in K_{2}$ . Просматриваем все тройки признаков $\text{[math]}$ $\text{[math]}$ $\{r,u,v\}$ (число таких троек, очевидно, равно $\text{[math]}$ $\text{[math]}$ $C_{n}^{3}$ и анализируем часть таблицы информационных векторов $\text{[math]}$ $\text{[math]}$ $T_{1}$ из обучающей выборки, составленную из столбцов $\text{[math]}$ $\text{[math]}$ $r, u, v$ : $\text{[math]}$ $\text{[math]}$ ${\begin{array}{ccc}a_{1r}&a_{1u}&a_{1v}\\a_{2r}&a_{2u}&a_{2v}\\\ldots &\ldots &\ldots \\a_{ir}&a_{iu}&a_{iv}\\\ldots &\ldots &\ldots \\a_{qr}&a_{qu}&a_{qv}\\\hline \\a_{q+1r}&a_{q+1u}&a_{q+1v}\\\ldots &\ldots &\ldots \\a_{jr}&a_{ju}&a_{jv}\\\ldots &\ldots &\ldots \\a_{mr}&a_{mu}&a_{mv}\\\end{array}}$

Среди первых $\text{[math]}$ $\text{[math]}$ $q$ строк выделяем и фиксируем все тройки, не совпадающие ни с одной из троек в строках $\text{[math]}$ $\text{[math]}$ $q+1,\ldots ,m$ . Формируем множество таких троек $\text{[math]}$ $\text{[math]}$ $\{(a_{ir},a_{iu},a_{iv})\}$ . Аналогично выделяем все тройки $\text{[math]}$ $\text{[math]}$ $\{(a_{jr},a_{ju},a_{jv})\}$ , не совпадающие ни с одной из первых $\text{[math]}$ $\text{[math]}$ $q$ троек. Множества $\text{[math]}$ $\text{[math]}$ $\{(a_{ir},a_{iu},a_{iv})\},\{(a_{jr},a_{ju},a_{jv})\}$ назовем, соответственно, характеристиками классов $\text{[math]}$ $\text{[math]}$ $K_{1},K_{2}$ . Такие характеристики формируем для всех троек $\text{[math]}$ $\text{[math]}$ $(r,u,v)$ . Пусть задан для распознавания объект $\text{[math]}$ $\text{[math]}$ $S=(b_{1}\ldots b_{r}\ldots b_{u}\ldots b_{v}\ldots b_{n})$ . Сравниваем все характеристики всех троек для $\text{[math]}$ $\text{[math]}$ $K_{1}$ с соответствующими тройками в распознаваемом объекте $\text{[math]}$ $\text{[math]}$ $S$ . Число совпадений $\text{[math]}$ $\text{[math]}$ $(a_{ir},a_{iu},a_{iv})=(b_{r},b_{u},b_{v})$ обозначаем $\text{[math]}$ $\text{[math]}$ $\Gamma (S,K_{1})$ — число голосов, поданных для S за класс $\text{[math]}$ $\text{[math]}$ $K_{1}$ . Аналогично формируем величину $\text{[math]}$ $\text{[math]}$ $\Gamma (S,K_{2})$ — число совпадений $\text{[math]}$ $\text{[math]}$ $(a_{jr},a_{ju},a_{jv})=(b_{r},b_{u},b_{v})$ . Вводим пороговый параметр $\text{[math]}$ $\text{[math]}$ $\nu$ . Если $\text{[math]}$ $\text{[math]}$ $\Gamma (S,K_{1})-\nu >\Gamma (S,K_{2})$ , относим $\text{[math]}$ $\text{[math]}$ $S$ классу $\text{[math]}$ $\text{[math]}$ $K_{1}$ , при $\text{[math]}$ $\text{[math]}$ $\Gamma (S,K_{2})-\nu >\Gamma (S,K_{1})$ — в класс $\text{[math]}$ $\text{[math]}$ $K_{2}$ . В остальных случаях алгоритм отказывается от классификации. На практике часто полагают $\text{[math]}$ $\text{[math]}$ $\nu =0$ .

ЛитератураПравить

Ю. И. Журавлёв. Математические основы теории прогнозирования. Лекции (2008 г.)
К. В. Воронцов. Лекции по логическим алгоритмам классификации. 2007.

ПримечанияПравить

↑ Вайнцвайг М. Н. Алгоритм обучения распознаванию образов "кора" // Алгоритмы обучения распознаванию образов / Под ред. В. Н. Вапник. М.: Советское радио, 1973. С. 110–116.

[bongard-1] Вайнцвайг М. Н. Алгоритм обучения распознаванию образов "кора" // Алгоритмы обучения распознаванию образов / Под ред. В. Н. Вапник. М.: Советское радио, 1973. С. 110–116.

[1]