Анализ и обоснование подхода к решению задачи.

Исходя из особенностей практических приложений задачи распознавания образов традиционно формулируются в 2-х (в некоторых случаях эквивалентных) постановках:

- (1*) для многомерного пространства, где объекты классификации задаются одной многомерной точкой и

- (2*) для многомерного пространства, где объекты задаются, как подмножества многомерных точек (многомерных измерений).

Подавляющее число методов и алгоритмов распознавания образов были разработаны для решения задач классификации в первой постановке, для второго случая рассматриваются, как правило, подходы к сведению задачи к постановке (1*). Исторически, постановка (2*) рассматривалась, как задача распознавания кривых, или, в более сложном случае, плоских геометрических объектов (например букв).

И так, имеем множество кривых (одна из них приведена на - рис.2), заданных, каждая, множеством двухмерных точек (или графиком - рис.2) и множество геометрических форм (рис.3), заданных на условной (пиксельной) сетке. Для решения задачи распознавания кривых чаще применяется координатный подход, для распознавания геометрических форм - пиксельный.

Рис.2 К задача распознавания Рис.3 К задаче распознавания

Для описания первой задачи классификации в форме постановки (1*), кривые (рис.2) определяются значением признака z ₁, как значением z (t₁),..., значение признака z _n принимается, как значение z (t_n). Для описания второй задачи в форме постановки (1*), значениями переменных z_i есть степени заштрихованности (яркости, цветности) соответствующего пикселя. Признаки интерпретируются, как случайные величины, задача нахождения классификатора сводится к получению распределений значений признаков в классах и нахождению дискриминантной функции позволяющей разделить эти распределения [1]. Однако существуют известные препятствия на пути классического подхода:

1.Построение многомерных (а в данном случае, очень многомерных) распределений требует значительных объемов обучающих выборок и выполнения достаточно жестких предположений о виде функций распределения (например нормальность)

2.Крайне желательно применить целесообразные процедуры сокращения размерности пространства переменных

3.В общем случае, когда объекты классификации задаются в многомерном пространстве, и при этом, представлены, каждый, подмножеством многомерных точек, решение задачи классификации требует построения плотностей распределения, размерностью, на порядки большей, чем в рассмотренных выше случаях. Таким образом, в общей постановке данный подход уже не конструктивен. Рассмотрим ниже еще два возможные пути решения проблемы.

Пусть в пространстве

заданы обучающие подмножества

...,

объектов

, где i - индекс класса, j - индекс объекта в классе. Каждый объект

описывается в пространстве

подмножествами

многомерных точек (вектор-строк) матрицы объект-свойства

. Пусть данные в матрице объект-свойства упорядочены по классам. Обозначим

- количество объектов в k -том классе,

- количество объектов в матрице. Тогда

- количество точек в k-м классе, если количество точек в каждом объекте k-го класса одинаково и равно

, и

если количество точек в объектах

различно и равно

. Здесь

- подмножества точек в соответствующих классах и отдельных объектах класса k, соответственно. Общее количество точек (строк) в матрице данных

. Существенным далее есть то, что для каждого объекта

известна не одна, а некоторое подмножество точек

, тут

, где i - номер объекта в классе k. Существенным есть также то, что, в общем случае, области существования объектов

, представленные в обучении подмножествами векторов

, могут частично пересекаться, при этом указанные объекты, могут принадлежать и различным классам [2]. Тогда возможно рассматривать следующие 2 пути для сведения постановки (2*) задачи классификации к постановке (1*):

1. Необходимо определить свертку типа

подмножества многомерных векторов в некоторую многомерную точку

, таким образом, чтобы она однозначно определяла объект в своем классе в исходном пространстве признаков z₁…..z _M. Определение такой свертки должно сопровождаться условиями наилучшей классификации объектов в данном классе сверток.

2. Пусть в исходном пространстве признаков z₁…..z _M описание объекта d дается подмножеством точек , неизвестной нам характеристики объекта f_d( z_1,…,z _M)=0. Тогда указанных характеристик предполагается столько, сколько объектов:

Далее, рассматриваем тот случай, задачи, когда среди исходных переменных z₁,…,z _M возможно выделить выходную переменную.

Определим новое пространство признаков x, как пространство обобщенных переменных (ОП) x₁, x₂,…,x _М ₁полученных из переменных исходного пространства

, при этом ОП x₁, x₂,…,x _М ₁ наилучшим образом представляют характеристики f_d( z_1,…,z _M)= 0 d=1,..,n по исходным множествам точек уже как линейные свертки по х _i. Тогда с точностью до переобозначения, характеристики (1) возможно искать в виде (2):

где, для простоты, М снова обозначает размерность нового пространства обобщенных переменных x для представления объекта d.

Тогда решение задачи классификации переведем в сопряженное пространству обобщенных переменных x, пространство параметров

характеристик

, что позволит рассматривать объекты d уже не как множества , и не как характеристики f_d (z_1,…,z _M)=0, d=1,..,n, а как точки в пространстве параметров [2]. Отдельные точки r_d уже однозначно определяют объекты d ввиду отсутствия полностью совпадающих подмножеств . В дальнейшем предполагается классифицировать объекты d, как точки r_d в пространстве параметров .

Ниже рассматривается второй из указанных путей для перевода исходной задачи в постановке (2*) к постановке (1*) построения классификатора. Возражением для применением данного похода могут быть соображения по поводу возможного нарушения гипотезы компактности и сопутствующих проблем, связанных с выбором меры близости в полученном пространстве R при решении задачи классификации. Однако риск данных проблем существует в любой задаче и обоснованность подхода подтверждается, или не подтверждается результатами классификации на проверочной и экзаменационной выборках данных. Близкий по постановке подход рассматривался в задаче диагностики нарушений работы сердечной мышцы при выделении признаков, как параметров разложения сигнала электрокардиограммы в ортогональный дискретный ряд Кравчука [3]. Другим примером использования указанного подхода в исходном пространстве Z фазовых координат являются работы [4,5] по применению методов классификации для оценки областей параметров устойчивости динамических систем. К этому же пути решения задачи принадлежит предлагаемый подход, когда при нахождения наилучшей структуры параметрического пространства характеристик объектов d предлагается использовать метод группового учета аргументов [6].

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...

Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...

Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: