Методы дистанционного анализа воздействия на лесные массивы аварий газо- и нефтепроводов с использованием теории нечетких множеств

Большую популярность в последнее время получили нечеткие алгоритмы, среди которых особенно широко известен метод под названием "нечетких с-средних" или метод - FCMA (Fuzzy С-Means Algorithm). Следует отметить, что главным недостатком алгоритмов к- и с-средних является необходимость априорного задания требуемого числа кластеров, а также других численных параметров алгоритма, от величины которых существенно зависят результаты кластеризации. Для оценки качества разделения объектов на кластеры необходимо использовать дополнительные критерии, позволяющие оценить результат применения в алгоритме кластеризации тех или иных численных параметров. Наиболее известные оценки качества кластеризации получили название коэффициентов кластеризации и энтропии.

Важной характеристикой алгоритма нечетких с-средних является то, что в результате его применения формируются нечеткие кластеры. При этом степень принадлежности объекта кластеру описывается с помощью функции принадлежности (ФП). Рассмотрим основные отличительные особенности работы алгоритма нечетких с-средних. Пусть X = {х[2,...,х11} заданная система из n-векторов в пространстве признаков. При этом х( - j-я компонента к-то вектора, соответствующая у'-му параметру. При нечеткой кластеризации не существует жесткого деления на классы, при которой каждый вектор принадлежит только одному классу. Вместо этого вводятся степени принадлежности вектора каждому классу, которые называются функцией принадлежности: и,к =«,(**), где i = l,c, с - число классов. Функция принадлежности должна

удовлетворять условию нормировки: Z «,*=!, V*.

(=1

Функция принадлежности содержит гораздо больше полезной информации, чем четкое разделение на классы. Так, например, при разделении объектов на три класса объект, ФП которого примерно равны {1/3, 1/3, 1/3}, может рассматриваться, как неподдающийся классификации и, соответственно, не принадлежащий ни одному из кластеров.

Целевая функция (ЦФ), используемая в алгоритме FCMA, имеет следующий вид:

где d - расстояние в пространстве признаков между объектом к и центром /'-го кластера, т - параметр алгоритма.

Таким образом, ЦФ представляет собой сумму квадратов расстояний от всех объектов до центров кластеров, которая должна быть минимальной, т. е. ЦФ (2.2.34) является нечетким аналогом метода наименьших квадратов. Случай т=0 соответствует методу четкой кластеризации. Показано, что наилучшим решением задачи (2.2.34) является следующее:

Из формул (2.2.35) следует, что центры кластеров рассчитываются, как средние арифметические, а функция принадлежности строится из отношений, показывающих, на сколько объект к ближе к i -у кластеру, чем к остальным.

Для расчета центров кластеров по формулам (2.2.35) требуется предварительно рассчитать функций принадлежности, которые в свою очередь требуют знания Vj. Решение может быть найдено методом последовательных приближений.

Рассмотрим теперь преимущества и недостатки метода обучаемой, или контролируемой классификации (классификации с учителем). При контролируемой классификации используются предварительно классифицированные опытным путем данные, которые составляют обучающую выборку. В результате обработки этих данных рассчитываются некоторые интегральные характеристики классов, которые затем используют в процессе классификации.

Подчеркнем, что успешность и эффективность метода классификации с учителем в первую очередь определяется качеством и надежностью обучающей выборки, во-вторых, разделимостью используемых интегральных показателей и, в-третьих, эффективностью алгоритмов классификации. Так, например, в случае использования плохо определенной обучающей выборки имеет место медленная сходимость итерационного процесса обучения.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >