Эвристический подход к набору диагностических признаков распознавания

Для получения «наилучшего» (по выбранному критерию) набора диагностических признаков можно рекомендовать следующее правило. Из всех признаков выбирается один (или несколько) наиболее информативных; далее к первому признаку добавляется такой признак из п - 1 оставшихся, чтобы информативность пары признаков для прогнозирования была наибольшей; затем к полученной паре признаков добавляется наилучшим образом новый признак и т.д. Процесс заканчивается тогда, когда информативность некоторой совокупности признаков незначительно превосходит информативность совокупности, полученной на предыдущем шаге, или когда достигнут требуемый уровень информативности (или требуемый уровень точности распознавания). Процедура такого отбора признаков называется алгоритмом сокращенного перебора с добавлением признаков [14J.

Процесс отбора признаков можно вести и в обратном порядке: сначала выбирается наиболее «информативное» подмножество п - 1 признаков при исходной совокупности п признаков, затем из этого подмножества отбирается наиболее «информативное» подмножество п - 2 признаков из всех возможных подмножеств и т.д. Процедура такого отбора признаков называется алгоритмом сокращенного перебора с исключением признаков.

Иногда для упрощения правила отбора признаков рекомендуется использовать такие свойства признаков, как статистическая независимость. При этом различают случаи, когда признаки статистически независимы при объединении классов и когда признаки независимы внутри каждого класса.

В случае статистической независимости «объединенных» признаков (при объединении классов) рекомендуется в качестве критерия для отбора признаков использовать информационную меру Шеннона. Тогда процедура отбора сводится к упорядочению признаков по убыванию количества обеспечиваемой ими информации при прогнозировании (или, что то же самое, возрастанию неопределенности решения — энтропии).

Объединяя идеи алгоритмов перебора с сокращением и добавлением признаков, получаем алгоритм комбинированного перебора, схематическое описание которого представлено на рис. 2.9 [14].

В начале работы алгоритма комбинированного перебора поочередно оценивается эффективность классификации для каждого признака в отдельности. После перебора всех признаков в промежуточный набор добавляется тот признак, для которого повышается эффективность классификации.

Решение проблемы оценки технического состояния или качества изделий весьма актуальна и связана с рассмотрением множества задач, среди которых важное место занимает задача принятия решения о техническом состоянии, качестве ремонта и регулировочных работ. Объективность принимаемого решения зависит от источников информации о техническом состоянии. Информацию о состоянии изделия несут различные признаки (факторы), и если учесть это понятие комплексно и многогранно, то количество показателей, описывающих все стороны состояния изделия, может достигать нескольких десятков и даже нескольких сотен. Очевидно, что не все из них равнозначны, не все содержат необходимое количество информации о состоянии изделия. Естественно, возникает задача: сколько признаков и какие признаки нужно контролировать, чтобы принять решение о состоянии изделия, удовлетворяющее заданному критерию, то есть необходимо осуществлять отбор наиболее важных для оценки состояния показателей или признаков, которые называются информативными. При этом значимость или информативность признаков нужно оценивать количественно,

Схематическое описание комбинированного метода

Рис. 2.9. Схематическое описание комбинированного метода

так как только в этом случае можно отдать предпочтение тому или иному признаку, что трудно сделать при качественном подходе к отбору признаков.

Физический подход к выявлению информативных признаков, основанный на анализе физической модели изделия, не противопоставляется математическому, зависящему от конкретно поставленной задачи. На первом этапе используется физический анализ, на основе которого отбирается вся совокупность измеряемых признаков (в общем случае избыточная по заданному критерию), в той или иной степени характеризующих состояние изделий. На втором этапе применяется математический подход, когда из всей избыточной совокупности отбираются наиболее информативные (значимые).

Задачу, решаемую на втором этапе, можно кратко сформулировать следующим образом [14]. Пусть имеется множество признаков х = {xl5 х2,..., х„}, которое представляет собой избыточную совокупность. Необходимо из п признаков отобрать v наиболее информативных по заданному критерию, причем v < п.

Оптимальная совокупность признаков без уточнения критерия информативности удовлетворяет ряду общих требований информативности признаков:

  • • совокупность х = {*1, х2, •••> хп) должна обладать достаточной информативностью, то есть добавление к ней одного любого признака не должно приводить к значимому изменению заданного критерия;
  • • совокупность выбранных признаков должна содержать возможно меньшее количество признаков с целью минимизации экономических затрат и технической трудоемкости;
  • • выделенная совокупность признаков может состоять из количественных и качественных признаков, но должна допускать количественную оценку (ранжировку).

Недостатком системы комбинированного перебора является то, что эффективность прогнозирования зависит от выбранного минимума информативных параметров.

Задача выбора информативных признаков может возникнуть в процессе разработки, изготовления и эксплуатации изделий. При этом в связи со специфичностью задач в каждом случае могут применяться различные методы.

Необходимость определения информативных признаков из имеющейся совокупности обусловлена также тем, что качество прогноза не инвариантно к системе используемых признаков. В практических случаях характеристики классов и прогнозирующие правила определяются по экспериментальным данным ограниченного объема, поэтому добавление неинформативных признаков приводит к более сильному пересечению представителей классов в пространстве признаков, что может ухудшить качество прогноза.

Эвристическим прогнозированием называют суждения о развитии и исходе событий на основе мыслительного взвешенного набора фактов, большая часть которых носит качественный характер.

Алгоритм прогнозирования не вытекает из строгих положений теории, а в значительной степени основан на интуиции и опыте исследователя.

Такие методы могут давать удовлетворительные результаты и при ограниченной информации о вероятностных характеристиках признаков и прогнозируемого параметра. Для применения этих методов необходимо иметь набор признаков, сильно коррелированных с прогнозируемым параметром, и необязательно знать вид их условных плотностей распределения. Естественно, методы индивидуального прогнозирования, основанные на использовании эвристических алгоритмов, в отличие от методов оптимального оценивания не всегда приводят к оптимальным решениям. Однако для их применения на практике достаточно, чтобы ошибка прогнозирования не превышала допустимого значения, а этого можно добиться, например, подбором более информативных признаков, применением соответствующих способов улучшения оператора прогнозирования.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >