МОДЕЛЬ АВТОМАТИЧЕСКОГО ИСПРАВЛЕНИЯ ОШИБОК В ТЕХНОЛОГИИ ОБРАБОТКИ ДАННЫХ ИС
Моделирование процесса автоматического обнаружения ошибок и восстановления достоверности значений показателей в табличных документах вызывает необходимость анализа структуры и свойств указанных документов. Модель табличного документа можно представить в виде матрицы. В теории помехоустойчивого кодирования решен ряд вопросов автоматической коррекции ошибок в кодовых ансамблях информации, передаваемой по каналам связи. Рассмотрение метода автоматического обнаружения ошибок и восстановления достоверности значений показателей табличных документов проведем с учетом концепции теории помехоустойчивого кодирования.
Передаваемая в двоичном виде информация имеет вероятность искажения отдельных двоичных символов, что приводит к снижению достоверности сообщений. Одним из способов защиты сигналов от искажений является ввод в передаваемую кодовую комбинацию избыточной информации. Обычно корректирующие коды состоят из информационных и контрольных разрядов. Последние, по существу, в информационном отношении избыточны и выполняют функции корректировки ошибок в соответствующем разряде двоичного слова. Имеются двоичные модификации корректирующих кодов — код Хэмминга, Боуза—Чоудхури—Хоквингема (БЧХ), векторный, треугольный и др. При кодировании информации, например, кодами Хэмминга разряды информационной части кода делят на группы. Значение каждого контрольного разряда вычисляется путем суммирования по модулю тех разрядов, которые входят в соответствующую информационную группу. При декодировании информации в канале связи по модулю суммируются информационный и контрольный разряды кода, входящие в соответствующую группу. По результатам суммирования формируется синдром — корректирующее двоичное число, у которого каждый разряд есть результат суммирования. Синдром в общем случае выступает как опозна- ватель ошибки. Если синдром состоит из одних нулей, то это означает отсутствие ошибки в передаваемом коде, а ненулевое значение синдрома указывает адрес ошибки, т.е. номер разряда кода, в котором произошло искажение символа. Если в информационном разряде находится символ 0, то при коррекции он заменяется на достоверный, т.е. 1, и наоборот. Эта схема работы кода Хэмминга не исчерпывает состав средств помехоустойчивого кодирования, но она достаточна для применения в данной задаче в качестве исходного положения.
Рассмотрим структуру и свойства условного табличного документа (рис. 5.3).
D = {dx, d2,..., ds,..., dk) |
|||||||
В A |
*1 |
b2 |
bJ |
bn |
bn+1 |
||
«1 |
du |
dn |
|
dn |
d,n+ |
||
a2 |
di |
dll |
dij |
din |
dl,n+ |
||
ai |
dn |
dll |
du |
din |
di,n+ |
||
dml |
Qml |
dmj |
dmn |
dm, n+1 |
|||
Qm+ |
dm+1,1 |
dm+1.2 |
dm+lj |
dm+,n |
dm+1, n+1 |
Рис. 5.3. Матрица документа табличного вида
Модель табличного документа можно отобразить так:
где Qk — матрица документа: Qk = ||^||, / = 1, п, j = 1, т qу — реквизиты-основания (числа), отражающие количественное состояние объектов; А — кортеж реквизитов-признаков (наименования строк таблицы), отражающий качественные стороны состояния объектов; В — кортеж реквизитов-признаков (наименования столбцов таблицы), отражающий качественные стороны состояния объектов; D — кортеж реквизитов-признаков, отражающий качественные стороны состояния объектов общего уровня и относящиеся как к А, так и к В] qi n+, qm+j (см. рис. 5.3) — реквизиты-основания типа «итого», «всего» или контрольные суммы соответственно по строкам и столбцам, отражающие количественное состояние объектов.
Рассматриваемая модель табличного документа в определенном допущении может быть представлена в синтаксическом отношении как кодовый ансамбль. В этом ансамбле информационные группы отображаются совокупностью значений показателей по доку- менто-строкам и (или) документо-графам, а также контрольными суммами и (или) значениями показателей типа «всего» и «итого». В данном случае контрольные суммы обладают своеобразными свойствами синдромов, т.е. опознавателей ошибок. Вместе с тем семантические свойства документа, в частности арифметическая связь контрольных сумм с соответствующими значениями показателей, представленными не в двоичной, а в десятичной системе, устраняют необходимость модульного или другого способа формирования синдромов. Указанные связи между значениями элементов матрицы документа обеспечивают потенциальную возможность автоматического обнаружения ошибок и их исправления без непосредственного участия оператора ЭВМ. С учетом выявленных выше элементов аналогии представим модель алгоритма автоматического восстановления достоверности показателей документов табличного вида.
Исходя из анализа природы реквизитов-оснований устанавливается взаимосвязь элементов типа арифметического баланса:
При условии внесения ошибки в какой-либо элемент qtj на этапах обработки нарушаются условия соотношений типа (5.58), (5.59). С целью автоматического обнаружения ошибок и их исправления при вводе в ЭВМ указанные соотношения проверяются программно. Сначала проверяется равенство
Если равенство не соблюдается, то на принтер или дисплей в рамках протокола ввода документов в ЭВМ выдается сообщение об отсутствии равенства указанного типа и идентификатор документа. Если же равенство (5.60) соблюдается, то далее проверяется условие
Если в /-й строке равенство
не выполняется, то производится замена строки i на строку с элементами
после чего выдается сообщение на принтер об ошибке и ее исправлении с указанием индекса документа, а также значение замененного ошибочного реквизита-основания и заменяющего достоверного реквизита-основания.
Если же нарушение условия (5.61) обнаруживается более чем в одной строке, то для столбцов матрицы проверяется условие
Если нарушение условия имеет место в одном столбце
то заменяется столбец j на столбец с элементами
и выдается сообщение на принтер об ошибке и ее исправлении.
В случае если нарушение обнаруживается более чем в одном столбце, то на дисплей или принтер выдается сообщение об ошибках с обозначением модификации ошибок и их адресов. Заметим, что при условии какой-либо ошибки, например транспозиции (перестановки) qjj,qj j+l, нарушается условие (5.58). Это и идентифицируется как ошибка относительно Qm+j и qm+j+- Обнаружение выполняется не только при транспозиции, но и при других различных искажениях лексического, синтаксического, логического и арифметического свойства по набору q;у каждой отдельной строки и (или) столбца матрицы документа. Таким образом, алгоритм позволяет производить программное исправление однократных и обнаружение многократных ошибок относительно строки и (или) столбца матрицы контролируемого документа.
При практическом применении данного метода следует учитывать два случая. В первом случае в формате первичного документа отсутствуют реквизиты типа «всего», «итого» как по строкам, так и по столбцам. Во втором случае указанные реквизиты взаимосвязаны с неполным набором реквизитов-оснований строки и (или) столбца. В первом случае на этапе подготовки документа целесообразно подсчитать контрольные суммы, а во втором — можно применить данный метод по субматрице документа в пределах соответствующих контрольных сумм (реквизиты типа «всего»), если реализация дополнительных трудозатрат в конкретной ИС является проблематичной. Однако в любом случае применение контрольных сумм является целесообразным.
Вопросы для самопроверки
- 1. Дайте определение понятия «методология управления качеством ИС».
- 2. Назовите основные принципы управления качеством ИС.
- 3. Назовите основные компоненты логики организации управления качеством ИС.
- 4. Определите состав методов и средств управления качеством ИС.
- 5. Дайте характеристику дескриптивного моделирования управления качеством ИС.
- 6. Назовите основные принципы квалиметрии ИС.
- 7. Отобразите схему содержательного алгоритма оценки качества ИС.
- 8. Дайте характеристику обобщенной формализованной модели управления качеством ИС.
- 9. Назовите основные условия кластер-анализа статистической структуры дефектов ИС.
- 10. Укажите существенные признаки математической модели оценки качества ИС.
- 11. Какие требования лежат в основе разработки модели автоматической коррекции ошибок в ИС?