Полная версия

Главная arrow Информатика arrow Безопасность и управление доступом в информационных системах

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Виды и формы представления информации

Известно, что информация может быть представлена в виде: букв; символов; цифр; слов; текста; рисунков; схем; формул; графиков; таблиц; планов; чертежей; географических, топографических, технологических карт; алгоритмов, видеозаписей, аудиозаписей и т. д., которые, в свою очередь, могут быть представлены в виде: постоянной или переменной информации; команд; сообщений; справок; решений; приказов; распоряжений; заданий; отчетов; ведомостей; инструкций; комментариев; писем и записок; телеграмм; чеков; массивов; файлов; WEB-сайтов, порталов; электронных библиотек, видеотек, фонотек, блогов и т. д.

Компьютерное представление информации

Информация, воплощенная и зафиксированная в некоторой материальной форме, называется сообщением. Сообщения могут быть непрерывными и дискретными (цифровыми).

Непрерывное сообщение представляется некоторой физической величиной (электрическим напряжением, током и т. д.), изменения которой отображают протекание рассматриваемого процесса. Физическая величина, передающая непрерывное сообщение, может принимать любые значения и изменяться в произвольные моменты времени. Таким образом, в непрерывном сообщении конечной длины может содержаться большое количество информации.

Для дискретных сообщений характерно наличие фиксированного набора отдельных элементов, из которых в дискретные моменты времени формируются различные последовательности элементов. Важным является не физическая природа элементов, а то обстоятельство, что набор элементов конечен и потому любое дискретное сообщение конечной длины передает конечное число значений некоторой величины, а следовательно, количество информации в таком сообщении конечно.

При дискретной форме представления информации отдельным ее элементам могут быть присвоены числовые (цифровые) значения. В таких случаях говорят о цифровой информации, а компьютерные машины и системы, использующие цифровую форму представления информации, называются также цифровыми.

Элементы, из которых состоит дискретное сообщение, называют буквами или символами. Набор этих букв (символов) образует алфавит. Здесь под буквами, в отличие от обычного представления, понимаются любые знаки (обычные буквы, цифры, знаки препинания, математические и прочие знаки, цвета сигнальных ламп и др.). Число символов в алфавите называется объемом алфавита. Объем алфавита определяет количество информации, доставляемой одним символом сообщения. Если алфавит имеет объем А и в любом месте в сообщении равновероятно появление любого символа, то доставляемое символом количество информации можно определить как, бит

Дискретное сообщение можно разбить на группы символов и назвать эти группы словами. Длина слова определяется количеством содержащихся в нем символов.

В компьютерной технике широко используется однородное представление информации, при котором в компьютерной системе или отдельных ее частях все слова имеют определенную длину. Однородное представление информации упрощает обмен ею и конструкцию устройств компьютерной системы.

В алфавите объемом Л можно представить N различных слов длиной S, где

Тогда количество информации, содержащейся в слове,

Выражение (3) справедливо, если вероятности появления в сообщении любого слова (и символа) равны и не зависят от предшествующих слов (и символов).

Неравномерность появления символов, наличие взаимной зависимости символов в сообщении, как это имеет место, например, при передаче смысловых сообщений (текста), является причиной того, что количество информации в одном символе уменьшается.

Связь между символами сообщения создает избыточность информации. В языке избыточность носит естественный характер. Однако в вычислительных системах широко применяется искусственная избыточность при кодировании сообщений, которая позволяет контролировать и устранять ошибки при передаче информации по линиям связи, а также между отдельными устройствами цифровой вычислительной системы.

В цифровых вычислительных машинах и системах широко употребляется двоичный алфавит, имеющий лишь два символа — 0 и 1. Его применение упрощает техническую реализацию устройств компьютерной техники. Любое дискретное сообщение, выраженное в некотором алфавите, переводимо в двоичный алфавит, если длина двоичного слова отвечает формуле

Современные компьютерные системы обрабатывают не только числовую, но и текстовую, иначе говоря, алфавитно-цифровую информацию, содержащую цифры, буквы, знаки препинания, математические и другие символы. Именно такой характер имеет экономическая, финансовая, учетная, бухгалтерская, статистическая и другая информация, содержащая наименование предметов, фамилии людей, числа и т. д.

Характер этой информации таков, что для ее представления требуются слова переменной длины. Применение для записи алгоритмов и автоматизация программирования алгоритмических языков делают необходимым ввод в машину и вывод наряду с общеупотребительными еще и некоторых специальных символов.

Деловая информация в среднем содержит вдвое больше цифр, чем букв. Поэтому наряду с общей системой кодирования алфавитно-цифровых символов в компьютерах сохраняют также отдельную систему кодирования для десятичной цифровой информации.

При развитии технологий цифрового видео и звука понадобилось еще более увеличить разрядность оцифровки аналоговых сигналов и особенно при получении видео и звука высокого качества.

Наибольшее распространение получило представление информации посредством восьмиразрядного слога, называемого байтом.

С помощью восьмиразрядного слога можно кодировать 256 различных символов (28). Несколько байтов образуют слова.

Компьютер производит обработку информации, состоящую в ее запоминании, передаче из одних устройств в другие, выполнении над информацией арифметических и логических преобразований. Процесс обработки информации автоматизирован с помощью программного управления. Программа представляет собой алгоритм переработки информации, записанной в виде последовательности команд, которые должны быть выполнены машиной для получения искомого результата.

Используемые человеком при научно-технических расчетах, обработке экономической, финансовой и другой информации, при программировании задач натуральные формы представления и натуральные единицы информации существенно отличаются от форм представления и единиц информации в машине.

Поле — группа символов, имеющих определенное значение и подвергающихся обработке за одну и ту же арифметическую или логическую операцию.

Этому определению соответствуют многоразрядное число, команда, группа символов, обозначающих определенный признак — реквизит какого-либо объекта (например, фамилия или год рождения некоторого лица, наименование детали, ее вес и т. д.).

Запись представляет собой группу полей, описывающих признаки (свойства, характеристики, параметры) некоторого объекта. Например, строка экзаменационной ведомости, приведенная на рис. 3.

Экзаменационная ведомость

Рис. 3. Экзаменационная ведомость

Каждый из реквизитов (признаков) — фамилия, номер зачетной книжки и т. д. — является полем. Поля объединены тем, что относятся к определенному студенту.

Массив — объединение записей, описывающее некоторое множество объектов (например, экзаменационная ведомость или их совокупность).

Словом называют группу символов (разрядов) в памяти компьютера, соответствующую некоторому полю. Обычно термин «машинное слово» относят к коду определенной длины, который считывается из оперативной памяти или записывается в оперативную память за одно обращение. Машинное слово может представлять собой двоичное число с плавающей или фиксированной запятой, команду, несколько слогов (байтов). Машинное слово может также содержать дополнительные разряды (разряд контроля по четности, разряды защиты памяти и др.). Обычно машинное слово, в частности команда, содержит целое число байтов.

Машинная единица информации, соответствующая натуральной единице — записи, называется фразой (или также записью). Она может занимать несколько машинных слов.

Блоком называют группу фраз (записей), расположенных компактно (без промежутков) на носителе внешнего запоминающего устройства и записываемых на носитель из оперативной памяти, а также считываемых с носителя в запоминающее устройство одной командой. Среди натуральных единиц информации нет единицы, соответствующей блоку. Место в запоминающем устройстве на магнитном или оптическом носителе, в котором хранится группа слов, составляющих блок, называется зоной, или сектором.

Информационному массиву соответствует машинная единица информации — файл. Файл состоит в общем случае из нескольких блоков.

Томом называется машинная единица информации, соответствующая пакету дисков (часто томом называют логическую часть внешнего носителя, винчестера, например).

 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>