Общий состав и структура вычислительных систем

Мы определили, что вычислительная система (ВС) — это некоторое объединение аппаратных средств, средств управления аппаратурой (физическими ресурсами), средств управления логическими ресурсами, системы программирования и прикладное программное обеспечение.

Основой цифровых вычислительных систем являются логические цифровые схемы, основанные на элементах, принимающих два возможных фиксированных значения — «О» и «1». Информация в таких схемах представлена в виде импульсных электрических сигналов, имеющих амплитуду выше некоторого уровня (логический ноль) или ниже определенного уровня (логическая единица). При построении цифровой ВС реализован принцип программного управления. Суть этого принципа в следующем: цифровая схема построена таким образом, что может решать некоторый определенный набор простых задач или выполнять определенные действия (команды); комбинируя эти действия в соответствии с заданным алгоритмом решения сложной задачи (программа), можно получить решение для очень широкого круга задач.

Таким образом, цифровая ВС состоит из аппаратных и программных средств, которые выступают как неразрывное единство.

К аппаратным средствам относятся электронные схемы, из которых построена система, и схемы, обеспечивающие их работоспособность.

К программным средствам относятся последовательности команд, реализующие решение задач и функции по обработке информации.

Технические и эксплуатационные характеристики

вычислительных машин

Производительность вычислительной машины. Этот показатель определяется архитектурой процессора, иерархией внутренней и внешней памяти, пропускной способностью системного интерфейса, системой прерывания, набором периферийных устройств в конкретной конфигурации, совершенством ОС и т.д. Основные единицы оценки производительности:

  • • абсолютная, определяемая количеством элементарных работ, выполняемых в единицу времени;
  • • относительная, определяемая для оцениваемой ЭВМ относительно базовой в виде индекса производительности.

Для каждого вида производительности применяются следующие традиционные методы их определения.

Пиковая производительность (быстродействие) определяется средним числом команд типа «регистр — регистр», выполняемых в одну секунду без учета их статистического веса в выбранном классе задач.

Номинальная производительность (быстродействие) определяется средним числом команд, выполняемых подсистемой «процессор — память» с учетом их статистического веса в выбранном классе задач. Она рассчитывается, как правило, по формулам и специальным методикам, предложенным для процессоров определенных архитектур, и измеряется с помощью разработанных для них измерительных программ, реализующих соответствующую эталонную нагрузку.

Для данных типов производительностей используются следующие единицы измерения:

  • MIPS (Mega Instruction Per Second) — миллион команд в секунду;
  • МFLOPS (Mega Floating Operations Per Second) — миллион операций над числами с плавающей запятой в секунду;
  • GFLOPS (Giga Floating Operations Per Second) — миллиард операций над числами с плавающей запятой в секунду и т.д.

Системная производительность измеряется с помощью синтезированных типовых (тестовых) оценочных программ, реализованных на унифицированных языках высокого уровня. Унифицированные тестовые программы используют типичные алгоритмические действия, характерные для реальных применений, и штатные компиляторы ЭВМ. Они рассчитаны на использование базовых технических средств и позволяют измерять производительность для расширенных конфигураций технических средств. Результаты оценки системной производительности ЭВМ конкретной архитектуры приводятся относительно базового образца, в качестве которого используются ЭВМ, являющиеся промышленными стандартами систем ЭВМ различной архитектуры. Результаты оформляются в виде сравнительных таблиц, двумерных графиков и трехмерных изображений.

Эксплуатационная производительность оценивается на основании использования данных о реальной рабочей нагрузке и функционировании ЭВМ при выполнении типовых производственных нагрузок в основных областях применения. Расчеты делаются главным образом на уровне типовых пакетов прикладных программ текстообработки, систем управления базами данных, пакетов автоматизации проектирования, графических пакетов и т.д.

Классическая архитектура вычислительной машины

Разнообразие современных вычислительных машин очень велико, но все они представляет собой реализацию так называемой фон-неймановской (принстонской) архитектуры, представленной Джорджем фон Нейманом еще в 1945 г. Рассмотрим классическую архитектуру вычислительной машины на примере архитектуры фон Неймана.

Принцип действия вычислительной машины состоит в выполнении программ — последовательностей арифметических, логических и других операций, описывающих решение определенной задачи.

Программа (для ЭВМ) — это упорядоченная последовательность команд, подлежащая обработке (стандарт 180 2382/1-84).

Команда — это описание операции, которую должна выполнить вычислительная машина.

Результат команды вырабатывается по точно определенным для данной команды правилам, заложенным в конструкцию компьютера. Электронные схемы каждого компьютера могут распознавать и выполнять ограниченный набор простых команд.

На рис. 1.3 представлена схема фон-неймановской вычислительной машины, на основе которой уже более полувека создаются современные вычислительные машины.

Схема фон-неймановской вычислительной машины

Рис. 1.3. Схема фон-неймановской вычислительной машины

Фон-неймановская архитектура состоит из следующих основных устройств:

  • • памяти, которая включала 4096 машинных слов разрядностью 40 бит. Машинное слово содержало или команды (две команды по 20 бит), или целое число со знаком на 40 бит (8 бит указывали на тип команды, а остальные 12 бит определяли одно из 212 = = 4096 слов);
  • • арифметико-логического устройства (АЛУ), внутри которого находится особый внутренний регистр разрядностью 40 бит, так называемый аккумулятор;
  • • устройства управления (УУ), выполняет функции управления устройствами;
  • • устройства ввода информации;
  • • устройства вывода информации.

Эти устройства соединены каналами связи, по которым передается информация.

В современных вычислительных машинах арифметико-логическое устройство и устройство управления сочетаются в одной микросхеме, которая называется центральным процессором (ЦП).

Машинная команда считывает слово из памяти в аккумулятор или сохраняет содержимое аккумулятора в памяти. Машина фон Неймана выполняла арифметические операции только с фиксированной точкой, поскольку фон Нейман был отличным математиком и считал, что плавающую точку можно держать в голове.

В основу построения современных вычислительных машин были положены следующие принципы фон Неймана.

  • 1. Принцип однородности памяти. Команды и данные хранятся в одной и той же памяти и внешне в памяти неразличимы. Распознать их можно только по способу использования, т.е. одно и то же значение в ячейке памяти может использоваться и как данные, и как команда, и как адрес в зависимости лишь от способа обращения к нему. Это позволяет производить над командами те же операции, что и над числами, и, соответственно, открывает ряд возможностей. Так, циклически изменяя адресную часть команды, можно обеспечить обращение к последовательным элементам массива данных. Такой прием носит название модификации команд и с позиций современного программирования не приветствуется. Более полезным является другое следствие принципа однородности, когда команды одной программы могут быть получены как результат исполнения другой программы. Эта возможность лежит в основе трансляции — перевода текста программы с языка высокого уровня на язык конкретной вычислительной машины.
  • 2. Принцип адресности. Структурно основная память состоит из пронумерованных ячеек, причем процессору в произвольный момент доступна любая ячейка. Двоичные коды команд и данных разделяются на единицы информации, называемые словами, и хранятся в ячейках памяти, а для доступа к ним используются номера соответствующих ячеек — адреса.
  • 3. Принцип программного управления. Все вычисления, предусмотренные алгоритмом решения задачи, должны быть представлены в виде программы, состоящей из последовательности управляющих слов — команд. Каждая команда предписывает некоторую операцию из набора операций, реализуемых вычислительной машиной. Команды программы хранятся в последовательных ячейках памяти вычислительной машины и выполняются в естественной последовательности, т.е. в порядке их положения в программе. При необходимости с помощью специальных команд эта последовательность может быть изменена. Решение об изменении порядка выполнения команд программы принимается либо на основании анализа результатов предшествующих вычислений, либо безусловно.
  • 4. Принцип двоичного кодирования. Согласно этому принципу вся информация (как данные, так и команды) кодируется двоичными цифрами 0 и 1. Каждый тип информации представляется двоичной последовательностью и имеет свой формат. Последовательность битов в формате, имеющая определенный смысл, называется полем. В числовой информации обычно выделяют поле знака и поле значащих разрядов. В формате команды можно выделить два поля: поле кода операции и поле адресов.

Огромным преимуществом фон-неймановской архитектуры является ее простота, поэтому данная концепция легла в основу большинства компьютеров общего назначения. Однако совместное использование шины для памяти программ и памяти данных приводит к так называемому узкому месту архитектуры фон Неймана. Термин «узкое место архитектуры фон Неймана» ввел Джон Бэкус в 1977 г. в своей лекции «Можно ли освободить программирование от стиля фон Неймана?», которую он прочитал при вручении ему Премии Тьюринга.

Фон-неймановская архитектура — не единственный вариант построения вычислительных машин, есть и другие, которые не соответствуют указанным принципам (например, потоковые машины). Однако подавляющее большинство современных компьютеров основаны именно на указанных принципах, включая и сложные многопроцессорные комплексы, которые можно рассматривать как объединение фон-неймановских машин.

Таким образом, на основании этих принципов можно утверждать, что современная вычислительная машина — техническое устройство, которое после ввода в память начальных данных в виде цифровых кодов и программы их обработки, выраженной тоже цифровыми кодами, способно автоматически осуществлять вычислительный процесс, заданный программой, и выдавать готовые результаты решения задачи в форме, пригодной для восприятия человеком.

Рассмотрим традиционную архитектуру микропроцессорной системы на примере персонального компьютер типа IBM PC.

Персональный компьютер типа IBM PC состоит из материнской платы (motherboard) и внешних плат, которые взаимодействуют между собой и с ресурсами материнской платы через шину. Все пассивные устройства (не могущие стать задачиками) на шине можно разделить на две группы — память и устройства ввода/вывода (порты). Циклы доступа для каждой из групп отличаются друг от друга как по временным характеристикам, так и по вырабатываемым на шине сигналам.

Стандартной шиной для персональных компьютеров типа IBM PC/AT и совместимых с ними является шина ISA (Industrial Standard Arhitecture). Шина EISA, с которой ряд фирм выпускали персональные компьютеры, уступила шине PCI и в настоящее время используется редко.

Основные отличия шины ISA персонального компьютера IBM PC/AT от своей предшественницы — шины компьютера IBM PC/XT заключаются в следующем:

  • • шина А Т компьютеров позволяет использовать на внешних платах как 16-разрядные устройства ввода/вывода, так и 16-разрядную память;
  • • цикл доступа к 16-разрядной памяти на внешней плате может быть выполнен без вставки тактов ожидания;
  • • объем непосредственно адресуемой памяти на внешних платах может достигать 16 Мб;
  • • внешняя плата может становиться хозяином (задатчиком) на шине и самостоятельно осуществлять доступ ко всем ресурсам как на шине, так и на материнской плате.

Чисто условно, для удобства понимания функционирования шины ISA, будем считать, что на материнской плате компьютера существуют следующие устройства, способные быть владельцами (задатчиками) шины: центральный процессор (ЦП); контроллер прямого доступа в память (ПДП); контроллер регенерации памяти (КРП). Кроме этого, задатчиком на шине может быть и внешняя плата. При выполнении цикла доступа на шине задатчиком может быть только одно из устройств. Рассмотрим подробнее функции этих устройств на шине ISA.

Центральный процессор (ЦП) является основным задатчиком на шине. По умолчанию именно ЦП будет считаться задатчиком на шине. Контроллер ПДП, а также контроллер регенерации памяти запрещают работу ЦП на время своей работы.

Контроллер ПДП — это устройство, связанное с сигналами запроса на режим ПДП и сигналами подтверждения режима ПДП. Активный сигнал запроса на ПДП будет разрешать последующий захват шины контроллером ПДП для передачи данных из памяти в порты вывода или из портов ввода в память.

Контроллер регенерации памяти становится владельцем шины и генерирует сигналы адреса и чтения памяти для регенерации информации в микросхемах динамической памяти как на материнской памяти, так и внешних платах.

Внешняя плата взаимодействует с остальными устройствами через разъем на шине ISA. Может становиться задатчиком на шине для доступа к памяти или устройствам ввода/вывода.

Кроме этого, на материнской плате компьютера имеется ряд устройств, которые не могут быть задатчиками на шине, но, тем не менее, взаимодействуют с ней. Это следующие устройства.

Часы реального времени (таймер-счетчик) — это устройство состоит из часов реального времени для поддержки даты, времени и таймера, как правило на базе микросхемы Intel 8254А. Один из таймеров-счетчиков этой микросхемы вырабатывает импульсы с периодом 15 мкс для запуска контроллера регенерации памяти на регенерацию.

Кросс материнской платы — часть материнской платы, которая соединяет разъемы шины ISA для подключения внешних плат с другими ресурсами на материнской плате.

Память на материнской плате — часть или все микросхемы памяти прямого доступа (оперативного запоминающего устройства, ОЗУ), используемые для хранения информации ЦП. На внешних платах также могут быть размещены микросхемы дополнительной памяти.

Контроллер прерываний — это устройство связано с линиями запросов прерываний на шине. Прерывания требуют дальнейшего обслуживания ЦП.

Устройства ввода/вывода — часть или все устройства ввода/вывода (такие как параллельные или последовательные порты) могут размещаться как на материнской плате, так и на внешних платах.

Перестановщик байтов данных — это устройство позволяет обмениваться данными между собой 16- и 8-разрядными устройствами.

Архитектура персонального компьютера IBM PC/AT с точки зрения использования шины ISA показана на рис. 1.4.

Архитектура персонального компьютера типа 1ВМ РС

Рис. 1.4. Архитектура персонального компьютера типа 1ВМ РС

Внешние платы, устанавливаемые в разъемы шины, могут быть 8- и/или 16-разрядными. Восьмиразрядная плата имеет только один интерфейсный разъем и может оперировать только с 8-разрядными данными. Восьмиразрядный слот также не может быть задатчиком на шине. Шестнадцатиразрядная плата обязательно имеет два интерфейсных разъема: один основной, такой же, как в 8-разрядных платах, и один дополнительный. Такая плата может оперировать как с 8-, так и с 16-разрядными данными и, кроме этого, она может быть задатчиком на шине. Общее число устанавливаемых в разъемы шины плат ограничивается как нагрузочной способностью шины, так и конструктивным исполнением материнской платы. Как правило, допускается устанавливать не более восьми (пять 16-разрядных и три 8-разрядных) внешних плат на шину. Такое ограничение вызвано также и относительно небольшим количеством свободных линий запросов на ПДП и запросов на прерывания, имеющихся на шине.

Основные особенности архитектуры персональных компьютеров сводятся к принципам компоновки аппаратуры, а также к выбранному набору системных аппаратных средств.

Важная особенность подобной архитектуры — ее открытость, т.е. возможность включения в компьютер дополнительных устройств, причем как системных устройств, так и разнообразных плат расширения. Открытость предполагает также возможность простого встраивания программ пользователя на любом уровне программного обеспечения компьютера.

Первый компьютер семейства, получивший широкое распространение, IBM PC XT был выполнен на базе оригинальной системной магистрали PC XT-Bus. В дальнейшем (начиная с IBM PC/AT) она была доработана до магистрали, ставшей стандартной и получившей название ISA (Industry Standard Architecture). До недавнего времени ISA оставалась основой компьютера.

Однако, начиная с появления процессоров i486 (в 1989 г.), она перестала удовлетворять требованиям производительности и ее стали дублировать более быстрыми шинами: VLB (VESA Local Bus) и PCI (Peripheral Component Interconnect bus) — или заменять совместимой c ISA магистралью EISA (Enhanced ISA). Постепенно шина PCI вытеснила конкурентов и стала фактическим стандартом, а начиная с 1999 г. в новых компьютерах рекомендуется полностью отказываться от магистрали ISA, оставляя только PCI. Правда, при этом приходится отказываться от применения плат расширения, разработанных за долгие годы для подключения к магистрали ISA.

Другое направление совершенствования архитектуры персонального компьютера связано с максимальным ускорением обмена информацией с системной памятью. Именно из системной памяти компьютер читает все исполняемые команды и в системной же памяти хранит данные. То есть больше всего обращений процессор совершает именно к памяти. Ускорение обмена с памятью приводит к существенному ускорению работы всей системы в целом.

Но при использовании для обмена с памятью системной магистрали приходится учитывать скоростные ограничения магистрали. Системная магистраль должна обеспечивать сопряжение с большим числом устройств, поэтому она должна иметь довольно большую протяженность; она требует применения входных и выходных буферов для согласования с линиями магистрали. Циклы обмена по системной магистрали сложны, и ускорять их нельзя. В результате существенного ускорения обмена процессора с памятью по магистрали добиться невозможно.

Разработчиками был предложен следующий подход. Системная память подключается не к системной магистрали, а к специальной высокоскоростной шине, находящейся «ближе» к процессору, не требующей сложных буферов и больших расстояний. В таком случае обмен с памятью идет с максимально возможной для данного процессора скоростью и системная магистраль не замедляет его. Особенно актуальным это становится в связи с ростом быстродействия процессора.

Таким образом, структура персонального компьютера из одношинной, применявшейся только в первых компьютерах, становится трехшинной (рис. 1.5).

Организация связей в трехшинной структуре Назначение шин следующее

Рис. 1.5. Организация связей в трехшинной структуре Назначение шин следующее:

  • • к локальной шине подключаются центральный процессор и кэшпамять (быстрая буферная память);
  • • к шине памяти подключается оперативная и постоянная память компьютера, а также контроллер системной шины;
  • • к системной шине (магистрали) подключаются все остальные устройства компьютера.

Все три шины имеют адресные линии, линии данных и управляющие сигналы. Но состав и назначение линий этих шин не совпадают между собой, хотя они и выполняют одинаковые функции. С точки зрения процессора системная шина (магистраль) в системе всего одна, по ней он получает данные и команды и передает данные как в память, так и в устройства ввода/вывода.

Временные задержки между системной памятью и процессором в данном случае минимальны, так как локальная шина и шина памяти соединены только простейшими быстродействующими буферами. Еще меньше задержки между процессором и кэш-памятью, подключаемой непосредственно к локальной шине процессора и служащей для ускорения обмена процессора с системной памятью.

Если в компьютере применяются две системные шины, например 13А и РС1, то каждая из них имеет свой собственный контроллер шины и работают они параллельно, не влияя друг на друга. Тогда получается уже четырехшинная, а иногда и пятишинная структура (рис. 1.6).

Шина АвР

Шина PCI

Рис. 1.6. Пример многошинной структуры

В наиболее распространенных настольных компьютерах класса Desktop в качестве конструктивной основы используется системная или материнская плата (motherboard), на которой располагаются все основные системные узлы компьютера, а также несколько разъемов (слотов) системной шины для подключения дочерних плат — плат расширения (интерфейсных модулей, контроллеров, адаптеров). Как правило, современные системные платы допускают замену процессора, выбор его тактовой частоты, замену и наращивание оперативной памяти, выбор режимов работы других узлов.

Центральное процессорное устройство

Центральное процессорное устройство (ЦПУ; англ, central processing unit, CPU, дословно — «центральное обрабатывающее устройство») — это электронный блок либо интегральная схема (микропроцессор), исполняющие машинные инструкции (код программ), главная часть аппаратного обеспечения компьютера или программируемого логического контроллера. Иногда его называют микропроцессором или просто процессором.

Процессор заменяет практически всю «жесткую логику», которая понадобилась бы в случае традиционной цифровой системы. Он выполняет арифметические функции (сложение, умножение и т.д.), логические функции (сдвиг, сравнение, маскирование кодов и т.д.), временное хранение кодов (во внутренних регистрах), пересылку кодов между узлами микропроцессорной системы и многое другое.

Количество таких элементарных операций, выполняемых процессором, может достигать нескольких сотен.

Развитие вычислительной техники сопровождается совершенствованием центральных процессоров. При проектировании новых моделей процессоров разработчики основывались на принципах совместимости, т.е. разные модели процессоров, различающиеся по производительности, должны были «уметь» выполнять одни и те же команды. Новое семейство процессоров должно было иметь единую архитектуру, т.е. новая модель процессора разрабатывается на основе какой-либо существующей архитектуры.

Под термином архитектура процессора понимают совокупность и способ объединения компонентов процессора, а также его совместимость с определенным набором команд.

Знание этих двух моментов дает возможность грамотно организовать интерфейс аппаратных и программных средств вычислительной системы. Например, с точки зрения программиста, архитектура процессора — это способность процессора выполнять набор машинных кодов, а с точки зрения проектирования компьютерных составляющих архитектура процессора — это отражение основных принципов внутренней организации определенных типов процессоров.

Но даже процессоры с одинаковой архитектурой могут существенно отличаться друг от друга. Эти различия обусловлены разнообразием процессорных ядер, которые обладают определенным набором характеристик. Наиболее частым отличием являются различные частоты системной шины, а также размеры кэша второго уровня и технологические характеристики, по которым изготовлены процессоры. Очень часто смена ядра в процессорах из одного и того же семейства требует также замены процессорного разъема, а это влечет за собой проблемы с совместимостью материнских плат. Но производители постоянно совершенствуют ядра и вносят постоянные, но незначительные изменения в ядро. Такие нововведения называют ревизией ядер и, как правило, обозначаются цифро-буквенными комбинациями.

Выделяют понятия микроархитектуры и макроархитектуры.

Микроархитектура микропроцессора — это аппаратная организация и логическая структура микропроцессора, регистры, управляющие схемы, арифметико-логические устройства, запоминающие устройства и связывающие их информационные магистрали.

Макроархитектура — это система команд, типы обрабатываемых данных, режимы адресации и принципы работы микропроцессора.

Архитектура современных микропроцессоров представляет собой продукт нескольких независимых групп разработчиков, которые развивают эту архитектуру более 15 лет, добавляя новые возможности к первоначальному набору команд.

В настоящее время доминирующее положение на рынке центральных процессоров занимает семейство процессоров фирмы «Intel» с архитектурой х86, в котором декларируется программная совместимость моделей процессоров сверху вниз. Это значит, что код, написанный для 8086, должен работать и на 80386, и на Pentium 4. С другой стороны, программы, разработанные для более поздних процессоров, могут не работать на более ранних, если в них используются какие-либо специфические особенности новой модели.

Классификация и характеристики процессора

Микропроцессоры можно классифицировать по следующим признакам.

  • 1. По числу БИС в микропроцессорном комплекте:
    • • однокристальные МП;
    • • многокристальные МП;
    • • многокристальные секционные МП.

В первую очередь на такое деление повлияли возможности БИС: ограниченное число элементов, выводов корпуса, в то время как МП — довольно сложное устройство, имеющее много логических элементов и требующее большое количество выводов корпуса БИС.

Однокристальный МП получен при реализации всех аппаратных средств МП в виде одной БИС или СБИС. Основные характеристики таких МП зависят от технологии изготовления БИС.

Многокристальные МП получены при разбиении его логической структуры на функционально законченные части и реализации их в виде БИС (рис. 1.7).

Логические структуры многокристального МП

Рис. 1.7. Логические структуры многокристального МП

ОП — операционный процессор, служит для обработки данных.

УП — управляющий процессор, выполняет функции выборки, декодирования и вычисления адресов операндов, а также генерирует последовательность команд, формирует очередь команд.

ИП — интерфейсный процессор, позволяет подключить память к МП.

УП, ОП, ИП могут работать автономно (параллельно) и тем самым организовывать конвейер операций.

Многокристальные секционные МП получаются, когда в виде БИС реализуются логические структуры МП при функциональном разбиении ее вертикальными плоскостями (рис. 1.8).

УП

ОП

ИП

Рис. 1.8. Логические структуры многокристального секционного МП

Пример. Если невозможно реализовать ОП 16 разрядов в одной БИС, ее делят на части, реализуемые каждая в своей БИС. Они образуют микропроцессорные секции (например, 4-разрядная секция).

  • 2. По назначению:
    • • универсальные МП;
    • • специальные МП.

Универсальные МП могут быть применены для решения широкого круга задач. При этом их эффективная производительность мало зависит от проблемной специфики задачи. Как правило, это определяется достаточно широкой универсальной системой команд.

Специальные МП — проблемно ориентированные МП, которые нацелены на ускоренное выполнение определенных функций, что увеличивает эффективную производительность при решении только определенной задачи:

  • • математические процессоры;
  • • микроконтроллеры;
  • • параллельная обработка данных;
  • • цифровая обработка сигнала — цифровые фильтры и т.д. Пример. Сравнение входного сигнала одновременно с несколькими эталонами для выделения нужного сигнала.
  • 3. По виду обрабатываемых входных сигналов:
    • • цифровые МП;
    • • аналоговые МП.

Требование к аналоговым МП:

  • • большая разрядность;
  • • высокая скорость арифметических операций.
  • 4. По характеру временной организации работы.
  • одномагистральные — все устройства имеют одинаковый интерфейс и подключаются к единой информационной магистрали, по которой передаются коды данных, адресов и управляющих сигналов;
  • многомагистральные — устройства группами подключаются к своей информационной магистрали, это позволяет осуществить одновременную передачу информационных сигналов по нескольким магистралям. Производительность увеличивается.
  • 6. По количеству выполняемых программ:
    • • однопрограммные;
    • • мультипрограммные.

Мультипрограммные либо могут одновременно выполнять несколько программ, либо имеют средства для поддержки виртуальной мультипрограмности.

Основные характеристики процессора

Современные процессоры представляют собой сложные высокотехнологичные устройства и описываются целым рядом показателей. Важнейшими характеристиками процессора являются следующие.

1. Тактовая частота (clock rate) — это число элементарных операций (тактов), производимых за 1 секунду. Измеряется в герцах (Hz, Гц) и их производных по системе СИ — килогерцах (kHz, кГц) мегагерцах (MHz, МГц), гигагерцах (GHz, ГГц).

Тактовая частота центрального микропроцессора определяет производительность как самого процессора, так и в целом всей компьютерной системы. Тем не менее с развитием современных технологий, таких как, например, суперскалярность, и созданием многоядерных процессоров нельзя установить прямо пропорциональную зависимость между тактовой частотой процессора и его производительностью.

  • 2. Разрядность — максимальное число одновременно обрабатываемых двоичных разрядов. Разрядность МП обозначается т/п/к и включает:
    • т — разрядность внутренних регистров, определяет принадлежность к тому или иному классу процессоров;
    • п — разрядность шины данных, определяет скорость передачи информации;
    • к — разрядность шины адреса, определяет размер адресного пространства. Например, МП i8088 характеризуется значениями т/п/к = 16/8/20.
  • 3. Количество вычислительных ядер на одном процессорном кристалле. Многоядерность как способ повышения производительности процессоров используется с относительно недавнего времени, но признана самым перспективным направлением их развития. Для домашних компьютеров уже существуют процессоры с восемью ядрами. Для серверов на рынке есть 12-ядерные предложения (Ор-teron 6100). Разработаны прототипы процессоров, содержащие около 100 ядер. Эффективность вычислительных ядер разных моделей процессоров отличается. Но в любом случае чем ядер больше, тем процессор производительнее.
  • 4. Количество потоков. Чем больше потоков, тем лучше. Количество потоков не всегда совпадает с количеством ядер процессора. Так, благодаря технологии Hyper-Threading 4-ядерный процессор Intel Core i7—3820 работает в восемь потоков и во многом опережает 6-ядерных конкурентов.
  • 5. Размер кэш-памяти — 2 и 3 уровня, иногда и 4 уровня. Кэш — это очень быстрая внутренняя память процессора, которая используется им как буфер для временного хранения информации, обрабатываемой в конкретный момент времени.
  • 6. Скорость шины процессора (FSB, HyperTransport или QPI). Через эту шину центральный процессор взаимодействует с материнской платой. Ее скорость (частота) измеряется в мегагерцах, и чем она выше, тем лучше.
  • 7. Технологический процесс. Чем выше степень интеграции (количество транзисторов на кристалле), тем меньше потребляемая электроэнергия процессора. От техпроцесса во многом зависит еще одна важная характеристика процессора — TDP.
  • 8. Termal Design Point (TDP) — показатель, отображающий энергопотребление процессора, а также количество тепла, выделяемого им в процессе работы. Единицы измерения — ватты (Вт). TDP зависит от многих факторов, среди которых главными являются количество ядер, техпроцесс изготовления и частота работы процессора.

Кроме прочих преимуществ, «холодные» процессоры (с ТИР до 100 Вт) лучше поддаются разгону, когда пользователь изменяет некоторые настройки системы, вследствие чего увеличивается частота процессора. Разгон позволяет без дополнительных финансовых вложений увеличить производительность процессора на 15—25%, но это уже отдельная тема. В то же время проблему с высоким ТЭР всегда можно решить приобретением эффективной системы охлаждения.

  • 9. Наличие и производительность видеоядра. Последние технические достижения позволили производителям помимо вычислительных ядер включать в состав процессоров еще и ядра графические. Такие процессоры, кроме решения своих основных задач, могут выполнять роль видеокарты.
  • 10. Тип и максимальная скорость поддерживаемой оперативной памяти. Эти характеристики процессора необходимо учитывать при выборе оперативной памяти, с которой он будет использоваться. Нет смысла переплачивать за быстрые модули ОЗУ, если процессор не сможет реализовать все их преимущества.

Память вычислительных машин

Память (устройство хранения информации, запоминающее устройство) — часть вычислительной машины, физическое устройство или среда для хранения данных, используемая в вычислениях в течение определенного времени.

Память вычислительной машины обеспечивает поддержку одной из функций современного компьютера — способность длительного хранения информации (принципа фон Неймана, заложенного в основу современных вычислительных машин).

Память, как и центральный процессор, является неизменной частью вычислительной машины.

В основе работы запоминающего устройства может лежать любой физический эффект, обеспечивающий приведение системы к двум или более устойчивым состояниям.

Память вычислительной машины дискретна, состоит из набора последовательных ячеек памяти, каждая из которых имеет свой номер, называемый адресом. Ячейка памяти хранит состояние внешнего воздействия, запись информации. Эти ячейки могут фиксировать самые разнообразные физические воздействия. Они функционально аналогичны обычному электромеханическому переключателю, и ин-

формация в них записывается в виде двух четко различимых состояний — «1» и «О» («включено» и «выключено»),

В современной компьютерной технике часто используются физические свойства полупроводников, когда прохождение тока через полупроводник или его отсутствие трактуется как наличие логических сигналов 0 или 1. Устойчивые состояния, определяемые направлением намагниченности, позволяют использовать для хранения данных разнообразные магнитные материалы. Наличие или отсутствие заряда в конденсаторе также может быть положено в основу системы хранения. Отражение или рассеяние света от поверхности С/)-, /Ж/)- или В1и-гау-циска также позволяет хранить информацию.

Для записи объема запоминающих устройств в цифровой вычислительной технике и количества памяти, используемой компьютерной программой, применяют термин «количество информации». Единицы количества информации: 1 бит, обозначение — бит, значение — 1 и байт, обозначение — Б, значение 1 Б = 8 бит (ГОСТ 8.417-2002, табл. А1).

В соответствии с международным стандартом МЭК 60027-2 единицы бит и байт применяют с приставками СИ (ГОСТ 8.417-2002, табл. 8 и разд. 7). Исторически сложилась такая ситуация, что с наименованием «байт» некорректно (вместо 1000 = 103 принято 1024 = 210) использовали (и используют) приставки СИ: 1 Кбайт = = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т.д. При этом обозначение Кбайт начинают с прописной буквы в отличие от строчной буквы «к» для обозначения множителя 103.

Специальные механизмы обеспечивают доступ (операцию записи и операцию чтения) к состоянию этих ячеек. Процесс доступа происходит под управлением контроллера памяти — отдельного специализированного устройства, которое управляет потоком данных от оперативной памяти к процессору.

Контроллер памяти может представлять собой отдельную микросхему или быть интегрирован в микросхему северный мост или микропроцессор.

Также различают операцию стирания памяти — занесение (запись) в ячейки памяти одинаковых значений, обычно 0016 или ГГ16.

Иерархия памяти

Память в вычислительных устройствах имеет иерархическую структуру и обычно предполагает использование нескольких запоминающих устройств, имеющих различные характеристики.

Иерархия памяти — концепция построения взаимосвязи классов разных уровней памяти вычислительных систем на основе иерархической структуры.

Сущность необходимости построения иерархической памяти — необходимость обеспечения вычислительной системы (отдельного компьютера или кластера) достаточным объемом памяти, как оперативной, так и постоянной.

Различные виды памяти образуют иерархию, на различных уровнях которой расположены памяти с отличающимися временем доступа, сложностью, стоимостью и объемом. Возможность построения иерархии памяти вызвана тем, что большинство алгоритмов обращаются в каждый промежуток времени к небольшому набору данных, который может быть помещен в более быструю, но дорогую и поэтому небольшую память. Использование более быстрой памяти увеличивает производительность вычислительного комплекса.

В большинстве современных вычислительных систем используется следующая иерархия памяти.

  • 1. Процессорная или регистровая память — это набор быстродействующих регистров процессора, организованный в регистровый файл — наиболее быстрый доступ (порядка 1 такта), но размером лишь в несколько сотен или, редко, тысяч байт.
  • 2. Кэш микропроцессора — кэш (сверхоперативная память), используемый микропроцессором компьютера для уменьшения среднего времени доступа к компьютерной памяти.

Кэш использует небольшую, очень быструю память (обычно типа SRAM), которая хранит копии часто используемых данных из основной памяти. Если большая часть запросов в память будет обрабатываться кэшем, средняя задержка обращения к памяти будет приближаться к задержкам работы кэша.

Когда процессору нужно обратиться в память для чтения или записи данных, он сначала проверяет, доступна ли их копия в кэше. В случае успеха проверки процессор производит операцию, используя кэш, что значительно быстрее использования более медленной основной памяти.

Большинство современных микропроцессоров для компьютеров и серверов имеют как минимум три независимых кэша: кэш инструкций для ускорения загрузки машинного кода; кэш данных для ускорения чтения и записи данных и буфер ассоциативной трансляции (TLB) для ускорения трансляции виртуальных (логических) адресов в физические как для инструкций, так и для данных.

Кэш центрального процессора разделен на несколько уровней. Максимальное количество кэшей — четыре. В универсальном процессоре в настоящее время число уровней может достигать трех. Кэшпамять уровня N + 1, как правило, больше по размеру и медленнее по скорости доступа и передаче данных, чем кэш-память уровня N.

Самым быстрым является кэш первого уровня L1 cache (level 1 cache). По сути, он является неотъемлемой частью процессора, поскольку расположен на одном с ним кристалле и входит в состав функциональных блоков. В современных процессорах обычно L разделен на два кэша — кэш команд (инструкций) и кэш данных (гарвардская архитектура). Большинство процессоров без L не могут функционировать. L работает на частоте процессора, и в общем случае обращение к нему может производиться каждый такт. Зачастую является возможным выполнять несколько операций чтения/ записи одновременно.

Вторым по быстродействию является кэш второго уровня — L2 cache, который обычно, как и L, расположен на одном кристалле с процессором. В ранних версиях процессоров L2 реализован в виде отдельного набора микросхем памяти на материнской плате. Объем L2 от 128 Кбайт до 1 — 12 Мбайт. В современных многоядерных процессорах кэш второго уровня, находясь на том же кристалле, является памятью раздельного пользования — при общем объеме кэша в п Мбайт на каждое ядро приходится по п/с Мбайта, где с количество ядер процессора.

Кэш третьего уровня наименее быстродействующий, но он может быть очень большим — более 24 Мбайт. L3 медленнее предыдущих кэшей, но все равно значительно быстрее, чем оперативная память. В многопроцессорных системах находится в общем пользовании и предназначен для синхронизации данных различных L2.

Существует четвертый уровень кэша, применение которого оправдано только для многопроцессорных высокопроизводительных серверов и мейнфреймов. Обычно он реализован отдельной микросхемой.

3. Оперативная память (англ. Random Access Memory, RAM, память с произвольным доступом; ОЗУ (оперативное запоминающее устройство) — энергозависимая часть системы компьютерной памяти, в которой во время работы компьютера хранится выполняемый машинный код (программы), а также входные, выходные и промежуточные данные, обрабатываемые процессором.

Обмен данными между процессором и оперативной памятью производится:

непосредственно (рис. 1.9);

через сверхбыструю память нулевого уровня — регистры в АЛУ либо при наличии аппаратного кэша процессора — через кэш.

Простейшая схема взаимодействия оперативной памяти

Рис. 1.9. Простейшая схема взаимодействия оперативной памяти

с микропроцессором

Содержащиеся в современной полупроводниковой оперативной памяти данные доступны и сохраняются только тогда, когда на модули памяти подается напряжение. Выключение питания оперативной памяти, даже кратковременное, приводит к искажению либо полному разрушению хранимой информации.

В общем случае ОЗУ содержит программы и данные операционной системы, запущенные прикладные программы пользователя и данные этих программ, поэтому от объема оперативной памяти зависит количество задач, которые одновременно может выполнять компьютер под управлением операционной системы.

ОЗУ может изготавливаться как отдельный внешний модуль или располагаться на одном кристалле с процессором, например в однокристальных ЭВМ или однокристальных микроконтроллерах.

4. Память долговременного хранения (внешняя память) — это запоминающие устройства, предназначенные для продолжительного (что не зависит от электропитания) хранения больших объемов информации.

Долговременное хранение в дорогой сверхоперативной и даже оперативной памяти, как правило, невыгодно, поэтому данные такого рода хранятся на накопителях: дисковых, ленточных, флэш ит.д.

Наиболее известные запоминающие устройства долговременного хранения: жесткие диски (винчестеры), дискеты (гибкие магнитные диски), Сй- или /)К/)-диски, устройства флэш-памяти.

Для резервного хранения данных создаются библиотеки на съемных носителях, например виртуальная ленточная библиотека или дисковый массив. Емкость съемных носителей большая, но доступ к этим данным занимает значительное время.

Получение преимуществ от иерархии памяти требует совместных действий от программиста, аппаратуры и компиляторов (а также базовой поддержки в операционной системе):

  • • программисты отвечают за организацию передачи данных между дисками и памятью (ОЗУ), используя для этого файловый ввод/ вывод; современные ОС также реализуют это как подкачку страниц;
  • • аппаратное обеспечение отвечает за организацию передачи данных между памятью и кэшами;
  • • оптимизирующие компиляторы отвечают за генерацию кода, при исполнении которого аппаратура эффективно использует регистры и кэш процессора.

Контрольные вопросы и задания

  • 1. Опишите общую логическую структуру микропроцессора.
  • 2. Опишите схему взаимодействия оперативной памяти с микропроцессором.
  • 3. В чем заключается отличие между компьютерами, вычислительной и информационной системами?
  • 4. В чем отличие архитектуры вычислительной машины от ее структуры?
  • 5. Каковы достоинства многоуровневой организации вычислительных систем?
  • 6. Понятие семантического разрыва между уровнями.
  • 7. Опишите структуру многоуровневой вычислительной машины.
  • 8. Опишите принцип работы фон-неймановской вычислительной машины.
  • 9. Перечислите принципы фон Неймана, положенные в основу построения современных вычислительных машин.
  • 10. Перечислите технические и эксплуатационные характеристики вычислительных машин.
  • 11. В чем заключается отличие микроархитектуры процессора от макроархитектуры?
  • 12. Перечислите основные характеристики процессора.
  • 13. Приведите примеры классификаций микропроцессора.
  • 14. Иерархия памяти. Перечислите преимуществ от иерархии памяти.
 
< Пред   СОДЕРЖАНИЕ     След >