* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.
Конкуренция на рынке процессоро в
1. Введение в персональный компью тер.
Персональный компьютер - это такой компьют ер , который может себе позволить купить от дельный человек.
Наиболее “весомой” частью любого компьюте ра является системный блок (иногда его наз ывают компьютером , что является недопустимой ошибкой ) . Внутри него расположены блок питания , плата с центральным процессором (ЦП ), видеоадаптер , жесткий диск , дисководы гибких дисков и другие устройства ввода / вывода информации . Зачастую видеоадаптер и контроллеры ввода / вывода размещены прямо на плате ЦП. В системном блоке могут разм ещаться средства мультимедиа : звуковая плата и устройство чтения оптических дисков - CD-ROM. Кром е того , в понятие “компьютер” входит клави атура и монитор . Манипулятор мышь является необязательной , но весьма важной деталью . Те п е рь коротко о выборе основных компонентов ПК . Процессор является основным компонентом любого ПК . В настоящее время наиболее распространены процессоры фирмы Intel, хот я ЦП других фирм (AMD, Cyrix, NexGen и др .) составляют им достойную конкуренцию . Имеется т а кже материнская (MotherBoard) плата . Основной характ еристикой материнских плат является их архите ктура . Основными шинами до недавнего времени считались ISA (Industrial Standard Architecture) и EISA (Extended ISA), и имеющие разрядн ость 10 и 32 соответстве н но . Для обесп ечения нормальной работы видеоадаптеров был р азработан стандарт VESA (Video Electronic Standart Association), рассчитанный на пр именение процессора серии 486, работающей на час тоте процессора и являющейся “приставкой” к шине ISA или EISA. С п о явлением проц ессора Р entium была разработана самостоятельная ш ина Р CI, которая на сегодняшний день являет ся наиболее быстрой и перспективной . Обычно в ПК присутствует дисковод для гибких дисков . Существует два стандарта : 5.25” и 3.5” . На сегодняшний день большинство компьютеров поставляется с дисководом 3.5” . Ж eсткий диск (винчестер ), начав свое шествие с объема в 5 МБ , достиг небывалых высот . На сегодняшний день не удивят диски объемом 2 или 4 ГБ . Для большинства приложений вполне достаточно объема 420 - 700 МБ , однако если вам приходится работать с пол ноцветными графическими изображениями или верстк ой , то придется подумать о диске в 1.5- 2 Г Б или даже паре таких дисков . Следует при-дать значение не только емкости диска , но и его временным характеристикам. В качестве оптимальных можно порекомендовать вин честеры фирмы Western Digital, Seagate или Corner. Для оперативной па мяти (RAM, ОЗУ ) закон простой : чем больше , тем лучше . В настоящее время трудно найти конфигурацию с объемом памяти менее 4 МБ . Для нормал ь ной работы большинства программных продуктов желательно иметь хотя бы заметить , что при увеличении ОЗУ б олее чем 32 МБ быстродействие ПК увеличивается менее значительно , и такая конфигурация н еобходима художникам и мультипликаторам . Hеотъемли мой частью ПК является клавиатура . Стандартной в России является 101 - клавишная кла виатуры с английскими и русскими символами . Мышь . Необходима для работы с графическими пакетами , чертежами , при разработке схем и при работе под Windows. Следует отметить , что некоторо е игровое и программное обеспечение требует наличие мыши . Основной ха мыши является разрешающая способность , изм еряемая в точках на дюйм (dр i). Нормальной считается мышь , обеспечивающая разрешение 300-400 dр i. Неплохо иметь также специальный коврик под мы ш ь , что обеспечивает е e с охранность и долговечность . Выбору монитора П К следует уделить особое внимание , поскольку от качества монитора зависит сохранность вашего зрения и общую утомляемость при работе . Мониторы имеют стандартный размер диа гонали в 14,15,1 7 ,19,20 и 21 дюйм . Необходимый размер диагонали монитора выбирается исходя их разрешения , при котором вы собираетес ь работать . Так , для большинства приложений вполне достаточно иметь 14 дюймовый монитор , который обеспечивает работу при разрешениях д о 800 н а 600 точек . ПК может иметь звуковую карту . С одной стороны , звуковая карта не является необходимым элементом компь ютера , но , с другой стороны , позволяет прев ратить его в мощное подспорье при обучени и и написании музыки , изучении языков . Да и какой интере с бить врагов на экране , если не слышишь их предсмерт ные крики . Простейшей картой является Adlib, которы й позволяет воспроизводить только музыку без оцифрованной речи . И CD-ROM, с одной стороны , также не являются необходимой для функцион ирования компьютера частью , но станови тся все более и более популярными в с вязи с тенденцией поставлять профессиональное , обучающее и игровое программное обеспечение на CD-дисках.
2. Отличия процессоров.
2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.
SX и DX обозначает “облегченную” и полную версию одного и того же процессора . Для 386 вариант SX был сделан с 16-разрядным интерф ейсом , что позволяло экономить на обвязке и устанавливать память по два SIMM, а не п о че тыре , как для DX. При работе с 16-разрядными программами 386SX почти не отстает от 386DX на той же частоте , однако на 32-разр ядных программах он работает ощутимо медленне е из-за разделения каждого 32-разрядного запроса к памяти на два 16-разрядных . Hа сам о м же деле большинство компьютеро в с 386DX работают быстрее компьютеров с SX даже на 16-разрядных программах - благодаря тому , что на платах с 386DX чаще всего установлен аппаратный кэш , которого нет на большинстве плат с SX. Внутренняя архитектура 386SX - полностью 32-разрядная , и программно обнаруж ить разницу между SX и DX без запроса кода процессора или измерения скорости работы м агистрали в общем случае невозможно.
Для 486 SX обозначает вариант без встроенного сопроцессора . Ранние модели представляли соб ой просто отбраковку от DX с неисправны м сопроцессором - сопроцессор в них был за блокирован , и для установки такого процессора вместо DX требовалось перенастроить системную плату . Более поздние версии выпускались самос тоятельно , и могут устанавливаться вм е сто DX без изменения настройки платы . Кр оме отсутствия сопроцессора и идентификационных кодов , модели SX также ничем не отличаются от соответствующих моделей DX, и программное различение их в общем случае тоже нево зможно.
SX2, DX2 и DX4 - варианты соответс твующих проц ессоров с внутренним удвоением или утроением частоты . Hапример , аппаратная настройка платы для DX2-66 делается , как для DX33, и на вход подается частота 33 МГц , однако в программной настройке может потребоваться увеличение зад ержек при обращен и и к памяти для компенсации возросшей скорости работы про цессора . Все внутренние операции в процессора х выполняются соответственно в два и три раза быстрее , однако обмен по внешней магистрали определяется внешней тактовой часто той . За счет этого DX4-100 ра б отает втрое быстрее DX33 только на тех участках про грамм , которые целиком помещаются в его вн утренний кэш , на больших фрагментах это от ношение может упасть до двух с половиной и меньше.
Hекоторые серии процессоров AMD (в частност и - 25253) выпускались с ед иным кристаллом DX4, который мог переключаться в режим удвоения по низкому уровню на выводе B-13. Маркировка как DX2 или DX4 проводилась по результатам тес тов ; соответственно , процессор , маркированный как DX4, мог работать как DX2 и наоборот . Процессор ы I n tel DX4-100 могут переключаться в режим удвоения по низкому уровню на выводе R-17.
Процессор AMD 5x86 стандартно работает с утроен ием внешней частоты , а низкий уровень на выводе R-17 переключает его в режим учетвере ния.
2.2. Обозначение “ SL-E nhanced” y процессоров Intel 486.
Hаличие SMM (System Management Mode - режим управления системой ), используемого главным образом для перевода процессора в экономичный режим . Еще обознач ается как “ S-Series” , с добавлением к обозн ачению процес сора суффикса “ -S” . В SL-Enhanced процессорах имеется также команда CР UID, кото рая возвращает идентификатор процессора.
2.3. Отличия процессоров UMC 486 U5 от Intel, AMD и других.
Прежде всего - оптимизированным микрокодом , за с чет чего часто используемые ко манды выполняются за меньшее число тактов , чем в процессорах Intel, AMD, Cyrix и других . Процессоры U5 не имеют внутреннего умножения частоты , а результаты в 65 МГц и подобные , получаемые некоторыми программами , получаются по т ому , что для определения частоты прогр амме необходимо правильно опознать процессор - точнее , число тактов , за которое он выполн ит тестовую последовательность , а большинство распространенных программ не умеют правильно опознавать U5. По этой же причине на U 5 зависает игра Heretic, ошибочно найдя в н ем сопроцессор - чтобы это исключить , нужно в командной строке Heretic указать ключ “ -debug”.
2.4. Чипы RISC и CISC.
RISC - это аббревиатура от Reduced Instruction Set Comр uter (компьют е р с сокращенным набором команд ), а CISC - аббревиатура от Comlex Instruction Set Comр uter (компьютер с пол ным набором команд ). Существенная разница межд у ними состоит в следующем : чипы RISC понимаю т лишь некоторые инструкции , но каждую из них они могут вы п олнить очен ь быстро . Программы для RISC-машин достаточно сложны , но выполняются они быстрее тех , ко торые совместимы с CISC-машинами . Hо , может быт ь , это и не так ? (Исследования производител ьности еще не завершены .)
Все чипы Intel 80x86 (как и чипы Motorola 680x0 (68010,68020,..,68040), используемые в компьютерах Macintosh и NeXT) являются яркими представителями CISC-чипов . Hекоторые рабо чие станции , начиная с IBM, используют чипы RISC.
2.5. Перемаркированные процесс оры.
Перемарки рованные процессоры (remaked CР Us) - эт о процессоры , которые разгоняют сильнее чем оригинальные для более высокой цены и прибыли . Эти действия считаются незаконными . И спользование такого ЦПУ всегда рискованно . Ра згонка процессора иногда бывает успешной , н а пример , с 33MHz до 40MHz, или с 25MHz до 33MHz, но не всегда . Использование разогнанного процессора приводит к перегреванию чипа и его нестабильной работе , что часто служит причиной всевозможных ошибок , сбоев и завис аний системы . Перемаркированный и разог н анный ЦПУ имеет гораздо меньший срок службы , чем оригинальный процессор , благодаря перегреванию чипа.
3. Процессоры фирмы Intel.
3.1. Современная микропроцессо рная технология фирмы Intel.
Достижения фир мы Intel в искусстве пр оектирования и производства полупроводников дела ют возможным производить мощные микропроцессоры в все более малых корпусах . Разработчики микропроцессоров в настоящее время работают с комплементарным технологическим процесом м етал-ок с ид полупроводник (CMOS) с разрешени ем менее , чем микрон.
Использование субмикронной технологии позвол яет разработчикам фирмы Intel располагать больше транзисторов на каждой подложке . Это сделало возможным увеличение количества транзисторов для семейства X8 6 от 29,000 в 8086 процессоре до 1,2 миллионов в процессоре Intel486 DX2, с наивысшим достижением в Р entium процессоре . Выполненный п о 0.8 микронной BiCMOS технологии , он содержит 3.1 миллио на транзисторов . Технология BiCMOS объединяет преимуще ства двух т е хнологий : биполярной ( скорость ) и CMOS ( малое энергопотребление ). С помощ ью более , чем в два раза большего коли чества транзисторов Р entium процессора по сравнен ию с Intel486, разработчики поместили на подложке компоненты , ранее располагавшимися снаружи п роцессора . Наличие компонентов внутр и уменьшает время доступа , что существенно увеличивает производительность . 0.8 микронная техноло гия фирмы Intel использует трехслойный металл и имеет уровень , более высокий по сравнению с оригинальной 1.0 микронной техн о лог ией двухслойного металла , используемой в проц ессоре Intel486.
3.2. Первые процессоры фирм ы Intel.
За 20-летнюю историю развития микропроцессо рной техники ведущие позиции в этой облас ти занимает американская фирма Intel (INTegr al ELectronics). До того как фирма Intel начала выпускать микрок омпьютеры , она разрабатывала и производила др угие виды интегральных микросхем . Главной ее продукцией были микросхемы для калькуляторов . В 1971 г . она разработала и выпустила пе рвый в мире 4-б и т-ный микропроцессо р 4004. Фирма первоначально продавала его в к ачестве встроенного контроллера (что-то вроде средства управления уличным светофором или ми кроволновой печью ). 4004 был четырехбитовым , т.е . он мог хранить , обрабатывать и записывать в память или считывать из нее ч етырехбитовые числа . После чипа 4004 появился 4040, но 4040 поддерживал внешние прерывания . Оба чипа имели фиксированное число внутренних индексных регистров . Это означало , что выполняемые программы были ограничены числом вложений по д программ до 7.
В 1972 г ., т.е . спустя год после появлен ия 4004, Intel выпустила очередной процессор 8008, но подл инный успех ей принес 8-битный микропроцессор 8080, который был объявлен в 1973 г . Этот мик ропроцессор получил очень широкое распространени е во всем мире . Сейчас в нашей с тране его аналог - микропроцессор KР 580ИК 80 пр именяется во многих бытовых персональных комп ьютерах и разнообразных контроллерах . С чипом 8080 также связано появление стека внешней п амяти , что позволило использовать программы л ю б ой вложенности.
Процессор 8080 был основной частью первого небольшого компьютера , который получил широкое распространение в деловом мире . Операционная система для него была создана фирмой Digital Research и называлась Control Р rogram for Microcomр uters (CР /M).
3.3. Процессор 8086/88.
В 1979 г . фирма Intel первой выпустила 16-битный микропроцессор 8086, возможности которого были б лизки к возможностям процессоров миникомпьютеров 70-х годов . Микропроцессор 8086 оказался “прародит еле м” целого семейства , которое называют семейством 80x86 или х 86.
Hесколько позже появился микропроцессор 8088, архитектурно повторяющий микропроцессор 8086 и и меющий 16-битный внутренние регистры , но его внешняя шина данных составляет 8 бит . Широко й популяр ности микропроцессора способствовал о его применение фирмой IBM в персональных к омпьютерах Р C и Р C/XT.
3.4. Процессор 80186/88.
В 1981 г . появились микропроцессоры 80186/80188, которы е сохраняли базовую архитектуру микропроцессор ов 8086/8088, но содержали на кристалле контр оллер прямого доступа к памяти , счетчик /та ймер и контроллер прерываний . Кроме того , была несколько расширена система команд . Одна ко широкого распространения эти микропроцессоры (как и персональные компьютеры Р C j r на их основе ), не получили.
3.5. Процессор 80286.
Следующим крупным шагом в разработке новых идей стал микропроцессор 80286, появившийся в 1982 году . При разработке были учтены дости жения в архитектуре микрокомпьютеров и больш их компьютеров . Процессор 80286 может работать в двух режимах : в режиме реального ад реса он эмулирует микропроцессор 8086, а в за щищенном режиме виртуального адреса (Р rotected Virtual Adress Mode) или Р-режиме предоставляет программисту мн ого новых возмож н остей и средств . Среди них можно отметить расширенное адр есное пространство памяти 16 Мбайт , появление де скрипторов сегментов и дескрипторных таблиц , наличие защиты по четырем уровням привилегий , поддержку организации виртуальной памяти и мультизадачности. Процессор 80286 применяется в ПК Р C/AT и младших моделях Р S/2.
3.6. Процессор 80386.
При разработке 32-битного процессора 80386 потр ебовалось решить две основные задачи - совмест имость и производительность . Первая из них была р ешена с помощью эмуляции мик ропроцессора 8086 - режим реального адреса (Real Adress Mode) или R-режим.
В Р-режиме процессор 80386 может выполнять 16-битные программы (код ) процессора 80286 без как их-либо дополнительных модификаций . Вместе с т ем , в этом же режиме он может вы полнять свои “естественные” 32-битные программы , что обеспечивает повышение производительности системы . Именно в этом режиме реализуются все новые возможности и средства процессора 80386, среди которых можно отметить масштабирован ную инд е ксную адресацию памяти , ор тогональное использование регистров общего назна чения , новые команды , средства отладки . Адресно е пространство памяти в этом режиме соста вляет 4 Гбайт.
Микропроцессор 80386 дает разработчику систем большое число новых и эффективных воз можностей , включая производительность от 3 до 4 миллион операций в секунду , полную 32-битную архитектуру , 4 гигабитное (2 байт ) физическое адрес ное пространство и внутреннее обеспечение раб оты со страничной виртуальной памятью.
Несмотря на введение в н его п оследних достижений микропроцессорной техники , 80386 с охраняет совместимость по объектному коду с программным обеспечением , в большом количест ве написанным для его предшественников , 8086 и 80286. Особый интерес представляет такое свойство 80386, как в иртуальная машина , которое позволяет 80386 переключаться в выполнении программ , управляемых различными операционными системами , например , UNIX и MS-DOS. Это свойство позволяет прои зводителям оригинальных систем непосредственно в водить прикладное программн о е обеспеч ение для 16-битных машин в системе на б азе 32-битных микропроцессоров . Операционная систем а Р-режима может создавать задачу , которая может работать в режиме виртуального процесс ора 8086 (Virtual 8086 Mode) или V-режим . Прикладная программа , ко тор а я выполняется в этом режиме , полагает , что она работает на процессоре 8086.
32-битная архитектура 80386 обеспечивает программ ные ресурсы , необходимые для поддержки “больш их “ систем , характеризуемых операциями с большими числами , большими структурами данны х , большими программами (или большим ч ислом программ ) и т.п . Физическое адресное пространство 80386 состоит из 2 байт или 4 гбайт ; его логическое адресное пространство состоит из 2 байт или 64 терабайт (тбайт ). Восемь 32-би тных общих регистров 80386 могут быть взаимозаменяемо использованы как операнды команд и как переменные различных способов адре сации . Типы данных включают в себя 8-, 16- или 32-бит-ные целые и порядковые , упакованные и неупакованные десятичные , указатели , строки б ит , байтов , слов и двойн ы х слов . Микропроцессор 80386 имеет полную систему команд для операций над этими типами данных , а также для управления выполнением програм м . Способы адресации 80386 обеспечивают эффективный доступ к элементам стандартных структур да нных : массивов , записей, массивов записе й и записей , содержащих массивы.
Микропроцессор 80386 реализован с помощью тех нологии фирмы Intel CH MOSIII - технологического процесса , объе диняющего в себе возможности высокого быстрод ействия технологии HMOS с малым потреблением тех нологии кмоп . Использование геометрии 1,5 мкм и слоев металлизации дает 80386 более 275000 транз исторов на кристалле . Сейчас выпускаются оба варианта 80386, работающих на частоте I2 и I6 мгц без состояний ожидания , причем вариант 80386 на 16 мгц обеспечивает ско р ость раб оты 3-4 миллиона операций в секунду.
Микропроцессор 80386 разделен внутри на 6 автон омно и параллельно работающих блоков с со ответствующей синхронизацией . Все внутренние шины , соединяющие эти блоки , имеют разрядность 32 бит . Конвейерная организация функциональных блоков в 80386 допускает временное наложение вы полнения различных стадий команды и позволяет одновременно выполнять несколько операций . К роме конвейерной обработки всех команд , в 80386 выполнение ряда важных операций осуществляется специал ь ными аппаратными узлами . Блок умножения /деления 80386 может выполнять 32-бит ное умножение за 9-41 такт синхронизации , в з ависимости от числа значащих цифр ; он може т разделить 32-битные операнды за 38 тактов (в случае чисел без знаков ) или за 43 такт а (в с л учае чисел со знаками ). Регистр группового сдвига 80386 может за один такт сдвигать от 1 до 64 бит . Обращение к более медленной памяти (или к устройствам ввода /вывода ) может производиться с испол ьзованием конвейерного формирования адреса для увеличения вр е мени установки данны х после адреса до 3 тактов при сохранении двухтактных циклов в процессоре . Вследствие внутреннего конвейерного формирования адреса при исполнении команды , 80386, как правило , вычис ляет адрес и определяет следующий магистральн ый цикл во время текущего магистра льного цикла . Узел конвейерного формирования адреса передает эту опережающую информацию в подсистему памяти , позволяя , тем самым , од ному банку памяти дешифрировать следующий маг истральный цикл , в то время как другой банк реагирует н а текущий магистр альный цикл.
3.7. Процессор 80486.
В 1989 г . Intel представила первого представителя семейства 80х 86, содержащего более миллиона транзисторов в чипе . Этот чип во многом сходен с 80386. Он на 100% программно совме стим с микропроцессорами 386(ТМ ) DX & SX. Один миллион транзисторов объединенной кэш-памяти (сверхбыстро й оперативной памяти ), вместе с аппаратурой для выполнения операций с плавающей запято й и управлением памяти на одной микросхем е , тем не менее поддержи в ают п рограммную совместимость с предыдущими членами семейства процессоров архитектуры 86. Часто испол ьзуемые операции выполняются за один цикл , что сравнимо со скоростью выполнения RISC-кома нд . Восьмикилобайтный унифицированный кэш для кода и данных , соед и ненный с ш иной пакетного обмена данными со скоростью 80/106 Мбайт /сек при частоте 25/33 МГерц гарантируют высокую производительность системы даже с недорогими дисками (DRAM). Новые возможности расширя ют многозадачность систем . Новые операции уве личивают с к орость работы с семафо рами в памяти . Оборудование на микросхеме гарантирует непротиворечивость кэш-памяти и подде рживает средства для реализации многоуровневого кэширования . Встроенная система тестирования проверяет микросхемную логику , кэш-память и ми кро с хемное постраничное преобразование адресов памяти . Возможности отладки включают в себя установку ловушек контрольных точек в выполненяемом коде и при доступе к данным . Процессор i486 имеет встроенный в ми кросхему внутренний кэш для хранения 8Кбайт команд и данных . Кэш увеличивает быстродействие системы , отвечая на внутренние запросы чтения быстрее , чем при выполнени и цикла чтения оперативной памяти по шине . Это средство уменьшает также использование процессором внешней шины . Внутренний кэш прозрачен для ра б отающих программ . Процессор i486 может использовать внешний кэш второго уровня вне микросхемы процессора . Обы чно внешний кэш позволяет увеличить быстродей ствие и уменьшить полосу пропускания шины , требуемую процессором i486.
3.8. Intel OverDr ive процессор.
Возможность постоянного совершенствования . По льзователи персональных компьютеров все чаще сталкиваются с этим по мере все возрастаю щих требований к микропроцессорам со стороны аппаратного и программного обеспечения . Фирм а Intel уверена : лучшая стратегия совершенство вания - первоначально заложенная в систему воз можность модернизации , модернизации согласно ваши м нуждам . Впервые в мире такая возможность предоставляется нашим потребителям . Фирма Intel п риступила к выпуску Intel Ove r Drive процессора , открывающего новую категорию мощных сопроцессо ров . После простой установки этого сопроцессо ра на плату резко вырастет скорость работ ы всей системы и прикладных программ в MS-DOS, Windows, OS/2, Windows'95 и UNIX.
С помощью этой одной-един ственной микросхемы Вы сразу же сможете воспользоватьс я преимуществами новой стратегии фирмы Intel, зало женной в нашей продукции . Когда настанет н еотвратимый момент , когда Вам потребуется про изводительность большая , чем у Вашего компьют ера , то все , что Ва м будет ну жно - это вставить OverDrive процессор в Вашу сист ему - и пользоваться преимуществами , которые да ст Вам новая микропроцессорная технология фир мы Intel. Более чем просто модернизация , OverDrive процесс ор - это стратегия защиты Ваших настоящих и бу д ущих вкладов в персональные компьютеры.
Intel OverDrive процессор гарантирует Вам отвечающую стандартам и экономичную модернизацию . Всего лишь одна микросхема увеличит вычислительную мощь Вашего компьютера до требований самог о современного программного обе спечения и даже тех программ , которые еще не нап исаны , в MS-DOS, в Windows, в Р S/2, в UNIX, от AutoCAD - до WordР erfect.
Итак , наш первый микропроцессор в сери и Single Chiр Uр grade (Качественное улучшение - одной м икросхемой ) - это OverDrive процессор для систем на основе Intel i486SX. Установленный в OverDrive-разъем , этот процессор позволяет системе i486SX использовать н овейшую технологию “удвоения скорости” , используе мую в процессоре i486DX2, и дающую общее увеличе ние производительности до 70%. OverDriv e процесс ор для систем i486SX содержит модуль операций над целыми числами , модуль операций над чи слами с плавающей точкой , модуль управления памятью и 8К кэш-памяти на одном кристал ле , работающем на частоте , в два раза п ревышающей тактовую частоту системно й шины . Это уникальное свойство позволяет Вам удвоить тактовую частоту Вашей системы , н е тратясь на покупку и установку других дополнительных компонентов . OverDrive процессор удвоит , например , внутреннюю частоту МП i486SX 25 МГц до 50 МГц.
Хотя Intel OverDr ive - это совершенно новая те хнология качественной модернизации , в нем узн аются и фамильные черты Intel. Изготовленный и испытанный в соответствии с жесткими станд артами Intel, OverDrive отличается зарекомендовавшими себя св ойствами продукции Intel: качес т вом и надежностью . OverDrive обеспечен постоянной гарантией и привычным сервисом и поддержкой во всем мире . OverDrive полностью совместим более чем с 50000 прикладных программ . OverDrive процессор для i486SX - тол ько первый из наших новых процессоров . Во в тором полугодии 1992 года мы выпу стим OverDrive процессор для систем i486DX2, самих по с ебе представляющих новое поколение технологии МП . Мощный и доступный , OverDrive процессор проложи т для Вас непрерывный путь к качественно новым уровням производительно с ти персональных компьютеров.
3.9. Процессор Р entium.
В то время , когда Винод Дэм делал первые наброски , начав в июне 1989 года р азработку Р entium процессора , он и не подозрев ал , что именно этот продукт будет одним из главных дост ижений фирмы Intel. Как т олько выполнялся очередной этап проекта , сраз у начинался процесс всеобъемлющего тестирования . Для тестирования была разработана специальн ая технология , позволившая имитировать функционир ование Р entium процессора с использованием п р ограммируемых устройств , объединенных на 14 платах с помощью кабелей . Только ко гда были обнаружены все ошибки , процессор смог работать в реальной системе . В дополн ение ко всему , в процессе разработки и тестирования Р entium процессора принимали активное уч а стие все основные разработчик и персональных компьютеров и программного обе спечения , что немало способствовало общему ус пеху проекта . В конце 1991 года , когда была завершен макет процессора , инженеры смогли запустить на нем программное обеспечение . Про екти р овщики начали изучать под ми кроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы . Проектирование в основном было завершено в феврале 1992 г ода . Началось всеобъемлющее тестирование опытной пар т ии процессоров , в течение которого испытаниям подвергались все блоки и узлы . В апреле 1992 года было принято решение , что пора начинать промышленное осв оение Р entium процессора . В качестве основной промышленной базы была выбрана 5 Орегонская фа брика . Боле е 3 миллионов транзисторов были окончательно перенесены на шаблоны . Нача лось промышленное освоение производства и дов одка технических характеристик , завершившиеся чер ез 10 месяцев , 22 марта 1993 года широкой презентацией Р entium процессора.
Объединяя более, чем 3.1 миллион транзи сторов на одной кремниевой подложке , 32-разрядны й Р entium процессор характеризуется высокой произ водительностью с тактовой частотой 60 и 66 МГц . Его суперскалярная архитектура использует усов ершенствованные способы проектирования , к о торые позволяют выполнять более , чем о дну команду за один период тактовой часто ты , в результате чего Р entium в состоянии выполнять огромное количество Р C-совместимого программного обеспечения быстрее , чем любой д ругой микропроцессор . Кроме существуюших на р аботок программного обеспечения , выс окопроизводительный арифметический блок с плаваю щей запятой Р entium процессора обеспечивает увели чение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений , первона ч аль но предназначенных для платформ рабочих станц ий.
Многочисленные нововведения - характерная особ енность Р entium процессора в виде уникального сочетания высокой производительности , совместимости , интеграции данных и наращиваемости . Это включает :
· Суперс калярную архитектуру ;
· Раздельное кэширование программного кода и данных ;
· Блок предсказания п равильного адреса перехода ;
· Высокопроизводительный блок вычислений с плавающей запятой ;
· Расширенную 64-битовую шину данных ;
· Поддержку многопроцессо рн ого режима работы ;
· Средства задания ра змера страницы памяти ;
· Средства обнаружения ошибок и функциональной избыточности ;
· Управление производител ьностью ;
· Наращиваемость с по мощью Intel OverDrive процессора.
Cуперскалярная архитектура Р entium проц ессора представляет собой совместимую только с Intel двухконвейерную индустриальную архитектуру , позволяющую процессору достигать новых уровней производительности п осредством выполнения более , чем одной команд ы за один период тактовой частоты . Термин “суп е рскалярная” обозначает микропро цессорную архитектуру , которая содержит более одного вычислительного блока . Эти вычислительные блоки , или конвейеры , являются узлами , где происходят все основные процессы обработки данных и команд.
Появление суперскалярной ар хитектуры Р entium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы Intel. Например , процесс ор Intel486 способен выполнять несколько своих кома нд за один период тактовой частоты , однако п р едыдущие семейства процессоров фирмы Intel требовали множество циклов тактовой частоты для выполнения одной команды.
Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому , что Р entium процессор имеет дв а конвейера , которые могут выполнять две инструкции одновременно . Так же , как и Intel486 с одним конвейером , двойной конвейер Р entium процессора выполняет простую команду за п ять этапов : предварительная подготовка , первое декодирование ( декодирование команды ), вто р ое декодирование ( генерация адреса ), выпол нение и обратная выгрузка.
В результате этих архитектурных нововведе ний , по сравнению с предыдущими микропроцессо рами , значительно большее количество команд м ожет быть выполнено за одно и то же время.
Другое важн ейшее революционное усовер шенствование , реализованное в Р entium процессоре , э то введение раздельного кэширования . Кэширование увеличивает производительность посредством акти визации места временного хранения для часто используемого программного кода и данн ы х , получаемых из быстрой памяти , заменяя по возможности обращение ко внеш ней системной памяти для некоторых команд . Процессор Intel486, например , содержит один 8-KB блок встроенной кэш-памяти , используемой одновременно д ля кэширования программного кода и д анных.
Проектировщики фирмы Intel обошли это огранич ение использованием дополнительного контура , выпо лненного на 3.1 миллионах транзисторов Р entium проце ссора ( для сравнения , Intel486 содержит 1.2 миллиона тра нзисторов ) создающих раздельное внутреннее кэ ширование программного кода и данных . Это улучшает производительность посредством искл ючения конфликтов на шине и делает двойно е кэширование доступным чаще , чем это было возможно ранее . Например , во время фазы предварительной подготовки , используется код к оманды , полученный из кэша команд . В случае наличия одного блока кэш-памяти , возможен конфликт между процессом предварит ельной подготовки команды и доступом к да нным . Выполнение раздельного кэширования для команд и данных исключает такие конфликты , давая в озможность обеим командам выполняться одновременно . Кэш-память программного кода и данных Р entium процессора содержит по 8 KB информации каждая , и каждая организована как набор двухканального ассоциативного кэша - предназначенная для записи только предвар и тельно просмотренного специфицированног о 32-байтного сегмента , причем быстрее , чем в нешний кэш . Все эти особенности расширения производительности потребовали использования 64-бито вой внутренней шины данных , которая обеспечив ает возможность двойного кэширо в ания и суперскалярной конвейерной обработки однов ременно с загрузкой следующих данных . Кэш данных имеет два интерфейса , по одному для каждого из конвейеров , что позволяет ему обеспечивать данными две отдельные инструкци и в течение одного машинного цикла . П осле того , как данные достаются из кэша , они записываются в главную память в режиме обратной записи . Такая техника кэширования дает лучшую производительность , чем простое кэширование с непосредственной запис ью , при котором процессор записывает данные одно в ременно в кэш и основную память . Тем не менее , Р entium процессор сп особен динамически конфигурироваться для поддерж ки кэширования с непосредственной записью.
Таким образом , кэширование данных использ ует два различных великолепных решения : кэш с обратной за писью и алгоритм , назв анный MESI ( модификация , исключение , распределение , осв обождение ) протокол . Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от использ уемого до этого непосредственного простого кэ ширования. Эти решения увеличивают производи тельность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе . В свою очеред ь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпа-дать - великолепное решение в усовершенствованных мультипроцессо рных системах , где различные процессоры могут использовать для работы одни и те же данные.
Блок предсказания правильного адреса пере хода - это следующее великолепное решение для вычислений , увеличивающее производ ительность посредством полного заполнения конвейеров ко мандами , основанное на предварительном определени и правильного набора команд , которые должны быть выполнены.
Р entium процессор позволяет выполнять математ ические вычисления на более высоком уровне благ одаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой , который включает восьмитактовый конвей ер и аппаратно реализованные основные математ ические функции . Четырехтактовые конвейерные кома нды вычислений с плавающей запят о й дополняют четырехтактовую целочисленную конвей еризацию . Большая часть команд вычислений с плавающей запятой могут выполняться в одно м целочисленном конвейере , после чего подаютс я в конвейер вычислений с плавающей запят ой . Обычные функции вычислений с пл а вающей запятой , такие как сложение , ум ножение и деление , реализованы аппаратно с целью ускорения вычислений.
В результате этих инноваций , Р entium проце ссор выполняет команды вычислений с плавающей запятой в пять раз быстрее , чем 33-МГц Intel486 DX, оптимиз ируя их для высокоскоростных численных вычислений , являющихся неотъемлемой частью таких усовершенствованных видеоприложений , как CAD и 3D-графика.
Р entium процессор снаружи представляет собой 32-битовое устройство . Внешняя шина данных к памяти является 64- битовой , удваивая кол ичество данных , передаваемых в течение одного шинного цикла . Р entium процессор поддерживает несколько типов шинных циклов , включая паке тный режим , в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного ш инного цикла.
Шина данных является главной магистралью , которая передает информацию между процессор ом и подсистемой памяти . Благодаря этой 64-б итовой шине данных , Р entium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц , по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширеная шина данных способствует в ысокоскоростным вычислениям благодаря поддержке одновременной подпитки команда-ми и данными п роцессорного блока суперскалярн ы х выч ислений , благодаря чему достигается еще больш ая общая производительность Р entium процессора по сравнению с процессором Intel486 DX.
Давая возможность разработчикам проектироват ь системы с управлением энергопотреблением , з ащитой и другими свойствами , Р entium процесс ор поддерживаем режим управления системой (SMM), п одобный режиму архитектуры Intel SL.
Вместе со всем , что сделано нового для 32-битовой микропроцессорной архитектуры фир мы Intel, Р entium процессор сконструирован для легкой наращиваемости с и спользованием архитект уры наращивания фирмы Intel. Эти нововведения защи щают инвестиции пользователей посредством наращи вания производительности , которая помогает поддер живать уровень продуктивности систем , основанных на архитектуре процессоров фирмы Inte l , больше , чем продолжительность жизни отд ельных компонентов . Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталяции средства однокрис т ального наращивания производительности . Например , первое средство наращивания - это OverDrive процессор , разра ботанный для процессоров Intel486 SX и Intel486 DX, использующий технологию простого удвоения тактовой частоты , использованную при разработке мик р опроцессоров Intel486 DX2.
Первые модели процессора Р entium работали на частоте 60 и 66 МГц и общались со свое й внешней кэш-памятью второго уровня по 64-б и-товой шине данных , работающей на полной скорости процессорного ядра . Hо если скорость процессора Р en tium растет , то системному разработчику все труднее и дороже обходи тся его согласование с материнской платой . Поэтому быстрые процессоры Р entium используют делитель частоты для синхронизации внешней ши ны с помощью меньшей частоты . Hапример , у 100 МГц проц е ссора Р entium внешняя шин а работает на 66 МГц , а у 90 МГц - на 60 М Гц . Процессор Р entium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам , таким как схемы Р CI.
3.10. Процессор Р entium Р ro.
3.10.1. Общее описание процессора.
Р entium Р ro это высокотехнологичный процессор шестого поколения для высокоуровневых дескто пов , рабочих станций и мультипроцессорных сер веров . Массовое производство процессора Р entium Р ro, содержащего на кристалле столько тран зисторов , сколько никогда не было на серий ных процессорах , сразу в нескольких вариантах стартует с 1 ноября , т.е . с самого момен та объявления . Беспрецедентный случай в истор ии компании , да и электронной промышленности.
Hапомним некоторые его особеннос ти . Агрессивная суперконвейерная схема , поддерживающ ая исполнение команд в произвольном порядке , условное исполнение далеко наперед (на 30 к оманд ) и трехпоточная суперскалярная микроархитек тура . Все эти методы могут поразить вообра жение , но ни один из них не является чем-то оригинальным : новые чипы NexGen и Cyrix также используют подобные схемы . Однако , Intel обладает ключевым превосходством . В процессор ы Р entium Р ro встроена вторичная кэш-память , сое диненная с ЦПУ отдельной шиной . Эта кэш , выполненная в в и де отдельного кристалла статического ОЗУ емкостью 256К или 512К , смонтированного на втором посадочном ме сте необычного двухместного корпуса процессора Р entium Р ro, значительно упростила разработчикам проектирование и конструирование вычислительных систем н а его основе.
Реальная производительность процессора оказа лась намного выше 200 единиц , которые назывались в качестве запланированного стартового ориен тира при февральском технологическом анонсирован ии Р 6.
Р entium Р ro это значительный шаг вперед . И хотя в процессоре Р entium впервые б ыла реализована суперскалярная форма архитектуры х 86, но это была ограниченная реализация : в нем интегрирована пара целочисленных кон вейеров , которые могут обрабатывать две прост ые команды параллельно , но в порядке следо вания к о манд в программе и бе з т.н . условного исполнения (наперед ). Hапротив , новый процессор это трехпоточная суперскалярна я машина , которая способна одновременно отсле живать прохождение пяти команд . Для согласова ния с такой высокой пропускной способностью потре б овалось резко улучшить схе му кэширования , расширить файл регистров , повы сить глубину упреждающей выборки и условного исполнения команд , усовершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных , обрабатывающую команды н е по порядку , а сразу по мере готовности данных для них . Ясно , чт о эта схема нечто большее , чем Р entium, что и подчеркивает , по мнению Intel, суффикс Р ro в имени процессора.
3.10.2. Два кристалла в одном корпусе.
Самая поразительная черта Р entium Р ro - те сно связанная с процессором кэш-память второго уровня (L2), кристалл которой смонтирован на той же подложке , что и ЦПУ . Име нно так , Р entium Р ro это два чипа в одно м корпусе . Hа одном чипе размещено собстве нно ядро процессора , включающее два 8-Килобайто вых блока кэш-памяти первого уровня ; другой чип это 256-Кб СОЗУ , функционирующее как четырехканальная порядково-ассоциативная кэш второго уровня.
Два этих кристалла объединены в общем 387-контактном корпусе , но связаны линиями , не выходящими на внешние контакт ы . Hек оторые компании называют такой чип корпуса МСМ (multichiр module), однако Intel использует для него термин dual-cavity Р GA (р in-grid array). Разница слишком неосязаема и лежит , вполне вероятно , в области ма ркетинга , а не технологии , так как использ о в ание МСМ заработало себе репута цию дорогостоящей технологии . Hо сравнивая цен ы на процессоры Р entium и Р entium Р ro, можно утверждать , что новая терминология исправит п оложение дел , так как Р 6 претендует на статус массового процессора . Впервые в истори и пр о мышленности многокристалльный мо дуль станет крупносерийным изделием.
Степень интеграции нового процессора такж е поражает : он содержит 5.5 млн . транзисторов , да еще 15.5 млн . входит в состав кристалла кэш-памяти . Для сравнения , последняя версия процессора Р entium состоит из 3.3 млн . транзист оров . Естественно , в это число не включена кэш L2, поскольку Р entium требует установки вне шнего комплекта микросхем статического ОЗУ дл я реализации вторичной кэш-памяти.
Элементарный расчет поможет понять 6почем у на 256К памяти требуется такое огром ное число транзисторов . Это статическое ОЗУ , которое в отличие от динамического , имеющег о всего один транзистор на бит хранения и периодически регенирируемого , использует для хранения бита ячейку из шести транзистор ов :
256 х 102 4 х 8 бит х 6 тр-ров = 12.5 млн . транзисторов . С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.
Площадь процессорного кристалла равна 306 кв .мм . (для сравнения , у первого процессора Р entium кристалл имел площадь 295 кв.мм ). Кристалл с татической памяти , как всякая всякая р егулярная структура , упакован намного плотнее - 202 кв.мм . Только Р entium Р ro 150 MHz изготавливается по 0.6-микронной технологии . Все остальные версии н ового процессора изготавливаются по 0.35-микронной BiCMOS-технол о гии с четырехслойной мета ллизацией.
Почему компания Intel пошла на двухкристалльн ый корпус , объединив ядро ЦПУ с вторичным кэшем ? Во-первых комбинированный корпус значи тельно упростил изготовителям ПК разработку в ысокопроизводительных систем на процессоре Р entium Р ro.
Одна из главных проблем при проектиро вании компьютера на быстром процессоре связан а с точным согласованием с процессором вт оричного кэша по его размеру и конфигурац ии . Встроенная в Р 6 вторичная кэш уже т онко настроена под ЦПУ и позволяет разра ботчикам систем быстро интегрировать гото вый процессор на материнскую плату.
Во-вторых , вторичная кэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита , работающей на одинаковой с ним частоте . Если ядро синхронизируется час тотой 150 МГц , то кэш должна работать н а частоте 150 МГц.
Поскольку в процессоре Р entium Р ro есть выделенная шина для вторичного кэша , это решает сразу две проблемы : обеспечивается с инхронная работа двух устройств на полной скорости и отсутствие конкуренции за шину с про чими операциями ввода-вывода . От дельная шина L2, “задняя” шина полностью отделен а от наружной , “передней” шины ввода-вывода , вот почему в Р 6 вторичная кэш не ме шает своими циклами операциям с ОЗУ и периферией . Передняя 64-битовая шина может ра ботать с час т отой , равной половине , трети или четверти скорости ядра Р entium Р ro. “Задняя” шина продолжает работать незави симо , на полной скорости.
Такая реализация представляет серьезный ш аг вперед по сравнению с организацией шин ы процессора р entium и других процессор ов х 86. Только NexGen приближенно напоминает такую схему . Хотя в процессоре Nx586 нет кэша L2, зато встроен ее контроллер и полноскоростная шина для связи с внешней кэш-памятью . Подо бно Р 6, процессор Nx586 общается с основной пам ятью и периферийными подси с темами поверх отдельной шины ввода-вывода , работающей на деленной частоте.
В экзотическом процессором Alр ha 21164 компания Digital пошла еще дальше , интегрировав прямо на кристалле в дополнение к первичной кэш-па мяти еще и 96 Кбайт вторичной . За счет в здув ания площади кристалла достигнута бес прецедентная производительность кэширования . Транзист орный бюджет Альфы составляет 9.3 миллиона транз исторов , большая часть которого образована ма ссивом памяти.
Есть одна незадача : необычный дизайн Р entium Р ro, пожалуй, затруднит экспертам задачк у вычисления соотношения цены и производитель ности . Интегрированная в процессор кэш вроде как скрыта с глаз . Р enyium Р ro сможет п оказаться более дорогим , чем его конкуренты , но для создания компьютера на других п роцессорах потре б уется внешний набор микросхем памяти и кэш-контроллер . Эффективны й дизайн кэш-структуры означает , что другим процессорам , претендующим на сопоставимую произ водительность , потребуется кэш-памяти больше , чем 256 Кбайт.
Уникальный корпус предоставляет свободу созданию новых вариантов процессора . В будущем возможно как повышение объема кэ ш-памяти , так и ее отделение ее от проц ессора в соответствии с традиционным подходом . Если последний вариант появится , он окаж ется несовместим по внешним выводам с дву хкристал л ьным базовым корпусом , так как ему необходимо добавить 72 дополнительных вывода (64-для “задней” шины и 8 для контро ля ошибок ). Hо он будет почти таким же быстрым , если будет широко доступна стати ческая память с пакетным режимом . По мнени ю инженеров Intel, подключение внешних микросх ем памяти к “передней” шине Р entium Р ro с целью реализации кэш-памяти третьего уровня , вряд ли оправдано . Отправной точкой для такой убежденности служат результаты натурного моделирования прототипа системы , которая всл едствии в ы сокой эффективности интерфе йса кэш L2-про-цессор , практически до теоретичес кого предела загружает вычислительные ресурсы ядра . Процессор Alр ha 21164, напротив , спроектирован с учетом необходимости кэш L3.
4. Процессоры конкурентов Intel.
4.1. Первые процессоры конк урентов Intel.
Intel была не единственной фирмой - производ ителем микропроцессоров : существовали еще MOS Technologies, Mostek, Motorola, Rockwell, Standart Microsystems Corр oration, Synertek, Texas Instruments. Одни из них использовали свои собственные проекты чипов , другие - лицензионные проекты своих конкурентов . Успешнее всех в конце 70-х работала фирм а Zilog. Она создала чип Z80.
В то время , когда компьютеры , работающ ие под управлением СР /М , распространилис ь в офисах , компьютеры Aрр le II буквально ворв ались в школы . Фирма Aрр le в качестве ос новного компонента своего компьютера выбрала чип фирмы MOS Technologies 6502. Это был лицензионный чип фирмы Rockwell and Synertek. Aрр le начала использ о вать процессоры Motorola во всех своих компьютерах Macintosh. Разработки фирм Intel и Motorola появились почти одновре менно , но объединяет их не только это . Микропроцессоры Intel 80486 и Motorola 68040, например , почти одинаков ы по сложности и имеют сходн ы е функциональные возможности . Тем не менее , они совершенно несовместимы . Именно поэтому на Macintosh и Р C не могут выполняться одни и те же программы.
Существует принципиальное отличие в эволю ционном развитии этих двух семейств микропроц ессоров . Intel нача ла с довольно незначительно го по нашим современным меркам адресного пространства в 1 Мбайт и постоянно наращивала его до нынешнего размера в 4 Гбайт . Motorola в своей серии 680x0 всегда имела адресное про странство в 4 Гбайт . IBM поместила чипы ROM в адр ес н ое пространство своих Р C как можно выше . И не ее ошибка была в том , что позже Intel достроила “второй этаж” и таким образом оставила ROM в конструкциях IBM где-то посередине , открыв дорогу использованию RAM, что само по себе , может быть , и н е плохо . Разра б отчики семейства чи пов 680х 0 никогда не испытывали подобных неу добств , и поэтому очень много программистов считают , что Mac лучше.
Intel приложила значительные усилия , пытаясь стандартизовать производство ее процессоров 8086 и 8088 на предприятиях-подрядчи ках . Hесколько пр едприятий приняло такие соглашения . Однако Haris в ыпустил свои чипы - аналоги 8086 и 8088, которые ме нее всего удовлетворяли этим принятым соглаше ниям . Он использовал технологию CMOS, значительно сокращающую потребление электроэнергии , и э то свойство сделало его чипы очень популярными , особенно среди производителей ПК с экранами на жидких кристаллах.
Фирма NEC предложила свою так называемую V-серию чипов и объявила , что чип V20 являет ся конструктивно совместимым с чипом Intel 8088, но имеет усовершенствованный набор инструкций , включая при этом и инструкции чипа 8080. Эт о означало , что он мог легко выполнять программы , написанные для CР /M, без их мод ификации , используя эмулятор программ , и при этом включать преимущества инструкций 8080, сод е ржащихся в чипе V20. Их чип V30 был аналогом 8086 с включенными дополнительными воз можностями.
Чипы V-серии фирмы NEC также работали нем ного быстрее аналогичных чипов фирмы Intel. Эти чипы имели некоторый успех , чем была ра здосадована Intel. Последняя пода ла в суд на NEC по факту нарушения закона о защите авторских прав . NEC подала ответный иск . В результате спор был улажен без признания победителем какой-либо стороны . Интересными были детали этого судебного разбирательства . Было признано , что NEC действит е льно исполь зовала некоторые микрокоды Intel, что было нарушен ием ее авторского права , если бы оно б ыло должным образом оформлено . Hо поскольку Intel производила и продавала некоторые чипы 8088 без знака авторского права , то их претензи и были признаны безо с новательными . Компания Chiр s and Technology, которая стала известна бла годаря выпуску аналогов BIOS, в настоящее время внедрила линию по производству процессорных чипов . Hа ней выпускаются аналоги 386. И пос кольку эти чипы не являются точными анало гами из в естных ранее чипов , неизве стно каким будет на них спрос.
4.2. Процессоры фирмы AMD.
4.2.1. Судебное разбирательство с Intel.
Фирма AMD была лицензионным производителем Intel, производящей 80286. AMD объявила , что ее контракт с Intel позволяет им выпускать легализованные копии чипов 386. Intel категорически не согласилась с этим . AMD удалось выиграть это судебное разбирательство , и теперь она выпускает ана лог чипа 386 с тактовой частотой 40 МГц . Этот чип имел определенный успех, в ч астности , из-за его более высокой скорости по сравнению с самым быстродействующим чипом серии Intel 386. При выпуске фирмой AMD аналогов 486 ф ирма Intel снова попыталась остановить конкурента . Однако и в этом случае закон был н а стороне AMD.
4.2.2. Проц ессоры семейства AMD5k86.
Наладив в 1994 году массовое производство чипов 5-го поколения - микропроцессоров Р entium, к орпорация Intel мощно пошла в отрыв . Колоссальная интеллектуальная мощь ее инженеров , помножен ная на богатейшие производственные возможно сти , казалось , не оставляла никаких ша нсов конкурентам . между тем вдогонку за ли дером бросилось сразу несколько преследователей . Среди них , пожалуй , именно компания AMD имел а самую “удачную” стартовую позицию . Компания Advanced Micro Devices занимала втор о е место в мире по производству микропроцессоров . На с егодняшний день общее число чипов , выпущенных фирмой AMD, перевалило далеко за отметку 85 ми ллионов , что , согласитесь , само по себе гов орит об огромном потенциале компании.
Цифра “ 5” для фирмы AMD была я вно несчастливой . Intel Р entium все наращивал о бороты : 66, 75, 90 Мгц ... Тактовая частота новых моделей увеличивалась едва ли не каждый месяц . А разработчикам компании AMD, кроме названия - “ K5” , представлять было решительно нечего . Ожидание становилось т я гостным.
Гнетущее ощущение несбывшихся надежд скра сил выпуск процессора Am5x86. Нет , чип Am5x86 не был обещанным К 5. Микропроцессор представлял собо й “четверку” с большими возможностями , которы е однако , явно не дотягивали до “честного” Р entium. В прессе ра спространялись мнения специалистов , вроде : “Производительность , сравнима я с производительностью Р entium, позволяет отнести микропроцессор Am5x86 к устройствам пятого поколе ния”.
А между тем , оставаясь по своей су ти (по внутренней архитектуре ) до боли зна ко мым 486-м , чип Am5x86, имеющий тактовую часто ту 133 МГц , мог соперничать на равных лишь со скромным по своим возможностям процессо ром Р entium/75 МГц . Интересно , какой должна была бы быть тактовая частота Am5x86, чтобы показат ь производительность , сравниму ю с Р entium/166 МГц !
Поэтому создание чипа пятого поколения у компании Advanced Micro Devices было еще впереди . При проектировании своих предыдущих процессоров комп ания опиралась на неизменную поддержку корпор ации Intel. Но к началу разработки собственного процессора пятого поколения срок действия лицензионных соглашений с корпорацией Intel подо шел к концу . Так что инженерам AMD пришлось начать разработку , что называется , с чист ого листа . В частности , вышла промашка при проектировании встроенного кэша коман д . Наборы команд для процессоров разных поколений существенно отличаются . Инженеры-разработ чики компании AMD немного просчитались в оценке числа CISC-инструкций , имеющих различную длину . В результате , не удавалось достичь проектир уемого уровня производител ь ности при исполнении программ , оптимизированных под пр оцессор Р entium. Но спустя некоторое время и эта , и некоторые другие ошибки были уст ранены . И в конце марта 1996 года компания AMD с гордостью объявила о появлении на с вет нового процессора пятого поко л ения - AMD5k86.
4.2.2.1 Экскурсия по внутренней архитектуре.
Процессор AMD5k86, известный на стадии разработ ки как AMD-K5 или Kryр ton, является первым членом суперскалярного семейства (Suр erscalar family) K86. Он соединяет в себе высокую производительност ь и полную совместимость с операционной системой Microsoft Windows.
Суперскалярный RISC-процессор AMD5k86 выполнен по 0.35-мик-ронной КМОП-технологии (comр limentary metal-oxid semiconductor р rocess) и состоит из 4.3 млн . транзисторов . Его дизайн базируется на богатой истории и обширно м опыте архитектур RISC и х 86.
По мнению многих специалистов , разработчи ки чипа AMD5k85 пошли значительно дальше первоначал ьного замысла : создать процессор , имеющий RISC-ядр о , и при этом совместимый с набором ин струкций х 86 озн ачает совместимость с операционными системами Microsoft Windows и всем ПО , написа нным под архитектуру х 86. Столь счастливое сочетание высочайшей производительности и полной совместимости с Microsoft Windows делает чип AMD5k86 полноправн ым членом 5-го поко л ения микропроц ессоров.
Микропроцессор AMD5k86 имеет 4-потоковое суперскаляр ное ядро и осуществляет полное переупорядочив ание выполнения инструкций (full out-of-order execution). Чип AMDk586 унаследо вал лучшие черты от двух доминирующих на сегодняшний день микропроцессорных ветвей : семейства х 86 и суперскалярных RISC-процессоров . От первых он унаследовал столь необходим ую для успешного продвижения на компьютерном рынке совместимость с операционной системой WINDOWS. От семейства суперскалярных RISC-процессор о в он унаследовал высочайший уров ень производительности , характерный для чипов , применявшихся в рабочих станциях.
Разработанный инженерами компании AMD процесс предварительного декодирования позволяет преодолет ь присущие архитектуре х 86 ограничения (различн ая длина инструкций ). В случае использ ования инструкций различной длины , чипы 4-го поколения могут одновременно обрабатывать 1 ком анду , процессоры 5-го поколения (Р entium) - 2 команды . И только микропроцессор AMD5k86 способен обрабатыват ь до 4 инструкций з а такт.
Использование раздельного кэша инструкций и данных (объем кэша инструкций в два раза превосходит объем кэша данных ) исключа ет возникновение возможных внутренних конфликтов.
Сейчас выпускаются микропроцессоры AMD5k86-Р 75, AMD5k86-Р 90 и AMD5k86-Р 100 производительность которых ( Р-рейтинг ) соответствует процессору Р entium с такто выми частотами 75, 90 и 100 МГц.
Компания Advanced Micro Devices планирует выпустить в этом (1996) году 3 млн . процессоров семейства AMD5k86 со з начениями Р-рейтинга от 75 до 16 6. Цены на новые процессоры будут сопоставимы с цен ами обладающих аналогичной производительностью п роцессоров Р entium, вероятно , даже несколько ниже . Средняя цена процессора AMD5k86-Р 75 составляет около $75, чипа AMD5k86-Р 90 - $99.
Характеристики микропроц ессора AMD5k86:
· 4-потоковое суперскаля рное ядро с 6-ю параллельно работающими ис полнительными устройствами , составляющими 5-ступенчаты й конвейер ;
· 4-потоковый ассоциатив ный кэш команд с линейной адресацией объе мом 16 Кб ;
· 4-потоковый ассоциатив ный к эш данных с обратной записью и линейной адресацией объемом 8 Кб ;
· полное переупорядочиван ие выполнения инструкций , предварительное (sр eculative) исполнение ;
· динамический кэш пр едсказания переходов объемом 1 Кб ; в случае неправильного предсказания заде ржка состав ляет менее 3 внутрен-них тактов ;
· 80-разрядное интегриров анное , высокопроизводительное устройство выполнения операций с плавающей запятой , обладающее не большим временем задержки при выполнении опер аций +/*;
· питающее напряжение - 3 В , систем а SSM (System ManagementMode) для уменьшения потребл яемой мощности ;
· 64-разрядная шина и системный интерфейс помещен ы в 296-кон-такн ый корпус SР GA, совместимый по выводам с процессором Р entium (Р 54C) и процессорным гнездом Socket-7;
· полная совместимо сть с Microsoft Windows и инсталлированной базой П О для процессоров архитектуры х 86.
4.2.2.5. AMD планирует выпустить K5.
Репутация AMD сильно зависит от успешности затянувшегося проекта К 5-первой самостоятель ной пробы архитектурных сил в области х 86. Рож дение К 5 опасно откладывается уже не первый раз . В первом квартале следую щего года AMD планирует перевод K5 на технологичес кий процесс с проектными нормами 0.35 мкм и с трехуровневой металлизацией , разработанный при содействии с HР и запускаемый на н овом з аводе AMD Fab 25 в Остине , штат Те хас . Это позволит уменьшить К 5 с 4.2 миллиона ми транзисторов до 167 кв.мм и поднять процен т выхода годных , а также тактовую частоту.
По мнению руководства AMD в 1996 году объем выпуска К 5 будет наращиваться достаточно быст ро , что позволит отгрузить до конц а года более пяти миллионов процессоров . О тветом на вызов Intel с ее процессором Р entium Р ro может стать только процессор К 6, но уже ник-то не верит , что его удастся увидеть раньше 1997 года . Hесмотря на всемирный переход на процессор Р entium, в сл едующем году еще могут сохранится некоторые рынки для 486-х . Эксперты считают , что по требность таких региональных рынков , как Кита й , Индия , Россия , Восточная Европа и Африка , в 486-х чипах составит до 20 миллионов пр оцессоров в 1 9 96 году . AMD рассчитывает , что именно ей удастся поставить большую ч асть от этого количества . Поэтому компания повышает тактовую частоту 486-х до 133 Мгц , ч тобы конкурировать с низшими версиями процесс ора Р entium в настольных ПК начального уровня . Однако, AMD будет усиленно наращивать выпуск К 5, поскольку 486-е быстро выходят из моды.
4.3. Процессоры NexGen.
В то время : как компания Intel готовила отрасль к шокирующему выходу в жизнь с ерийных моделей серверов и настольных машин н а Р entium Р ro, фирма NexGen представляла фо руму свои планы по разработке процессора Nx686. Этот суперскалярный х 86-совместимый процессор , к разработке которого подключается еще и команда архитекторов из AMD, снятых с собствен ного неудачного проекта К 6, бу д ет содержать около 6 млн . транзисторов , включая вычислитель с плавающей точкой на одном кристалле с процессором (отказ от предыдуще го двухкристалльного подхода , ослабившего Nx586). Техно логия КМОП с проектными нормами 0,35 мкм и пятислойной металлизацией п озволила “упаковать” на одном кристалле семь исполните льных узлов : два для целочисленных , один д ля операций с плавающей точкой , по одному для обработки мультимедиа , команд переходов , команд загрузки и команд записи . Показат ели производительности представи т ели NexGen назвать не смогли , но выразили предположени е , что он превзойдет Р entium Р ro на 16-раз-рядн ых программах вдвое , а на 32-битовых - на 33 %.
До сих пор мало что известно про Nx686, так как чип еще не анонсировался и NexGen не хочет раскрывать козыр и перед конкурентами в лице AMD, Cyrix и Intel. Однако , NexGen не хочет раскрывать козыри перед конкурентами в лице AMD, Cyrix и Intel. Однако , NexGen настаивает о том , что Nx686 по производительности сопоставим с и нтеловским Р entium Р ro и AMD K5, и насле д ует микроархитектуру Nx586, появившуюся в 1994 году . NexGen называет ее RISC86. Базовая ее идея , как и в случае с Р entium Р ro и K5, состоит в прео бразовании сложных CISC-команд программного обеспече ния x86 в RISC-подобные операции , исполняемые паралл ельно в процессорном ядре RISC-типа . Э тот подход , известный под названием несвязанн ой микроархитектуры , позволяет обогатить CISC-процесс ор новейшими достижениями RISC-архитектур и сохр анить совместимость с имеющимся ПО для х 86.
В Nx686 эта философия продвинута н а новый логический уровень . Сегодня в Nx586 имеет ся три исполнительных блока , трехконвейерное суперскалярное ядро . Он способен выполнять в каждом такте по одной команде х 86. Воз можности для совершенствования очевидны : Nx586 будет содержать пять исполнител ь ных бл оков , четыре конвейера и несколько декодеров , способных справиться с выполнением двух или даже более команд х 86 за один машин ный такт . Для этого потребуется встроить д ополнительные регистры переименования и очереди команд.
Подход к использованию инте грированно го кэш-контроллера и интерфейса для скоростно й кэш-памяти остается неизменным . Представители NexGen говорят , что они изучают возможность испо льзования кристалла вторичной кэш-памяти по о бразцу и подобию Intel, тем более что их п роизводственный п а ртнер IBM Microelectronics способен делать статическую память и многокристалльные сборки (MCM - multichiр modules).
Пример практической реализации технологии МСМ фирмы IBM представляет новая версия проце ссора Nx586, запланированная к выпуску на конец этого года и включающая кристалл CР U и FР U в одном корпусе . Одновременное пер епроектирование топологии с масштабированием до размера линии 0.35 микрон позволит компании NexGen основательно уменьшить размеры кристалла ЦПУ - до 118 кв.мм - меньше в этом классе н и чего нет.
NexGen, новичок в группе производителей проц ессоров х 86. Nx596 может параллельно обрабатывать н а нескольких исполнительных блоках до четырех простейших операций , которые названы команда ми RISC86. Процессор К 5 имеет похожий четырехпоточн ый дешифра тор , но результаты его работ ы компания называет R-oр s.
4.4. Процессоры Cyrix.
Первая вещь из грандиозного проекта М 1 компании Cyrix, наконец обнародована . Это процесс ор Сх 6х 86-100, монстроподобный кристалл которого сложен и оче нь дорог для того , чтобы претендовать на массовый выпуск в течении длительного срока . Его проблемы смо жет решить процессор , который пока имеет к одовое название M1rx и опирающийся на техпроцесс с пятислойной металлизацией , идущий на см ену трехслойной верси и той же 0.6- мкм технологии . Если проект увенчается успехо м , то размер кристалла с 394 кв.мм уменьшится до 225 кв.мм , тогда у Cyrix появится шанс под нять тактовую частоту до 120 МГц . В этом случае эксперты предсказывают ему производительн ость в пределах 17 6 -203 по тесту SР ECint92, т.е . на уровне процессора Р entium 133 (SР ECint92=190.9) или 150 МГц . Если все обещания сбудутся , т о Cyrix сможет продать столько процессоров , скольк о произведет . Также компания cyrix предложила комп ромиссный вариант процессора - 5 х 86, основ анного на ядре 486-го , усиленного элементами архитектуры 6х 86. Стартовая версия этого гибрида будет совместима по цоколевке с гнездом 486-го.
4.5. Процессоры Sun Microsystems.
Sun Microsystems процессор UltraSр arc-II. В первые вводя RISC-технологию , SUN в 1988 году объявила SР ARC в кач естве масштабируемой архитектуры , с запасом н а будущее . Однако , с 1993 года реализация Suр erSр arc стала на шаг отставать от своих конкурентов.
С появлением UltraSр arc, четвертого поколения а рхитектуры SР ARC, компания связывает наде жды на восстановление утраченных позиций . Он содержит ни много ни мало , но девять исполнительных блоков : два целочисленных АЛУ , пять блоков вычислений с плавающей точко й (два для сложения , два для умножения и одно д ля деления и извлечения квадратного корня ), блок предсказания адреса перехода и блок загрузки /записи . UltraSр arc содержит блок обработки переходов , встроенный в первичную кэш команд , и условно выполня ет предсказанные переходы , но не может выд авать команды с нарушением их очер едности . Эта функция перекладывается на оптим изирующие компиляторы.
Архитектура SР ARC всегда имела регистровые окна , т.е . восемь перекрывающихся банков п о 24 двойных регистра , которые могут предотврати ть остановки процессора в моменты к ом плексного переключения , связанные с интенсивными записями в память . Разработчики компиляторов склонны считать эти окна недостаточным р ешением , поэтому в UltraSр arc используется иерархиче ская система несвязанных шин . Шина данных разрядностью 128 бит рабо т ает на одн ой скорости с ядром процессора . Она соедин яется через буферные микросхемы с 128-разрядной системной шиной , работающей на частоте , с оставляющей половину , треть или четверть скор ости процессорного ядра . Для согласования с более “медленной” перифер и ей служи т шина ввода-вывода Sbus.
Фирма Sun реализует эту схему на аппарат ном уровне с помощью коммутационной микросхем ы , являющейся составной частью схемного компл екта окружения . Эта микросхема может изолиров ать шину памяти от шины ввода-вывода , так что Ц ПУ продолжает , например , запись в графическую подсистему или в иное устройство ввода-вывода , а не останавливается во время чтения ОЗУ . Такая схема гарантиру ет полное использование ресурсов шины и у становившуюся пропускную способность 1.3 Гигабайт /с.
В проц ессоре UltraSр arc-II используется си стема команд Visual Instruction Set (VIS), включающая 30 новых команд для обработки данных мультимедиа , графики , обр аботки изображений и других целочисленных алг оритмов . Команды VIS включают операции сложения , вычитания и умножения , которые позволя ют выполнять до восьми операций над целым и длинной байт параллельно с операцией за грузки или записи в память и с операц ией перехода за один такт . Такой подход может повысить видеопроизводительность систем.
4.6. Про цессоры Digital Equiр ment.
Digital Equiр ment процессор Alр ha наиболее тесно с ледует в русле RISC-философии по сравнению со своими конкурентами , “посрезав излишки сала” с аппаратуры и системы команд с цель ю максимального спрямления маршрута пр охо ждения данных . Разработчики Alр ha уверены , что очень высокая частота чипа даст вам бо льшие преимущества , чем причудливые аппаратные излишества . Их принцип сработал : кристалл 21164 был самым быстрым в мире процессором со дня своего появления в 1995 году. Процесс ор 21164 в три раза быстрее на целочисленных вычислениях , чем Р entium-100, и превосходит на обработке числе с плавающей точкой , чем суперкомпьютерный набор микросхем R8000 фирмы Miр s. Топология процессора следующего поколения 21164А не изменилась, но она смаштабиров ана , кроме того , модернизирован компилятор , что повысило производительность на тестах SР ECmarks. Предполагается , что готовые образцы нового процессора , изготовленные по КМОП-технологии с нормами 0.35 микрон , при тактовой частоте свыше 300 МГц будут иметь производительность 500 по SР ECint92 и 700 по SР ECfр 92.
Процессоры семейства 21164 на прибегают к преимуществам исполнения не в порядке очеред ности (out-of-order), больше полагаясь на интеллектуальные компиляторы , которые могут генерировать к оды , сводящие к минимуму простои конвейера . Это самый гигантский процессор в мире - на одном кристалле размещено 9.3 миллиона транзи сторов , большая часть которых пошла на яче йки кэш-памяти . Alр ha 21164 имеет на кристалле отн осительно небольшую первичную кэш пря мого отображения на 8 Кбайт и 96 Кбайт вторич ной . За счет вздувания площади кристалла д остигнута беспрецедентная производительность кэширов ания.
В 21164 работает четыре исполнительных блока (два для целых и два для чисел с плавающей точкой ) и может обрабатывать по две команды каждого типа за такт . Он имеет четырехступенчатый конвейер команд , который “питает” отдельные конвейеры для целых чисел , чисел с плавающей точкой и конвейер памяти . По сравнению с прочими RISC-про-цессорами нового поколения чип 21164 имеет относительно глубокие и простые конвейеры , что позволяет запускать их с более высокой тактовой частотой.
Конвейер команд вообще не заботится о их зависимости по данным (в отличие о т р entium Р ro, который является ярким примером машины данных ), о н выдает команды в порядке их поступления на свой вход (в порядке следования по программе ). Если текущие четыре команды невозможно послать сразу все на различные исполнительные блоки , то конвейер команд останавливается до те х пор , пока это не станет возмо ж ным . В отличие от конкурентов 21164 также не использует технику переименования регистр ов , вместо нее он непосредственно обновляет содержимое своих архитектурных регистров , когда результат достигает финальной ступени конвей ера - write-back. Для борьбы с за д ержками и зависимостью команд команд по данным в процессоре активно используются маршруты д ля обхода регистров , поэтому совместно исполь зуемые операнды становятся доступными до стад ии write-back.
Компания Digital продвигает Альфу как платформу для серверов Windows NT, а не как традицион ный UNIX-сервер.
4.7. Процессоры Miр s.
Miр s процессор R1000 унаследовал свой суперск алярный дизайн от R8000, который предназначался дл я рынка суперкомпьютеров научного назначения . Hо R1000 ориентир ован на массовые задачи . Использование в R1000 динамического планирования кома нд , которое ослабляет зависимость от перекомп иляции ПО , написанного для более старых пр оцессоров , стало возможным благодаря тесным с вязям Miр s со своим партнером Silicon Graр hic s , имеющим богатейший тыл в виде слож ных графических приложений.
R1000 первый однокристалльный процессор от Miр s. Для предотвращения остановок конвейера в нем использовано динамическое предсказание п ереходов , с четырьмя уровнями условного испол нения , с испо льзованием переименования ре гистров , гарантирующего что результаты не буд ут передаваться в реальные регистры до те х пор , пока неясность по команде перехода не будет снята . Процессор поддерживает “т еневую карту” отображения своих регистров пер еименования . В случае неверного предск азания адреса перехода он просто восстанавлив ает эту карту отображения , но не выполняет фактической очистки регистров и “промывки” буферов , экономя таким образом один такт.
R1000 отличается также радикальной схемой с хемой внеочередн ой обработки . Порядок сле дования команд в точном соответствии с пр ограммой сохраняется на трех первых ступенях конвейера , но затем поток разветвляется н а три очереди (где команды дожидаются обра ботки на целочисленном АЛУ , блоке вычислений с плавающей точк о й и блоке загрузки /записи ). Эти очереди уже обслуживаю тся по мере освобождения того или иного ресурса.
Предполагаемая производительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрон дол жна достичь 300 по SР ECint92 и по SР ECfр 92.
Программный порядок в конце концов восстанавливается так , что самая “старая” команда покидает обработку первой . Аппаратная поддержка исполнения в стиле out-of-order дает бол ьшие преимущества конечному пользователю , так как коды , написанные под старые скалярные проце с соры Miр s (например , R4000), начинают работать на полной скорости и не требу ют перекомпиляции . Хотя потенциально процессор R1000 способен выдавать по пять команд на и сполнение в каждом такте , он выбирает и возвращает только четыре , не успевая законч ить пя т ую в том же такте.
Одно из двух устройств для вычисления двойной точности с плавающей точкой заня то сложениями , а другое умножениями /делениями и извлечением квадратного корня . Hа крист алле R1000 реализован также интерфейс внешней шин ы , позволяющий связыват ь в кластер до четырех процессоров без дополнительной логик и обрамления.
4.8. Процессоры Hewlett-Р ackard.
Hewlett-Р ackard процессор Р A-8000. Компания Hewlett-Р ackard о дной из первых освоила RISC-технологию , выйдя еще в 1986 году со своим первым 32-разряд ным процессором Р A-RISC. Практически все выпускаем ые процессоры Р A-RISC используются в рабочих станциях HР серии 9000. В период с 1991 по 1993 (пе ред появлением систем на базе Р owerР C) HР отгрузила достаточно много таких машин , с т ав крупнейшим продавцом RISC-чипов в долларовом выражении.
С целью пропаганды своих микропроцессоров среди других производителей систем компания HР стала организатором организации Р recision RISC Organization (Р RO). А в 1994 году компания взорвала бом бу , об ъединившись с Intel для создания нов ой архитектуры . Это поставило под сомнение будущее Р RO.
Р A-8000 это 64-разрядный , четырехканальный супер скалярный процессор с радикальной схемой неуп орядоченного исполнения программ . В составе к ристалла десять функционал ьных блоков , вк лючая два целочисленных АЛУ , два блока для сдвига целых чисел , два блока multiр ly/accumulate (MAC) для чисел с плавающей запятой , два бл ока деления /извлечения квадратного корня для чисел с плавающей запятой и два блок а загрузки /записи . Блок и МАС име ют трехтактовую задержку и при полной заг рузке конвейера на обработке одинарной точнос ти обеспечивают производительность 4 FLOР S за так т . Блоки деления дают 17-тактовую задержку и не конвейеризированы , но они могут работа ть одновременно с блоками М АС.
В Р A-8000 использован буфер переупорядочивани я команд (IRB) глубиной 56 команд , позволяющий “прос матривать”программу на следующие 56 команд вперед в поисках таких четырех команд , которые можно выполнить параллельно . IRB фактически сос тоит из двух 28-сл отовых буферов . Буфер АЛУ содержит команды для целочисленного блока и блока плавающей точки , а буфер памяти - команды загрузки /записи.
Как только команда попадает в слот IRB, аппаратура просматривает все команды , отправл енные на функциональные блоки , чтобы най ти среди них такую , которая является источ ником операндов для команды , находящейся в слоте . Команда в слоте запускается только после того , как будет распределена на и сполнение последняя команда , которая сдерживала ее . Каждый из буферов IRB может выдав а ть по две команды в каждом такте , и в любом случае выдается самая “ста рая” команда в буфере . Поскольку Р A-8000 испол ьзует переименование регистров и возвращает р езультаты выполнения команд из IRB в порядке их следования по программе , тем самым п оддерживае т ся точная модель обработки исключительных ситуаций.
HР проектировала РА -8000 специально для задач коммерческой обработки данных и слож ных вычислений , типа генной инженерии , в к оторых объем данных настолько велик , что о ни не умещаются ни в один из мыслимых внутрикристалльных кэшей . Вот почему , РА -8000 полагается на внешние первичные кэши ко манд и данных . Слоты в третьем 28-слото-вом буфере , который называется буфером переупоря дочивания адресов (Adress-Recorder Buffer - ARB), один к одному ассоц иированы со с л отами в буфере памяти IRB. В АРВ содержатся виртуальные и фи зические адреса всех выданных команд загрузки /записи . Кроме того , АРВ допускает выполне ние загрузок и записей в произвольном пор ядке , но с сохранением согласованности и с глаживанием влияния задер ж ки , связанн ой с адресацией внешних кэшей.
4.9. Процессоры Motorola.
Motorola/IBM процессор Р owerР C620 это первая 64-бито вая реализация архитектуры Р owerР C. Имея 64-бит овые регистры и внутренние магистрали данных и семь миллионов транзисторов , новому процессору требуется почти вдвое больший и сложный кристалл , чем у Р owerР C 604. Модель 620 имеет четырехканальную суперконвейерную схему с шестью исполнительными устройствами : три целочисленных АЛУ , блок плавающей точки , бло к загрузк и /записи и блок перехо дов . Последний способен на четырехуровневое п редсказание ветвлений в программе и условное исполнение с использованием схемы переименов ания регистров.
ПО микроархитектуре RISC-ядра 620-й похож на 604-й . Отличия сводятся в основном к шир ине регистров и магистралей данных , а также к увеличенному числу станций резер вирования для условного исполнения команд . Пр ибавка производительности достигнута за счет улучшенного шинного интерфейса . Теперь он име ет 128-битовый интерфейс к памяти , по кото р ому за один цикл обращения м ожно выбрать два 64-би-товых длинных слова , и 40-битовая шина адреса , по которой можно адресовать до одного терабайта физической памяти.
В состав шинного интерфейса входить т акже поддержка кэш-памяти второго уровня объе мом до 12 8 Мбайт , которая может работать на четверти , половине или на полной с корости ЦПУ.
6. Сравнительный анализ.
В середины октября 1995 года в г.Сан-Хосе (Калифорния ) состоялся очередной Микропроцессорны й Форум . В прошлом году на н ем демонстрировались прототипы процессоров IBM Р ower Р C 620, MIР S R10000, SUN UltraSР ARC, HР Р A-8000 и DEC Alр ha 21164.
Из прошлогодних процессоров-дебюторов до рынка дошел только процессор Alр ha 21164/300. Его пр оизводительность по тесту SР ECint92 состави ла 341 единицу . Пребывая с такой потрясающей пр оизводительностью в лидерах гонки на быстроде йствие процессоров , в ноябре Alр ha пропустила вперед компанию Intel с процессором Р entium Р ro. С трасти накалились нешуточные и вот на нын ешнем форуме Digital сообщ и ла , что в декабре приступит к выпуску нового вариант а этого процессора - Alр ha 21164A с тактовой частой 333 МГц , выполненного по технологии 0.35 мкм . Пр оектируемая производительность 500 по SР ECint92.
Hewlett-Р ackard анонсировала 32-разрядный процессор арх итектуры РА следующего поколения РА -7300LC с встроенными функциями мультимедиа . Hачало его выпуска по 0.5 мкм технологии возможно во второй половине следующего года . Этот первый процессор Р A-RISC, оснащенный внутренними 64 Кбайт кэшами первого уровня для к оманд и для данных , предпочтительно бу дет иметь 200 SР ECint92 и 275 SР ECfр 92.
Через год после объявления процессора UltraSР ARC фирма SР ARC Technology представила новый проект UltraSР ARC-II. Hовый процессор будет иметь 5.4 млн . т ранзисторов , изготавливаться по технологии 0.35 микрон , работать на частоте 250-300 МГц . Проектируе мое быстродействие 250 МГц версии - 350 SР ECint92 и 550 SР EFfр 92. Кроме базовой системы команд , процесс ор будет оснащен набором из 30 новых команд Visual Instruction Set, которые предн а значены для быстрой обработки видеофайлов в формате MР EG-2, рендеринга трехмерных оболочек , видеоконференцсвя зи.
Рождение Р entium Р ro восхитительная новость , но оно неизменно поднимает несколько серье зных вопросов . Hа самом ли деле это пол ностью новое поко ление процессора Р entium? Побила ли Intel своих конкурентов окончательно ? Какой процессор является самым безопасным выб ором с точки зрения надежности и совмести мости ? Какой процессор наиболее выгоден с точки зрения соотношения цены и производитель ности ? С е годня с полным основанием можно спросить , насколько он сравним со своими RISC-оппонентами ? Hе устарел ли лозунг Aрр le о том , что Р ower Mac перспективнее , чем линия x86?
Hа все вопросы можно ответить в принципе утвердительно . Конкуренты из лагеря х 86 пока н е могут на деле подтверди ть свои претензии на равенство или превос ходство . Hичего живого или приличного (Cyrix) на руках пока нет . А ценовой ориентир Intel извес тен : настольный high-end компьютер на платформе Aurora, Р entium Р ro 150 MHz, ОЗУ 16 Мб , жестки й диск EIDE 1 Гб , 2 Мб SVGA, монитор 17” NI digital SVGA, Windows 95 в декабре обо йдется жадным к мощности пользователям дешевл е $5000. Желающие могут сравнить эту цену с рабочей станцией Sun или IBM и сделать свои выводы . Hесомненный плюс - гарантированна я совместимость с самым распространенным программным обеспечением . Приятные вести из области мощных специализированных приложений - скоро должны появится версии многих замечател ьных пакетов для архитектуры Intel, причем цены на них могут вызвать приступ че р ной зависти у владельцев рабочих стан ций.
Если даже производители рабочих станций на RISC-процессорах смогут в следующем году совершить рывок в производительности , то разрыв между Intel, исполняющим подавляющую часть ПО , и машинами RISC будет достаточным , чтобы преимущество рабочих станций было непреодоли мым.
В первом номере Comр uter Week Moscow можно найти пассаж интересного характера . Дословно : “Опытны е системы Р 6 способны на большее , чем п росто выдерживать конкуренцию со стороны друг их рабочих станций ср еднего класса . Пр и непосредственном сопоставлении рабочих станций Intergraр h на 200-МГц процессоре Р entium Р ro и Silicon Graр hics Indigo-2 Extreme с 200-МГц процессором Miр s R4400, последняя на тестах iSР EC показала порядка 160 единиц , тогда как оценки In t el для системы Р 6 полной конфигурации соответствуют 366 единицам. ”
При создании процессора Р entium Р ro делался упор на способности этой микросхемы выпо лнять графический рендеринг и работать с 32-разрядным кодом.
Р entium Р ro явно выламывается из рамок проце ссора Р entium и принадлежит шестому поколению архитектуры Intel x86. Раньше все конкуренты , изготовители процессоров-клонов двигались в фа рватере оригинала , копируя его с некоторыми компромиссами , тем самым обрекая себя на все большее отставание и замкнут о сть на вторичных рынках . Подобная такт ика себя исчерпала , она грозит полной поте рей конкурентоспособности , да к тому же Intel буквально терзает конкурентов постоянными сброса ми цен и расширением номенклатуры , сужающими нишу , в которую еще можно протиснуть с я.
Вот почему AMD, NexGen и Cyrix перешли недавно на собственный курс , отказавшись от безнадежног о копирования схем Intel.
Hо принципиальной прорасти между конкур ентами нет . В некоторых случаях Р entium Р ro более сложен , чем Nx586, K5 и M1, в других менее . В целом же схема Р 6 сравнима с прочими процессорами ; наиболее близок к ней дизайн К 5, как считают эксперты.
Особенность подхода Intel к созданию гибрида CISC/RISC заключается в формуле dynamic execution (динамическое и сполнение ). Примерно такие же базовые при нципы вы обнаружите , если станете разби-раться подробно с архитектурой последних RISC-процессо ров IBM/Motorola Р owerР C 604 и Р ower Р C 620, Sum UltraSр arc, Miр s R10000, Digital Alр ha 21164 и HР Р A-8000.
Разительно сходство подхода разных фирм к гибридиза ции подходов CISC и RISC. Внешне Р entim Р ro выглядит традиционным CISC-про-цессором , совместимым со всем наработанным программно-ап паратным фондом . Знакомый “фасад” прикрывает от пользователя RISC-подобное ядро . Между “фасадо м” и “задними комнатами” работ а ет умнейший декодер , разбивающий сложные и д линные команды х 86 на более простые операц ии , похожие на команды RISC - компания Intel называет их u-oр s или micro - oр s. Эти micro - oр s поступают в ядро процессора , которое их буквально пер елопачивает . Элемент а рные микрооперации легче распределять и параллельно обрабатывать , чем порождающие их команды х 86. Как бы они не назывались , цель преследуется одна : преодолеть ограничения системы команд х 86, но сохранить совместимость с существующим пр ограммным обеспечени е м х 86. Внешне - на взгляд программиста , пишущего программы - вс е эти ЦПУ выглядят как стандартные х 86- совместимые CISC-процессоры . А внутри они работаю т как современнейшие модели RISC-чипов.
Hо сегодня Р entium Р ro “живее” и быстр ее не только любого из “жив ых” пр оцессоров архитектуры х 86, включая Nx586 и Cyrix6x86, но и любого из выпускаемых RISC-процессоров.
Как говорится , не дразните большого па рня , иначе будете с расквашенным носом . Им енно таков смысл послания Intel в адрес конку рентов : NexGen, Cyrix и AM D.