Пентиум 5. Какой он был Pentium (6 фото)

За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.

Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).

  • . Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
  • Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
  • Системная шина. В Pentium 4 используется совершенно новая 128-битная с двумя 64-битными линиями. Частота новой шины() составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
  • Арифметико-логическое устройство ( или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
  • первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
  • Математический (). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 . К примеру, в процессорах используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
  • SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

В целом, архитектура была нацелена для работы на высоких частотах, где в полную силу смог бы заработать длинный конвейер.

Willamette

Впервые это ядро «засветилось» в роадмэпе () Intel еще в 1998 году. Предполагалось, что оно должно прийти на смену и покорить частоту 1 ГГц. Но процессоры на этом ядре были анонсированы только в 2000 году как Pentium 4. Выпущенные года, процессоры устанавливались в разъём Socket 423 и выпускались в корпусе тип FC-PGA2. Процессоры для Socket 423 не пользовались популярностью, так как Intel сразу заявила, что этот разъем является переходным, кроме того системы на базе Pentium 4 стоили очень дорого (сами процессоры в момент анонса стоили $644 и $819 за Pentium 4 1,4 и 1,5 ГГц соответственно). Так как процессор изготавливался с использованием 180 нм техпроцесса, то на кристалле удалось разместить лишь 256 Кбайт кэша L2. Большинство экспертов расценило 1,4 и 1,5 ГГц версии промежуточными - процессор Athlon набирал всё большую популярность, и превосходил по быстродействию Pentium III, а дальнейшее усовершенствование архитектуры Pentium III тогда было ещё не возможно. Терять свою долю рынка Intel не была намерена, поэтому она и выпустила эти процессоры («сырая» технология производства не позволила тогда выпустить более быстрые модели). Несмотря на непопулярность 1,4 и 1,5 ГГц версий, Intel года анонсирует 1,3 ГГц версию Pentium 4, которая стоила $409. В различных тестовых испытаниях эти процессоры проигрывали как Pentium III, так и Athlon`ам (а в некоторых случаях и `ам), работавшим на более низких частотах. Однако уже в апреле 2001 года выходит Pentium 4 с частотой 1,7 ГГц, а в августе этого года выходит 2 ГГц версия, а так же «новые-старые» процессоры для Socket 478, который просуществовал более чем 2 года, в этом же месяце выходит новый чипсет от Intel (i845). Новый чипсет теперь поддерживал память стандарта PC133 SDRAM, что позволило значительно снизить цены на системы на базе Intel Pentium 4, однако использование данного типа памяти несколько уменьшало быстродействие (иногда весьма существенно) системы. Intel для увеличения продаж активно продвигала данный процессор - его рекламу можно было увидеть как по телевизору, так и в газетах/журналах. Продажи Pentium 4 увеличивались, процессор начинал пользоваться всё большей популярностью. Вскоре многие производители системной логики представили свои чипсеты для Pentium 4 с поддержкой памяти , а в начале года Intel выпускает свои чипсеты с поддержкой данного типа памяти. Процессор начинает замещать собой Pentium III, а по производительности он фактически сравнялся с Athlon`ом. Intel, державшая пальму первенстве в течение 16 лет, а затем довольно быстро потерявшая её, сейчас вновь начинает отвоёвывать своё. А начавшиеся проблемы с отсутствием производственных мощностей у AMD и выпуск Pentium 4 на ядре Northwood закрепили лидирующие позиции Intel, правда, ненадолго.

Процессоры Pentium 4 на ядре Willamette
Тактовая частота ядра (ГГц) Дата анонса процессора для Socket 423 Дата анонса процессора для Socket 478 Начальная стоимость процессора ($)
1,3 3 января 2001 409 - ?
1,4 20 ноября 2000 644 27 сентября 2001
1,5 819 27 августа 2001
1,6 2 июля 2001 294
1,7 23 апреля 2001 352
1,8 2 июля 2001 562
1,9 27 августа 2001 375 375
2,0 562 562

Northwood

Первые процессоры на данном ядре анонсированы года. Ядро мало чем отличается от своего предшественника, разве что использованием более совершенного тех процесса - 130 нм, что позволило разместить на кристалле 512Кб кэша L2 и снизить тепловыделение процессора. Переход на новый техпроцесс позволил ещё больше наращивать тактовую частоту (до 3,4ГГц). Чтобы отличать процессоры на ядре Northwood от аналогичных моделей на ядре Willamette, было решено в конце названия новых процессоров приписывать букву «A» (например Pentium 4 2,0A построен на ядре Northwood).

Prescott

Mobile Pentium 4

Первые версии Pentium 4 для ноутбуков и лэптопов были анонсированы года, были построены на ядре Northwood и носили имя Mobile Pentium 4-M. От настольных версий эти процессоры отличались заниженным напряжением питания (1,2-1,3 В) и поддержкой технологии . Частота системной шины у всех процессоров составляла 400 МГц. Были выпущены модели с частотами 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0; 2,2; 2,4; 2,5; 2,6, TDP у последней модели составляет 35 Вт.

Prescott 2M

Первые слухи о новом ядре Prescott 2 появились в начале 2005 года. Предполагалось, что оно будет иметь 2 Мбайт кэша L2 и частоту FSB равную 266 МГц (эффективная частота 1066 МГц). Процессоры на основе этого ядра были анонсированы . От ядра Prescott это ядро отличается только наличием 2 Мбайт кэш-памяти L2. Новые процессоры получили и новую маркировку: 6x0. 21 февраля 2005 года были анонсированы модели Pentium 4 630, 640, 650, 660 с частотами 3,0; 3,2; 3,4; 3,6 ГГц, позднее была представлена модель 670, работающая на частоте 3,8 ГГц.

Cedar Mill

Анонс процессоров, построенных на новом ядре, запланирован на вторую половину января . Ядро Cedar Mill представляет собой одноядерную модификацию ядра известного под кодовым именем . Cedar Mill изготовлен с использованием новейшей 65 нм технологии. По сути, ядро представляет собой ядро Prescott 2M, даже не изменилась серия процессора, процессоры без поддержки технологии виртуализации Vanderpool имеют маркировку вида 6x1, с поддержкой Vanderpool имеют маркировку вида 6x3. Процессоры первоначально будут иметь частоту от 3,0 ГГц до 3,8 ГГц. Более подробно о причине выхода Cedar Mill рекомендуется читать здесь .

Ядро Cedar Mill является последним в линейке Pentium 4. Следующие поколения процессоров, в частности Conroe, будут продвигаться под новым брэндом, название которого, пока, не анонсировано.

Tejas, Jayhawk и другие

Intel возлагала на архитектуру NetBurst большие надежды. В 2001-2003 в роадмэпах Intel встречались такие ядра, как Tejas, который должен был использовать шину 1066 МГц и работать на частотах от 4,4 до 9,2 ГГц и должен был бы быть поступить в продажу во второй половине 2004 года и называться Pentium 6. Nehalem, как предполагалось, этот процессор должен был использовать системную шину 1200 МГц и работать на частотах свыше 10 ГГц, и должен был поступить в продажу в 2005 году. Jayhawk, процессор серии Xeon, который должен был иметь кэш L1 для данных объемом 24 Кб и для 16 тысяч микроопераций. Однако все эти процессоры в 2004 году были отменены.

Intel предполагала с помощью процессоров основанных на архитектуре NetBurst достичь частоты в 10ГГц, но, не дойдя и до 4 ГГц, эта архитектура столкнулась с неразрешимыми до сих пор (и похоже уже никогда) тепловыми проблемами. Данная проблема подтолкнула Intel к разработке новой архитектуры и к закрытию всех проектов по разработке ядер на архитектуре NetBurst.

Взглянув назад, Pentium 4 оставляет двойственное впечатление. С одной стороны это был одни из самых популярных процессоров, его продвижение в , и, как следствие, огромная популярность в народе, позволили Intel надолго занять большую часть рынка. С другой стороны Pentium 4 имел не самую удачную архитектуру. Он так ни разу и не закрепил своё лидирующее положение в плане производительности, по уровню TDP (тепловыделение) он практически всегда проигрывал конкурентным процессорам AMD Athlon, впрочем также, как и по стоимости. А архитектура Pentium III, которую когда-то Intel посчитала менее перспективной, чем NetBurst вновь появилась в процессорах .

Технические характеристики различных ядер

Данные относящиеся ко всем моделям

  • Разрядность : 32
  • Разрядность внешней шины: 128

Willamette

  • Дата анонса первой модели: 20 ноября 2000 года
  • Тактовые частоты (ГГц): 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9; 2,0
  • Эффективная частота системной шины (FSB) (МГц): 400
  • Размер кэша L2(Кбайт): 256
  • Напряжение питания: 1,7 В или 1,75 В
  • Количество транзисторов (млн.): 42
  • Площадь кристалла (кв. мм): 217
  • Максимальное TDP (расчетное тепловыделение): 75,3 Вт
  • Техпроцесс (нм): 180
  • Разъём: Socket 423, позже Socket 478
  • Корпус: 423-контактный FC-PGA2 или 478-контактный mPGA
  • Поддерживаемые технологии: IA32, SSE2

Northwood

  • Дата анонса первой модели: 7 августа 2001 года
    • Процессоры с частотой FSB равной 400МГц: 1,6; 1,8; 2,0; 2,2; 2,4; 2,5; 2,6; 2,8
    • Процессоры с частотой FSB равной 533МГц: 2,26; 2,4; 2,53; 2,67; 2,8; 3,06
    • Процессоры с частотой FSB равной 800МГц: 2,4; 2,6; 2,8; 3,0; 3,2; 3,4
  • Эффективная частота системной шины (FSB) (МГц): 400, 533, 800
  • Размер кэша L1: 8Кбайт (для данных)+12 тысяч операций
  • Размер кэша L2(Кбайт): 512
  • Напряжение питания: 1,475-1,55 (в зависимости от модели)
  • Количество транзисторов (млн.): 55
  • Площадь кристалла (кв. мм): 146, позже 131
  • Максимальное TDP (расчетное тепловыделение): 89 Вт
  • Техпроцесс (нм): 130
  • Разъём: Socket 478
  • Корпус: 478-контактный mPGA
  • Поддерживаемые технологии: IA32, MMX, SSE, SSE2, HT (не все модели)

Уже послужило предвестником близости анонса семейства Pentium 4 5x1, которое предложило бы поддержку EM64T всем владельцам материнских плат с разъёмом LGA 775 по разумным ценам. Чуть позднее представители Intel признались, что в действительности процессоры семейства Pentium 4 3.xF полностью сниматься с производства не будут - их просто переименуют, снабдят новой упаковкой, и выпустят на рынок под лейблом "Pentium 4 5x1". Разумное решение, позволяющее положить конец некоторой путанице в ассортименте процессоров Intel.

Чуть позже ряд сайтов распространил заявление источников, близких к Intel, указывающее на возможность существования процессоров серии Pentium 4 5x0 до тех пор, пока не истощатся складские запасы. Постепенно эти процессоры будут заменяться на модели серии Pentium 4 5x1 с поддержкой EM64T. Другими словами, пышных церемоний, приуроченных к выходу процессоров Prescott с поддержкой EM64T на потребительский рынок, мы не увидим. Замена произойдёт в рабочем порядке.

Наконец, на этой неделе сайт Intel пополнился двумя документами, раскрывающими правду о сроках миграции Pentium 4 5xx на степпинг с поддержкой EM64T. Следует сразу отметить, что как таковой смены степпинга не произойдёт. Хотя Intel сообщает, что поддержку EM64T получат только процессоры в коробочном исполнении на степпинге E0 , в списках модернизируемых моделей большинство процессоров основано на степпинге D0.

Вот список маркировок замещаемых и новых процессоров:

  • Pentium 4 570J (3.8 ГГц, SL82U , степпинг E0) -> Pentium 4 571 (3.8 ГГц, SL8J7 , степпинг E0?);
  • Pentium 4 560 (3.6 ГГц, SL7J9 , степпинг D0) -> Pentium 4 561 (3.6 ГГц, SL8J6 , степпинг E0?);
  • Pentium 4 550 (3.4 ГГц, SL7J8 , степпинг D0) -> Pentium 4 551 (3.4 ГГц, SL8J5 , степпинг E0?);
  • Pentium 4 540 (3.2 ГГц, SL7J7 , степпинг D0) -> Pentium 4 541 (3.2 ГГц, SL8J2 , степпинг E0?);
  • Pentium 4 530 (3.0 ГГц, SL7J6 , степпинг D0) -> Pentium 4 531 (3.0 ГГц, SL8HZ , степпинг E0?);
  • Pentium 4 520 (2.8 ГГц, SL7J5 , степпинг D0) -> Pentium 4 521 (2.8 ГГц, SL8HX , степпинг E0?);
  • Pentium 4 505 (2.66 ГГц, SL7YU , степпинг D0) -> Pentium 4 506 (2.66 ГГц, SL8J8 , степпинг E0?).

Заметим, что в этом перечне нет маркировок процессоров серии Pentium 4 3.xF. Это может означать, что процессоры просто не будут менять степпинг. Для желающих процессоры Pentium 4 3.xF будут поставляться до 25 ноября этого года, однако сменить название на Pentium 4 5x1 они могут ещё раньше. Это может означать, что всё семейство Pentium 4 5xx, включая версии с поддержкой EM64T, будет упразднено осенью 2005 года. В принципе, о подобных намерениях Intel многие источники уже заявляли, так что удивляться не стоит.

Для конечного потребителя важнее другое - процессоры Pentium 4 5x1 могут быть основаны и на степпинге D0, не обеспечивающем поддержку технологий XD, C1E и TM2. Конечно, не самая страшная потеря, но для разгона степпинг E0 бы предпочтительнее. Судя по всему, все перечисленные в правой части списка процессоры серии Pentium 4 5x1 будут основаны на степпинге E0. Принадлежность к этому семейству будет автоматически гарантировать принадлежность к степпингу E0, за редким исключением "переодетых" Pentium 4 3.xF, которые в будущем всё равно уступят место представителям степпинга E0.

Во втором полугодии все процессоры серии Pentium 4 5x1 будут переведены на степпинг E0. Оверклокерам при выборе процессора такое качество очень пригодится. Непосредственно процессоры Pentium 4 5x0 в чистом виде существовать перестанут. Intel постарается быстро снять с производства процессоры Prescott с 1 Мб кэша второго уровня, так как приоритетным направлением развития станет расширение присутствия на рынке семейства Pentium 4 6xx. Для этого процессоры Pentium 4 5xx в третьем квартале будут подвергнуты сокращению, а в 2006 году семейство Pentium 4 6xx перейдёт на более холодное и рентабельное 0.065 мкм ядро Presler.

Кроме того, в августе цены на процессоры Pentium 4 6xx должны быть сильно снижены, что позволить минимизировать разницу в стоимости между Pentium 4 6xx и Pentium 4 5x1. Кстати, некоторые источники считают, что масштабное снижение цен на продукцию Intel произойдёт уже 30 июня. Подешевеют ли в этот день процессоры, не уточняется.

Самый последний процессор в списке, получающий после обновления функциональности имя "Pentium 4 506", ранее нигде не упоминался. Точнее говоря, мы хорошо знали его предшественника по имени "Pentium 4 505", который работал на частоте 2.66 ГГц, имел исполнение LGA 775 и оснащался 1 Мб кэша второго уровня. Кроме того, частота шины 533 МГц и сопутствующий ей высокий множитель позволяли процессору неплохо разгоняться . Сей факт даже помог растопить скептическое сердце нашего Doors4ever , который стал лучше относиться к материнским платам на чипсете i915P:).

Поскольку процессор Pentium 4 505 (2.66 ГГц) на рынке существовал совершенно легально, и со временем даже облачился в коробку , а также перешёл на степпинг E0 , то и его поддержкой EM64T одарить Intel тоже решила. В конце концов, для OEM-решений такой недорогой процессор с поддержкой 64-битных расширений всегда пригодится. К сожалению, о судьбе процессоров Pentium 4 510 (2.8A) и Pentium 4 515 (2.93 ГГц) в этом плане ничего не сообщается.

Более того, если все процессоры серии Pentium 4 5x1 с 800 МГц шиной должны поступить в магазины только после 10 июня, то Pentium 4 506 (2.66 ГГц) может появиться уже 27 мая этого года.

Стоит также отметить, что Intel решила облегчить жизнь охотнику за процессорами степпинга E0 ещё одной эффективной мерой. Отныне номер модели процессора будет наноситься прямо на крышку теплораспределителя. Например, для модели с частотой 3.8 ГГц схема изменений будет выглядеть следующим образом:

Хотя для процессора с частотой 3.8 ГГц вопрос принадлежности к степпингу E0 никогда не возникал (он может быть основан только на этом степпинге), для прочих моделей наличие "processor number" вида 5x1 на крышке процессора может стать тем отличительным признаком, по которому покупатель сможет вычислить экземпляр на степпинге E0. Даже без необходимости зазубривать маркировки:). Впрочем, часть процессоров этой серии может сохранить приверженность степпингу D0, но их доля будет очень мала.

В отношении семейства Celeron D 3xx о подобных мерах модернизации пока ничего официально не сообщается. Надеемся, что поддержку EM64T данные процессоры обретут в течение этого квартала, благо мы только подбираемся к его середине.

Pentium I
В конце 1991 года, когда была завершен макет процессора, инженеры смогли запустить на нем программное обеспечение. Проектировщики начали изучать под микроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы.

Проектирование в основном было завершено в феврале 1992 года. Началось всеобъемлющее тестирование опытной партии процессоров, в течение которого испытаниям подвергались все блоки и узлы. В апреле 1992 года было принято решение, что пора начинать промышленное освоение Pentium процессора. В качестве основной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионов транзисторов были окончательно перенесены на шаблоны. Началось промышленное освоение производства и доводка технических характеристик, завершившиеся через 10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.
Объединяя более, чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66 МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Pentium в состоянии выполнять огромное количество PC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор. Кроме существующих наработок программного обеспечения, высокопроизводительный арифметический блок с плавающей запятой Pentium процессора обеспечивает увеличение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций.
Многочисленные нововведения - характернаяособенность
Pentium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает:- Суперскалярную архитектуру;
- Раздельное кэширование программного кода и данных;
- Блок предсказания правильного адреса перехода;
- Высокопроизводительный блок вычислений с плавающей запятой;
- Расширенную 64-битовую шину данных;
- Поддержку многопроцессорного режима работы;
- Средства задания размера страницы памяти;
- Средства обнаружения ошибок и функциональной избыточности;
- Управление производительностью;
- Наращиваемость с помощью Intel OverDrive процессора. Cуперскалярная архитектура Pentium процессора представляет
собой совместимую только с Intel двухконвейерную индустриальную архитектуру, позволяющую процессору достигать новых уровней производительности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропроцессорную архитектуру, которая содержит более одного вычислительного блока. Эти вычислительные блоки, или конвейеры, являются узлами, где происходят все основные процессы обработки данных и команд.
Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы Intel. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы Intel требовали множество циклов тактовой частоты для выполнения одной команды.
Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Pentium процессор имеет два конвейера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвейером, двойной конвейер Pentium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование (декодирование команды), второе декодирование (генерация адреса), выполнение и обратная выгрузка.
В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.
Другое важнейшее революционное усовершенствование, реализованное в Pentium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.
Проектировщики фирмы Intel обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Pentium процессора (для сравнения, Intel486 содержит 1.2 миллиона транзисторов) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из КЭШа команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного КЭШа - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвейерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного машинного цикла. После того, как данные достаются из КЭШа, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менее, Pentium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.
Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI (модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования. Эти решения увеличивают производительность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.
Блок предсказания правильного адреса перехода - это следующее великолепное решение для вычислений, увеличивающее производительность посредством полного заполнения конвейеров командами, основанное на предварительном определении правильного набора команд, которые должны быть выполнены.
Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции. Четырехтактовые конвейерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.
В результате этих инноваций, Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-графика.
Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.
Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширенная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.
Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим управления системой (SMM), подобный режиму архитектуры Intel SL.
Вместе со всем, что сделано нового для 32-битовой микропроцессорной архитектуры фирмы Intel, Pentium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы Intel. Эти нововведения защищают инвестиции пользователей посредством наращивания производительности, которая помогает поддерживать уровень продуктивности систем, основанных на архитектуре процессоров фирмы Intel, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталляции средства однокристального наращивания производительности. Например, первое средство наращивания - это OverDrive процессор, разработанный для процессоров Intel486 SX и Intel486 DX, использующий технологию простого удвоения тактовой частоты, использованную при разработке микропроцессоров Intel486 DX2.
Первые модели процессора Pentium работали на частоте 60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовой шине данных, работающей на полной скорости процессорного ядра. Hо если скорость процессора Pentium растет, то системному разработчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Pentium используют делитель частоты для синхронизации внешней шины с помощью меньшей частоты. Hапример, у 100 МГц процессора Pentium внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Pentium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы PCI.

Intel Pentium II (произносится: Интел Пентиум два) - процессор архитектуры x86, анонсированный 7 мая 1997 года. Ядро Pentium II представляет собой модифицированное ядро P6 (впервые использованное в процессорах Pentium Pro). Основными отличиями от предшественника являются увеличенный с 16 до 32 Кб кэш первого уровня и наличие блока SIMD-инструкций MMX (появившихся немногим ранее в Pentium MMX), повышена производительность при работе с 16-разрядными приложениями. В системах, построенных на базе процессора Pentium II, повсеместное применение нашли память SDRAM и шина AGP.

Процессор Pentium II представляет собой картридж SECC или SECC2 (отличающийся более простой конструкцией), содержащий процессорную плату («субстрат») с установленными на ней ядром процессора, микросхемами кэш-памяти BSRAM и tag-RAM. Кэш-память второго уровня работает на половине частоты ядра. Процессор предназначен для установки в 242-контактный щелевой разъём Slot 1.
Существует также вариант Pentium II OverDrive в корпусе PGA (устанавливается в гнездовой разъём Socket 8) с полноскоростным кэшем второго уровня, предназначенный для замены Pentium Pro.Первые процессоры Pentium II (Klamath) были предназначены для рынка настольных персональных компьютеров и производились по 350 нм техпроцессу. Дальнейшим развитием семейства десктопных Pentium II стало 250 нм ядро Deschutes. Через некоторое время вышли процессоры Mobile Pentium II, предназначенный для установки в ноутбуки, и Xeon, ориентированный на высокопроизводительные системы и серверы. На базе ядра Deschutes выпускались также процессоры Celeron (Covington), предназначенные для использования в недорогих компьютерах. Они представляли собой Pentium II, лишённый картриджа и кэша второго уровня.

Процессоры Pentium III с тактовыми частотами 766, 800, 850, 866 и 1 ГГц (1000 MГц) и выше, являлись самыми совершенными и наиболее мощными процессорами корпорации Intel (до выпуска процессоров Intel Pentium 4) для настольных ПК и обладали производительностью Internet-приложений следующего поколения, а также качеством, надежностью и совместимостью.
Процессор Pentium III идеально соответствует требованиям активных пользователей ПК, любителей компьютерных игр и Internet. Этот процессор полностью реализует мультимедийные возможности ПК, прежде всего, в области работы полноэкранного видео и высококачественной графики и восприятия Internet. В процессоре Pentium III воплощено все лучшее от процессоров Intel® и реализованы новейшие технологии. Среди них, в частности, 70 новых команд, обеспечивающих широкие возможности при работе с новым программным обеспечением и путешествиях по Internet.
Поставляемые версии процессоров имеют тактовую частоту системной шины либо 133 МГц, либо 100 МГц и поддерживают работу с чипсетами Intel R 840, 820, 815, 810e, 440GX и 440BX и их аналогами.
Процессоры Pentium III доступны в двух различных типах корпусов: Картридж с одним рядом контактов типа 2 (Single Edge Contact Cartridge 2 - S.E.C.C .2) и Корпус с перевернутым кристаллом и с матрицей штырьковых выводов (Flip-Chip Pin Grid Array - FC-PGA). Корпус FC-PGA разработан для нового поколения персональных компьютеров с низким профилем корпуса.
Pentium III процессор имеет два отдельных 16 КБ-х кэша первого уровня (L1), один для команд и один для данных. Кэш L1 обеспечивает быстрый доступ к недавно использованным данным, увеличивая общие эксплуатационные показатели системы. 256 КБ-й кэш второго уровня (L2) с улучшенной передачей данных (Advanced Transfer Cache-ATC). Кэш ATC содержит ряд микро архитектурных усовершенствований, для обеспечения более скоростного интерфейса между кэшем L2 и ядром процессора, и работает с частотой ядра процессора. Особенностью ATC является:
Не блокирующий, полно скоростной кэш второго уровня
Ассоциативность набора с 8 путями
256-разрядная шина данных
Интерфейс с уменьшенным временем ожидания по сравнению с дискретными кэшами

Pentium 4 (произносится: Пентиум четыре) - x86-совместимый процессор, разработанный Intel. Микроархитектура процессора была полностью изменена, по сравнению с предыдущими поколениями процессоров. Новая микроархитектура получила новое название - NetBurst. Оригинальный Pentium 4 носил кодовое имя «Willamette», работал на частотах 1,4 и 1,5 ГГц и был анонсирован 20 ноября 2000 года (изначально анонс был запланирован на октябрь, однако дата анонса была перенесена) и предназначался для установки в разъём Socket 423. Первые процессоры, основанные на новой архитектуре, вызвали множество нареканий. Во-первых - это производительность, производительность Pentium 4 была ниже чем у Pentium III, работающего на частоте в 1,5 раза меньшей. Во-вторых, для работы нового процессора требовалась материнская плата, основанная на чипсете i850, которая стоили весьма недёшево. В-третьих, все материнские платы предназначались для работы с дорогой памятью Rambus (RDRAM). В-четвертых, для работы материнской платы требовалась замена блока питания, а иногда и корпуса.
За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.
Процессор Pentium 4 построен на совершенной новой архитектуре - NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).
Конвейер. Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
Системная шина. В Pentium 4 используется совершенно новая 128-битная системная шина с двумя 64-битными линиями. Частота новой шины(FSB) составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB - Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
Арифметико-логическое устройство (АЛУ или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
Кэш-память первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
Математический Сопроцессор (FPU). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль - это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между регистрами и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 GFLOPS. К примеру, в процессорах Athlon используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).

Начиная с 1995 г. Intelприступила к выпуску серийногоCISC-процессораP6 шестого поколенияi 686 под торговой маркойPentiumProс напряжением питания около 3 В. Он содержит 5 500 тысяч транзисторов на кристалле и изготовлен по 0,35 мкм технологии в корпусе с 387 выводами. В создании этого процессора разработчики воспользовались всеми техническими решениями, ранее применяемыми в суперЭВМ. К таким решениям относятся включение в структуру процессора устройств динамического определения порядка выполнения команд и нескольких многоступенчатых конвейеров. В отличии от двух 5-ступенчатых конвейеровPentium,P6 имеет три 10-ступенчатых. Увеличение числа конвейеров и ступеней обработки команд в них позволило увеличить внутреннюю тактовую частоту синхронизации, которая стала равной 133, 166, 180, 200 МГц и более. ВPentiumProдля повышения производительности вычислений за счет увеличения внутренней тактовой частоты внедрены следующие структурные дополнения в семейство х86:

Применено динамическое исполнение команд, при котором команды, не зависящие от вычислений ранних операций в программе, выполняются в измененном сдвоенном порядке с передачей результатов в закрепленном в программе порядке;

Использован тыльный кэш-2 с двумя раздельными системными шинами обмена: скоростной короткой для обмена между МП и кэш-2; традиционной процессорной с частотой синхронизации 66,6 МГц;

Внешний кэш-2 емкостью 256 или 512 Кб размещен в корпусе МП;

Внедрены дополнительные средства контроля ECCпри обмене в системной шине, кэш-2, ОЗУ и возможность контроля дублированием вычислений вторым МП в режимеFRC;

Системная шина с программируемым контроллером и интерфейсом APICобеспечивает мультипроцессорную обработку до 4 МП, объединенных в единую систему.

Увеличение частоты синхронизации позволяет повысить быстродействие обработки команд, что, в свою очередь, требует повышения скорости обмена с внешним ОЗУ. Чтобы исключить задержки обмена с ОЗУ, в кристалле процессора смонтирована буферная память второго уровня (кэш-2) емкостью 256 Кб. Блок кэш-2 связан внутри процессора через интерфейс памяти собственной синхронной внутренней 64-разрядной шиной данных, работающей на тактовой частоте процессора.

С целью эффективного вычисления последовательности команд в PentiumProиспользуется буфер предсказания ветвлений ВТВ0, ВТВ1 на 512 входов. Использование этих блоков позволило разработчикам добиться наибольшей загрузки двух блоков целочисленной арифметики (АЛУ), сопроцессора (FPU), блоков записи и загрузки, увеличив производительность по сравнению сPentiumна 35 – 45 %. Эта производительность оказалась всего лишь в 1,5 раза меньше, чем у самого быстрогоRISC-процессораDECAlpha21164. Схема МПPentiumProпоказана на рис. 2.13. ПроцессорPentiumProвыполняет вычисления в конвейере в следующей последовательности. Операционная система загружает из ОЗУ через системную шину в кэш-2 массивы данных и набор команд для выполнения программ, которые образуют очередь с приоритетами и привилегиями. Первая программа из очереди одновременно загружается в кэш-1 команд, а операнды, с которыми она работает, передаются в кэш-1 данных. Адреса команд и данных располагаются в блоке тэгов обоих кэш-1, и в случае промаха при обращении к кэш-1 недостающие команды или данные постоянно доизвлекаются чаще всего из кэш-2 и реже, при отсутствии в нем, из основного ОЗУ. На первой ступени дешифрирования (DC) три команды динамически распределяются на параллельную обработку во вторую ступень дешифрацииID1 (распределение на параллельную обработку в целочисленные АЛУ иFPU). В результате после второй ступени дешифрации в каждом такте могут появляться одновременно до шести микроопераций, подлежащих выполнению в операционном блоке (Port0 - 4) ядра процессора.

Эти микрооперации закрепляются за регистрами в блоке переименования регистров и выделения ресурсов RAT. Блок переименования регистровRATпозволяет закрепить для выполнения операций более восьми РОН, используемых для программирования. При наличии нескольких конвейеров это даёт возможность одновременно выполнять несколько команд, ссылающихся на одни и те же регистры в разных конвейерах по мере их освобождения.

После RATнабор микроопераций направляется в блок резервированияRSи буфер переупорядочивания чтенияROBRd, который осуществляет вычисление адресов операндов и загрузку ими переименованных регистров РОН в двух целочисленных АЛУ.

После выполнения микроопераций ROBRdудаляет их из блока резервированияRS. БлокRSявляется начальной ступенью произвольной обработки в ядре МП. В нем микрооперации могут ожидать операнды или устройства для выполнения операции. Если операнды доступны и устройства свободны, микрооперация направляется на исполнение через один из портовPort0 - 4 минуя такты ожидания. Результаты выполнения микроопераций передаются в переупорядочивающий буфер записиROBwbи файл регистровRRF, способный принимать за один такт три операнда. В этом блоке результаты окончания операций ожидают освобождения ШД для записи в кэш и ОЗУ. Для чего им восстанавливается порядок, соответствующий порядку результатов при выполнении закодированной программы.

Для PentiumProIntelразработала два чипсетаPCI: 82450GX(для серверов) и 82450FХ (для рабочих станций) и специальное программное обеспечение, обеспечивающее параллельную обработку команд в конвейере с 32 - разрядными числами. ХотяPentiumProпрограммно совместим с предыдущими моделями микропроцессоровx86, эффективное его использование в персональных компьютерах сдерживалось дороговизной ЭВМ и недостаточным количеством необходимого программного обеспечения.

5.2. Процессор Pentium II

Процессор PentiumII, ранее носивший названиеKlamath, характеризуется дальнейшим увеличением быстродействия процессоровPentium, совместимых с архитектуройx86. Объединив технологиюMMXи архитектуру ядра МПPentiumPro, фирмаIntelс мая 1997 года начинает производить процессорPentiumIIпо 0.35-мкм КМОП-технологии с четырьмя слоями металлизации. Центральное ядро содержит 7.5 млн транзисторов и располагается на площади 203 мм 2 .

Кристалл PentiumIIразмещается в пластмассовом корпусеPLGA, имеющем матрицу из 528 миниатюрных контактных площадок. Этот корпус устанавливается на одной процессорной мини-плате, уменьшающей отбраковку МП при производстве, вместе с кэш второго уровня и микросхемой памяти для хранения тэговTagRAM. Он закрыт в картридже общей крышкой, которая и охлаждается специальным вентилятором. Картридж с односторонним расположением контактов (S.E.C.С.) устанавливается в специально разработанный фирмойIntelразъёмSlot1 на системной плате. Картридж может быть легко модифицирован с появлением новых промышленных кристаллов МП, кэш-2, памяти тэгов и контроллера кэша. Используя размер стока транзистора 0.28 мкм,Intelудалось повысить предельное быстродействие и достигнуть тактовой частоты от 233 до 450 МГц. На частоте 266 МГцPentiumIIпотребляет до 38 Вт электроэнергии.

Внешняя тактовая частота процессора остается 66,6 МГц, что не позволяет более эффективное использование SDRAM, предназначенной для работы на частотах 83 и 100 МГц. С использованием двухпроцессорного режимаSMPи интерфейсаAPICвозможна работа МП как в режиме параллельной обработки информации, так и в режиме контроля одного процессора другим в системеFRC.

В процессорах PentiumProиPentiumIIдля расширения адресного пространства используется шина запроса памятиREQ(3,0). В режиме обмена с памятью, дополняя ША до 36 бит, она позволяет работать МП с памятью до 64 Гб.

Архитектура ядра PentiumIIмало отличается от архитектурыPentiumPro. Традиционная система команд х86 реализуется с использованием методов, заимствованных уRISC-процессоров. При этом каждая операция преобразуется в последовательность простых микрокоманд. Эти простейшие микрокоманды выполняются с использованием принципов множественного предсказания переходов, исполнения команд по предположению и с изменением последовательности способа переименования регистров, что позволяет организовать параллельную конвейерную обработку нескольких команд.

Однако архитектуры PentiumIIиPentiumProимеют два существенных отличия.PentiumIIспециально создан для скоростной обработки мультимедиа-приложений, сочетает использование до 40 Мб видеопамяти с выполнением высококачественных ускоренных графических процессов, включающих до 512 Мб ОЗУSDRAM, и обменом через новую шинуAGPс профессиональным графическим ускорителем и поддержкой разрешения 1600х1280 при 16.7 млн цветов. МП поддерживает мультимедийное расширение набора команд (MMX). Для исполнения команд ММХ ядромPentiumProвPentiumIIвведены порты:

Кроме того, PentiumIIимеет средства переименования сегментных регистров. Использование этих средств ускоряет работу процессора под управлением 16-разрядных программ. При выполнении вPentiumProранее разработанных 16-разрядных программ изменение содержимого сегментных регистров происходит часто. При этом обновление содержимого сегментного регистра требует очистки конвейера от команд, то есть необходимо выполнить все команды, использующие текущее значение сегментного регистра, до его обновления. С учетом времени, необходимого на передачу результатов для записи, полученная задержка составит почти 30 тактов.

PentiumIIв этом режиме выполняет запись в регистры по предположению, что позволяет командам, использующим старое значение сегмента, сосуществовать с командами, использующими новое значение сегмента. Ускорение работы 16-разрядных приложений может составить до 50% на той же частоте по сравнению с процессоромPentiumPro.

PentiumIIможет обрабатывать 57MMX-команд, при этом используется 8 адресуемых 64-разрядных регистров ММХ. Наличие команд поддержки режимаMMXпозволяет ускорить обработку мультимедиа-приложений при соответствующем программном обеспечении.

Для компенсации относительно медленной работы кэш второго уровня размер внутреннего кэш был увеличен вдвое: с 16 Кб до 32 Кб (16 Кб для хранения команд и 16 Кб – для данных), где кэш-1 данных разбит на 8 чередующихся банков. Увеличение объема внутреннего кэша позволяет снизить частоту обращений к внешней памяти. Для установки PentiumIIразработаны материнские платы с набором ИС 440LX, конструктивно несовместимые с ранее выпускавшимися процессорами.

В январе 1998 г. Intel представила, кроме МП Pentium II 233, 266 и 300 МГц, четвертый по счету процессор семейства Pentium II, имеющий тактовую частоту 333 МГц на кристалле, содержащем 7.5 млн транзисторов (каждый транзистор в 400 раз меньше диаметра человеческого волоса). Он выпущен с применением передовой тогда 0,25 мкм производственной технологии Intel. ПроцессорPentium II 333 МГц имеет наивысшую производительность по сравнению с предыдущими моделями при выполнении целочисленных операций и при работе с мультимедиа (для обработки звука, видео, оцифрованных изображений и поддержки видеоконференций).

Процессор Pentium II 333 МГц имеет все те же характеристики, что и ранее выпущенные версии процессора Pentium II, в том числе: архитектуру двойной независимой шины (DIB), режим динамического исполнения, набор мультимедийных команд технологии Intel MMX и шину кэш-памяти второго уровня (L2) 512 Kб, работающую на частоте, в два раза меньшей тактовой частоты процессора. Для процессора Pentium II 333 МГц частота шины кэш-памяти L2 составляет 166.5 МГц.

При работе со стандартными офисными приложениями процессор Pentium II 333 МГц превосходит процессор Pentium II 300 МГц по производительности на 10 % . Более ощутимо преимущество процессора Pentium II 333 МГц при его сравнении с процессором Pentium MMX, имеющим тактовую частоту 233 МГц. Притом что разница тактовых частот этих процессоров составляет 42 %, Pentium II 333 МГц превосходит его по производительности на 50 – 80 %.

Характеристики процессора Pentium II представлены в табл. 2.4, из которой видно, что в дальнейшем было выпущено еще несколько его модификаций вплоть до Pentium II 450 МГц.

Вторичный кэш в PentiumIIмедленнее, чем вPentiumPro. Он построен по четырёхканальной множественно-ассоциативной синхронной структуре без блокирования на элементах статической памятиSRAMи работает в пакетном режиме. Частота тыльного кэш второго уровня в два раза ниже, чем внутренняя частота процессора. Емкость кэш второго уровня составляет 512 Кб, однако в других вариантах процессораPentiumIIможет устанавливаться кэш меньшей емкости (256 Кб).

5.3. Процессор Pentium III

Процессор Pentium II, как описано в п. 2.5.(«ПроцессорPentiumII»), изготовлен на основе ядраKlamathпо технологии 0,35 мкм с частотой внешней шины 66 МГц. Затем на основеKlamathфирмойIntelбыло разработано ядроDeschutesдля 0,25 мкм технологии и изготовлен PentiumIIс частотой шины 100 МГц и PentiumIIXeon(Зеон), отличающиеся более высоким быстродействием и емкостью кэш-2, и дешевыйCeleron(в начале без кэш-2 с частотой внешней шины 66 МГц). Позже на базеDeschutesбыло разработано ядро с интегрированным в тот же корпус быстрым кэш-2Mendocino, на базе которого выпускались всеCeleron«А» (с внутренним кэш-2 емкостью 128 Кб). ЗатемIntelразработала МПDixonс емкостью 256 Кб встроенного кэш-2. ЭтоCeleronс увеличенным кэш-2 вдвое. Но так как он работает как PentiumII, то имеет другое название. В начале 1999 г. на основе ядраKatmaiизготовленыPentiumIIIиPentiumIIIXeon(Tanner). В конце 1999 г. на базе ядраCoppermineпо 0,18 мкм технологии изготовленPentiumIIIиPentiumIIIXeon(Cascades), имеющие какMendocinoбыстрый интегрированный кэш-2. С 2001 г.Pentium III выпускается по 0,13 мкм (металлизацияCu) технологии на базе ядраTualatinс частотой шины 1400 МГц и дешевыйCeleron(1.2 и 1.3 ГГц).

Так, ядро Coppermineимеет кэш-2 емкостью 256 Кб, который работает синхронно с МП. Организация внутреннего кэш-2 изменена. Он представляет собой 8-канальный ассоциативный буфер с 256-разрядной шиной ядра. Обмен МП с кэш-2 требует новых протоколов, то есть обновленнойBIOS. В процессореPentiumIIIоптимизирована схема внутренней буферизации (4 буфера с обратной записью; 6 буферов заполнения; 8 входов очереди шины). Оптимизация привела к сокращению времени ожидания данных из кэш-2 и увеличению производительности МП на той же частоте на 10 – 20 %. Повышение тактовой частоты до 1000 МГц достигнуто за счет уменьшения технологических норм, добавления 6 слоя алюминиевой металлизации и улучшения внутренней разводки цепей МП. Согласующие резисторы и конденсаторы, которые ранее устанавливались на плате процессорного модуля дляSlot1, перенесены в кристалл СБИС. Напряжение питания ядра понижено до 1.1 – 1.65 В.

Таким образом, начиная с 1999 г. фирма Intelосуществляет серийный выпуск процессора PentiumIIIразных модификаций по 0.25 и 0.13 мкм технологии с внутренней частотой синхронизации от 450 до 1400 МГц. PentiumIIIв зависимости от модификации ядра изготавливается на кристалле, содержащем от 9.5 до 42 млн транзисторов. Он ориентирован на применение в настольных (PentiumIII450/500/533ЕВ/…/1400), портативных (MobillPentiumIII400/500/600) ПК, а также для работы в серверах (PentiumIIIXeon600B/667B//1000B). С индексом ”В” процессоры используются в материнских платах с частотой системной процессорной шины FSB 133 МГц. Процессоры Pentium III с индексом ”Е” имеют напряжение питания 1.6 В и изготовлены по 0.18 мкм технологии с внутренним кэш-2 емкостью 256 Кб, размещённым в кристалле процессора. В связи с этим Pentium III Е выпускается как в виде картриджа S.E.C.C.2 с разъёмом Slot 1, так и в виде одной СБИС в новом корпусе FCPGA с разъёмом Socket 370. С появлением Celeron, а затем Pentium III и Xeon осуществлялся переход спецификации процессорной шины и стандарта разъёма МП Slot 1 на Socket 370, а затем на Socket FCPGA. Для Xeon был разработан свой стандарт разъёма Slot 2.

Mobill Pentium III питается от источника с пониженным напряжением 1.35 В и тактового генератора с частотой 100 МГц. Он оснащен встроенным в МП кэш-2 емкостью 256 Кб и блоком SSE.

У Pentium III 0.25 мкм технологии кэш-2 емкостью 512 Кб размещается на процессорной плате. Обычный Pentium III поддерживает двухпроцессорную конфигурацию, а Хеоn до 4 МП. Хеоn может взаимодействовать с внешним тыльным кэш-2 емкостью до 2 Мб, работающим на частоте процессора, что позволяет намного увеличить его быстродействие вычислений по сравнению с обычным Pentium III .

Новый картридж процессора Pentium III, заключенный в корпус с односторонним расположением контактов SECC2, упрощает конструкцию системных плат, предназначенных для работы с этим процессором, облегчает массовое их производство, безопасность при использовании и обеспечивает единый форм-фактор процессоров будущего. SECC2 – некое промежуточное звено между стандартным SECC и его полным отсутствием. В нём радиатор, обдуваемый вентилятором, соприкасается не с железной пластиной, прижатой к ядру, а непосредственно с микросхемой, обеспечивая лучший отвод тепла от кристалла, помещенного в новый органический сплав на основе меди OLGA.

Pentium III имеет следующие особенности:

1.Обеспечивает одновременно технологии потоковых SIMD-расширений SSE для Internet, динамического исполнения команд и технологию MMX.

2.Имеет архитектуру независимой двойной шины DIB, что увеличивает пропускную способность и производительность его по сравнению с процессорами с единственной шиной данных.

3.Содержит функцию серийного номера процессора для расширения степени управляемости ЭВМ.

4.Имеет неблокируемую кэш-1 первого уровня емкостью 32 Kб (16 Кб/16 Кб) и унифицированную неблокируемую кэш-2 второго уровня емкостью 512 Кб, что обеспечивает ускоренный доступ к часто используемым данным.

5.Поддерживает кэширование памяти с объемом адресного пространства 4 Гб.

6.Позволяет создавать масштабируемые системы с двумя процессорами и физической памятью объемом до 64 Гб.

7.Поддерживает тестирование и мониторинг производительности.

8.Совместим по кодам с существующим программным обеспечением и процессорами предшествующих поколений на базе архитектуры Intel.

Потоковые SIMD-расширения SSE для Internet (MMX2) представляют собой 70 новых команд, сгруппированных в следующие категории:

1.Команды копирования данных movaps ,…, movss . Команды этой группы выполняют операции параллельного копирования упакованных элементов данных (PS), а также скалярного (SS) копирования только младшего элемента операнда. Действия производятся над операндами, расположенными в XMM‑регистрах или в памяти.

2.Арифметические команды SIMD выполняют сложение (addps ,addss ), вычитание, умножение (mulps ,mulss ), деление (divps ,divss ) и другие операцииданных одинарной точности с плавающей точкой. Входной (второй) операнд этих команд может располагаться либо в SIMD‑регистре, либо в памяти. Выходной (первый) операнд должен находиться в SIMD-регистре. Арифметические команды поддерживают как параллельные, так и скалярные операции.

3.Команды сравнения cmpps , cmpss и другие попарно сравнивают все четыре соответствующих FP‑элемента двух операндов (для скалярного (SS) варианта команд – только младшие элементы), устанавливают соответствующие флаги в регистре EFLAGS и проверяют выполнение арифметического условия, специфичного для каждой команды. Если для сравниваемой пары условие выполняется, то в соответствующие 32 разряда выходного операнда записывается маска из всех единиц. В противном случае – маска из нулей. Получаемая в результате двоичная маска обычно используется при логических операциях с объектами.

4.Команды преобразования типов данных выполняют преобразования данных из 32-разрядного целочисленного представления со знаком в FP-представление и обратно. Эти команды производят преобразование упакованных и скалярных данных между 128‑битными SIMD регистрами с плавающей точкой и также с 64-битными целыми MMX регистрами или 32-битными целыми регистрами IA-32.

5.Логические команды andps, andnps, orps иxorps часто используются для вычисления абсолютной величины (модуля) чисел; изменения знакового разряда (инверсии знака); действий с маской из нулей и единиц.

6.Дополнительные целочисленные SIMD-команды, команды перестановки, управления состоянием, управления кэшированием.

В Pentium III введён еще один блок, подобный MMX, только оперирующий с вещественными числами. Основной тип данных SSE это 128-разрядное значение, содержащее 4 последовательно расположенных (“упакованных”) 32-разрядных числа одинарной точности с плавающей точкой SPFP, как показано на рис. 2.14.

Рис. 2.14. Упакованное простое число с плавающей точкой

Каждое 32-разрядное число с плавающей точкой (см. рис. 1.2.) имеет 1 знаковый бит, 8 битов порядка и 23 бита мантиссы, что соответствует стандарту IEEE-754 на формат представления чисел одинарной точности с плавающей запятой. SIMD-инструкции оперируют в новом модуле SSE со специальными 128-битными регистрами XMM0-XMM7 и улучшают работу с приложениями трехмерной графики, потокового аудио, видео и распознавания речи. Каждый из этих регистров хранит 4 вещественных числа одинарной точности (ОТ). Потоковое расширение SIMD архитектуры Intel поддерживает 2 типа операций над упакованными данными с плавающей точкой – параллельные и скалярные.

Параллельные операции (ОР), как правило, действуют одновременно на все четыре 32-разрядных элемента данных в каждом из 128-разрядных операндов, как показано на рис. 2.15. В именах команд, выполняющих параллельные операции, присутствует суффикс ps . Например, командаaddps складывает 4 пары элементов данных и записывает полученные 4 суммы в соответствующие элементы первого операнда.

Скалярные операции действуют на младшие (занимающие разряды (31,0)) элементы данных двух операндов, как это показано на рис. 2.16. Остальные 3 элемента данных в выходном операнде не изменяются (исключение составляет команда скалярного копирования movss ). В имени команд, выполняющих скалярные операции, присутствует суффиксss (например, командаaddss ).

Рис. 2.15. Упакованные (параллельные) операции

Большинство команд двухадресные и оперируют с двумя операндами. Данные, содержащиеся в первом операнде, могут использоваться командой, а после ее выполнения, как правило, замещаются результатами. Данные второго операнда в команде после ее выполнения не изменяются. Для всех команд адрес операнда в памяти должен быть выровнен по 16-байтной границе, кроме невыровненных команд сохранения и загрузки.

Рис. 2.16. Скалярные операции

Таким образом, выполняя операцию над двумя регистрами, блок SSE фактически оперирует с четырьмя парами чисел. Благодаря этому процессор может выполнять до 4 одинаковых операций одновременно. Однако для выполнения четырех параллельных операций программист должен использовать специальные команды, а также позаботиться о помещении и извлечении данных из 128-битных регистров. Поэтому для использования всех вычислительных мощностей Pentium III необходима целенаправленная оптимизация.

Внедрение потоковых SIMD-расширений позволяет существенно увеличить скорость и качество работы в реальном времени приложений, использующих:

Трехмерную графику и 3D-моделирование, расчет освещенности с использованием вычислений с плавающей запятой;

Обработку сигналов и моделирование процессов с широким диапазоном изменения параметров (вычисления с плавающей запятой);

Генерацию трехмерных изображений в программах реального времени, не использующих целочисленный код;

Алгоритмы кодирования и декодирования видеосигнала, обрабатывающие данные блоками;

Численные алгоритмы фильтрации, работающие с потоками данных.

Использование потоковых SIMD-расширений позволяет получить более высокое разрешение и качество изображений на дисплее, более высокое качество звука, видео и возможности параллельного кодирования и декодирования в формате сжатия цифровых кодов на оптический диск MPEG2, а также снизить загрузки процессора при распознавании речи и увеличить точность и быстродействие вычислений.

Как указывалось выше, технология динамического исполнения команд в архитектуре Р6 обеспечивает предсказание ветвлений и прогнозирует исполнение программы по нескольким ветвям, позволяет осуществить анализ потока данных, оптимизацию и реорганизацию последовательности исполнения команд на основе используемых в них данных. Допускает спекулятивное исполнение команд на основе оптимизированной последовательности, которая увеличивает загрузку РОН и блоков процессора, что ведет к повышению общей производительности PentiumIII. Кроме того, технология MMX обеспечивается вPentiumIIIнабором 57 команд общего назначения для целочисленных операций, легко применимых к широкому спектру мультимедийных и коммуникационных приложений. Здесь также используются SIMD-инструкции, которые исполняются в восьми 64-разрядных регистрах MMX0-ММХ7.

Серийный номер процессора – это электронный номер, позволяющий идентифицировать конкретную систему в больших компьютерных сетях.

Тестирование и мониторинг производительности в Pentium III содержит следующие функции:

Встроенный механизм самотестирования BIST обеспечивает постоянный контроль зависаний и сбоев в микрокоде и больших логических матрицах, а также тестирование кэш команд и кэш данных, буферов TLB и сегментов памяти ROM;

Механизм стандартного порта доступа к тестированию и периферийному сканированию IEEE 1149.1 дает возможность осуществлять проверку каналов связи между процессором Pentium III и системой через стандартный интерфейс;

Встроенные счетные устройства следят за показателями производительности и ведут подсчет событий.

Итак, сегодня компания Intel выпустила, по всей видимости, последний процессор семейства Pentium 4, теперь всему миру остается ждать появления Intel Pentium 5 Prescott. Насколько нам известно, сегодняшний Intel Pentium 4 3.20 GHz будет последним процессором линейки собранным по 130 нм техпроцессу.
Intel, как известно, будет выпускать процессоры Prescott по 90 нм технологии, а со следующего года поменяет и собственно процессорный разъем. Нынешние Pentium 4, с технологией Netbust, тем не менее, будут производиться еще около года, Netbust останется и в Pentium 5.


4. AMD

AMD - мировой поставщик интегральных микросхем для рынка персональных и сетевых компьютеров и коммуникаций, чьи производственные мощности расположены в Соединенных Штатах, Европе, Японии и Азии. AMD производит микропроцессоры, устройства флэш-памяти и вспомогательные микросхемы для коммуникационных и сетевых приложений. Компания AMD, основанная в 1969 году со штаб-квартирой в г. Саннивейл (шт. Калифорния), в 2000 году имела оборот 4,6 млрд. долл. (NYSE: AMD).

Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность.

Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel - Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD - вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены - этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения - Athlon.

Понравилась статья? Поделиться с друзьями: