POWER1 является мульти-чип процессора разработан и изготовлен с помощью IBM , реализующий МОЩНОСТИ набора команд архитектуры (ISA). Первоначально он был известен как RISC System / 6000 CPU или, если в сокращенной форме, RS / 6000 CPU , до появления преемников требовалось заменить исходное имя на то, которое использовало ту же схему именования (POWER n ), что и его преемников, чтобы отличать его от более новых дизайнов.
Основная информация | |
---|---|
Запущен | 1990 г. |
Разработано | IBM |
Архитектура и классификация | |
Набор инструкций | POWER ISA |
История | |
Преемник | МОЩНОСТЬ2 |
История
POWER1 был представлен в 1990 году, когда были представлены серверы IBM RS / 6000 POWERserver и рабочие станции POWERstation , в которых использовался POWER1 с тактовой частотой 20, 25 или 30 МГц . POWER1 получил два обновления: одно в 1991 году с выпуском POWER1 + и в 1992 году с представлением POWER1 ++. Эти модернизированные версии работали с более высокой тактовой частотой, чем исходный POWER1, что стало возможным благодаря улучшенным полупроводниковым процессам . POWER1 + имел тактовую частоту немного выше, чем исходный POWER1, на частотах 25, 33 и 41 МГц, в то время как POWER1 ++ поднял микроархитектуру на самые высокие частоты - 25, 33, 41,6, 45, 50 и 62,5 МГц. В сентябре 1993 года на смену POWER1 и его вариантам пришла POWER2 (известная кратко как «RIOS2»), эволюция микроархитектуры POWER1.
Прямыми производными от POWER1 являются RISC Single Chip (RSC), однокристальный вариант с ограниченным набором функций для систем RS / 6000 начального уровня, и RAD6000 , радиационно-стойкий вариант RSC для космических приложений. Косвенным производным от POWER1 является PowerPC 601 , вариант RSC с ограниченными возможностями, предназначенный для потребительских приложений.
POWER1 примечателен тем, что он представляет собой ряд новинок для IBM и компьютеров в целом. Это был первый RISC- процессор IBM, предназначенный для высокопроизводительных приложений ( ROMP считался коммерческим отказом и не использовался в высокопроизводительных рабочих станциях), он был первым, кто реализовал тогда новую архитектуру набора команд POWER, и это был первый успешный продукт IBM. RISC-процессор. Что касается первых вычислений, POWER1 будет известен как первый процессор, в котором реализована некоторая форма переименования регистров и выполнения вне очереди , метод, который улучшает производительность суперскалярных процессоров, но ранее был зарезервирован для мэйнфреймов .
POWER1 был также источником очень успешных семейств процессоров POWER , PowerPC и Power ISA , которые последовали за ним, с сотнями различных реализаций.
Компилятор GCC с открытым исходным кодом удалил поддержку POWER1 (RIOS) и POWER2 (RIOS2) в выпуске 4.5. [1]
Микроархитектура
POWER1 - это 32-битный двухпроцессорный суперскалярный процессор. Он содержит три основных исполнительных блока: блок с фиксированной запятой (FXU), блок ветвления (BPU) и блок с плавающей запятой (FPU). Хотя POWER1 является 32-битным процессором с 32-битным физическим адресом , его виртуальный адрес имеет длину 52 бита. Было выбрано более крупное виртуальное адресное пространство, потому что это было выгодно для производительности приложений, позволяя каждому иметь большой диапазон адресов 4 ГБ .
POWER1 - это процессор с прямым порядком байтов, который использует иерархию кеш-памяти в стиле Гарварда с отдельными кэшами инструкций и данных. Кэш команд, называемый IBM «I-cache», имеет размер 8 КБ и является двусторонним ассоциативным с размером строки 64 байта. I-cache расположен на микросхеме ICU. Кэш данных, называемый IBM «D-cache», имеет размер 32 КБ для конфигураций RIOS.9 и 64 КБ для конфигураций RIOS-1. D-кэш - это четырехсторонний ассоциативный набор с размером строки 128 байт. D-кэш использует схему возврата, при которой данные, которые должны быть сохранены, записываются в кэш вместо памяти, чтобы уменьшить количество операций записи, предназначенных для памяти. Схема возврата используется для предотвращения монополизации ЦП доступа к памяти.
Несмотря на то, POWER1 был высококачественный дизайн, он не был способен многопроцессорной , и как таковой был в невыгодном положении, так как только производительность способа может быть улучшен был с тактовой частотой процессора выше, что было трудно сделать с такой большой мульти-чип дизайн. IBM использовала кластеризацию, чтобы преодолеть этот недостаток в системах POWER1, позволив им эффективно функционировать, как если бы они были многопроцессорными системами, концепция, подтвержденная популярностью суперкомпьютеров SP1 на базе POWER1. Поскольку POWER1 был основой микропроцессоров POWER2 и P2SC , отсутствие многопроцессорности было передано этим более поздним процессорам POWER. Многопроцессорность не поддерживалась до появления POWER3 в 1998 году.
Физическое описание
POWER1 - это многочиповый ЦП, состоящий из отдельных микросхем, соединенных между собой шинами. POWER1 состоит из блока кэша инструкций (ICU), блока с фиксированной запятой (FXU), блока с плавающей запятой (FPU), ряда блоков кэша данных (DCU), блока управления памятью (SCU) и блок ввода / вывода . Благодаря модульной конструкции IBM смогла создать две конфигурации, просто варьируя количество DCU, RIOS-1 и RIOS.9 . Конфигурация RIOS-1 имеет четыре блока DCU (предполагаемое количество) и работает на частоте до 40 МГц, тогда как процессор RIOS.9 имеет два блока DCU и работает на более низких частотах.
Чипы монтируются на «планарной плате ЦП», печатной плате (PCB), с использованием сквозной технологии. Из-за большого количества микросхем с широкими шинами на печатной плате имеется восемь плоскостей для прокладки проводов, четыре для питания и земли и четыре для сигналов. На каждой стороне платы есть две сигнальные плоскости, а четыре плоскости питания и земли находятся в центре.
Чипы, из которых состоит POWER1, изготавливаются по технологии CMOS 1,0 мкм с тремя слоями межсоединений. Чипы упакованы в корпуса с керамической решеткой контактов (CPGA), которые могут иметь до 300 контактов и рассеивать максимум 4 Вт тепла каждый. Общее количество транзисторов, представленных POWER1, если предположить, что это конфигурация RIOS-1, составляет 6,9 миллиона, из которых 2,04 миллиона используются для логики и 4,86 миллиона используются для памяти. Площадь кристалла всех чипов, вместе взятых, составляет 1 284 мм². Общее количество сигнальных контактов - 1464.
Чипсы
Блок кэширования инструкций (ICU)
ICU содержит кэш команд, называемый IBM «I-cache», и блок обработки ветвей (BPU). BPU содержит счетчик программ , регистр кода условия и регистр цикла. ICU содержит 0,75 миллиона транзисторов, из которых 0,2 миллиона используются для логики и 0,55 миллиона используются для SRAM . Размер матрицы ICU составляет примерно 160 мм² (12,7 × 12,7 мм).
BPU был способен отправлять несколько инструкций в очереди инструкций с фиксированной и плавающей запятой, пока он выполнял инструкцию управления потоком программы (до четырех одновременно и не по порядку). Спекулятивные переходы также поддерживались за счет использования бита предсказания в инструкциях перехода, при этом результаты отбрасывались перед сохранением, если переход не был выполнен. Альтернативная инструкция будет помещена в буфер и отброшена, если будет выполнено ветвление. Следовательно, вызовы подпрограмм и прерывания обрабатываются без штрафных санкций за переход.
Регистр кода условия имеет восемь наборов полей, первые два зарезервированы для инструкций с фиксированной и плавающей запятой, а седьмой - для векторных инструкций . Остальные поля могут использоваться другими инструкциями. Регистр цикла - это счетчик циклов «декремент и переход по нулю» без штрафа за переход , функция, аналогичная той, что есть в некоторых DSP, таких как TMS320C30.
Блок с фиксированной точкой (FXU)
FXU отвечает за декодирование и выполнение всех инструкций с фиксированной запятой и инструкций загрузки и сохранения с плавающей запятой. Для выполнения FXU содержит файл регистров с фиксированной точкой POWER1, арифметико-логический блок (ALU) для общих инструкций и специальный блок умножения и деления с фиксированной точкой. Он также содержит буферы инструкций, которые получают инструкции с фиксированной и плавающей запятой от ICU, передавая инструкции с плавающей запятой в FPU, и двухсторонний ассоциативный блок D- TLB на 128 записей для трансляции адресов. FXU содержит приблизительно 0,5 миллиона транзисторов, из которых 0,25 миллиона используются для логики и 0,25 используются для памяти, на кристалле размером примерно 160 мм².
Блок с плавающей запятой (FPU)
Модуль с плавающей запятой POWER1 выполняет инструкции с плавающей запятой, выдаваемые ICU. FPU является конвейерным и может выполнять инструкции одинарной (32-битной) и двойной точности (64-битные). Он способен выполнять инструкции умножения-сложения , что способствовало высокой производительности POWER1 с плавающей запятой. В большинстве процессоров операции умножения и сложения, которые распространены в техническом и научном коде с плавающей запятой, не могут выполняться за один цикл, как в POWER1. Использование слитного умножения – сложения также означает, что данные округляются только один раз, что немного улучшает точность результата.
Файл регистров с плавающей запятой также находится на микросхеме FPU. Он содержит 32 64-битных регистра с плавающей запятой, шесть регистров переименования и два регистра, которые используются командами деления.
Блок кэширования данных (DCU)
POWER1 имеет кэш данных размером 64 КБ, реализованный с помощью четырех идентичных блоков кэша данных (DCU), каждый из которых содержит 16 КБ кэша данных. Кэш и шины, соединяющие DCU с другими микросхемами, защищены ECC. DCU также обеспечивают интерфейс с памятью. Если присутствуют два DCU (конфигурация RIOS.9), ширина шины памяти составляет 64 бита, а если присутствуют четыре DCU (конфигурация RIOS-1), ширина шины памяти составляет 128 бит. Часть интерфейса памяти блоков DCU обеспечивает три функции, которые повышают надежность и доступность памяти: очистку памяти , ECC и управление битами . Каждый DCU содержит примерно 1,125 миллиона транзисторов, из которых 0,175 миллиона используется для логики и 0,95 миллиона используется для SRAM, на кристалле размером примерно 130 мм² (11,3 × 11,3 мм).
Блок управления складом (SCU)
POWER1 управляется микросхемой SCU. Все коммуникации между микросхемами ICU, FXU и DCU, а также памятью и устройствами ввода-вывода контролируются SCU. Хотя блоки DCU предоставляют средства для выполнения очистки памяти, именно SCU управляет процессом. SCU содержит примерно 0,23 миллиона транзисторов, все они для логики, на кристалле размером примерно 130 мм².
Блок ввода / вывода
Интерфейсы ввода-вывода POWER1 реализуются блоком ввода-вывода, который содержит контроллер канала ввода-вывода (IOCC) и два адаптера последовательной связи (SLA). IOCC реализует интерфейс Micro Channel и управляет транзакциями ввода-вывода и DMA между адаптерами Micro Channel и системной памятью. Каждый из двух SLA реализует последовательный оптоволоконный канал, который предназначен для соединения систем RS / 6000 вместе. На момент выпуска RS / 6000 оптические каналы не поддерживались. Блок ввода-вывода содержит примерно 0,5 миллиона транзисторов, из которых 0,3 миллиона используются для логики и 0,2 миллиона используются для памяти, на кристалле размером примерно 160 мм².
Смотрите также
- Архитектуры наборов команд: IBM POWER Instruction Set Architecture , PowerPC , Power ISA
- Процессоры: RISC Single Chip , RAD6000 , POWER2 , POWER3 , POWER4 , POWER5 , POWER6 , POWER7 , POWER8 , POWER9
- Компьютерные системы: RS / 6000 , масштабируемый POWER, параллельный
- Связанные технологии: PowerPC 601 , RS64
Рекомендации
- ^ «Серия выпусков GCC 4.5 - Изменения, новые функции и исправления - Проект GNU - Фонд свободного программного обеспечения (FSF)» . gcc.gnu.org .
- Великие микропроцессоры прошлого и настоящего (V 13.4.0)
- Монтой, РК; Hokenek, E .; Runyon, SL (январь 1990 г.). «Дизайн исполнительного устройства с плавающей запятой IBM RISC System / 6000». Журнал исследований и разработок IBM . 34 (1): 59–70. DOI : 10.1147 / rd.341.0059 .
- Oehler, RR; Groves, RD (январь 1990 г.). «Архитектура процессора IBM RISC System / 6000». Журнал исследований и разработок IBM . 34 (1): 23–36. DOI : 10.1147 / rd.341.0023 .
- Grohoski, GF (январь 1990 г.). «Машинная организация процессора IBM RISC System / 6000». Журнал исследований и разработок IBM . 34 (1): 37–58. DOI : 10.1147 / rd.341.0037 .
- Бакоглу, HB; Grohoski, GF; Монтой, РК (январь 1990 г.). «Процессор IBM RISC System / 6000: Обзор оборудования». Журнал исследований и разработок IBM . 34 (1): 12–22. DOI : 10.1147 / rd.341.0012 .
дальнейшее чтение
- Вайс, Шломо; Смит, Джеймс Эдвард (1994). МОЩНОСТЬ и PowerPC . Морган Кауфманн. ISBN 1558602798. - Соответствующие части: Глава 3 (как предполагается реализовать архитектуру POWER), Главы 4 и 5 (описывает POWER1).