Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

POWER7 - это семейство суперскалярных симметричных мультипроцессоров, основанных на архитектуре набора команд Power ISA 2.06, выпущенной в 2010 году и пришедшей на смену POWER6 . POWER7 был разработан IBM на нескольких объектах, включая IBM в Рочестере, Миннесота ; Остин, Техас; Essex Junction, VT ; Исследовательский центр Т.Дж. Уотсона , Нью-Йорк; Bromont, QC [1] и лаборатории IBM Deutschland Research & Development GmbH, Бёблинген , Германия. IBM анонсировала серверы на базе POWER7 8 февраля 2010 г. [2] [3]

8-процессорный процессор IBM Power7 4 ГГц и IHS от IBM 9119
IBM Power7, 8-процессорный процессор с тактовой частотой 4 ГГц, лучший по IHS из IBM 9119
8-процессорный нижний процессор IBM Power7 4 ГГц от IBM 9119
Съемный 8-процессорный промежуточный преобразователь IBM Power7 4 ГГц от IBM 9119

История [ править ]

В ноябре 2006 года IBM выиграла контракт DARPA на 244 миллиона долларов на разработку архитектуры суперкомпьютера с петафактором до конца 2010 года в рамках проекта HPCS . В контракте также указано, что архитектура должна быть коммерчески доступной. Предложение IBM, PERCS (производительная, простая в использовании, надежная компьютерная система), благодаря которому они выиграли контракт, основано на процессоре POWER7, операционной системе AIX и общей параллельной файловой системе . [4]

Одна из функций, над которой совместно работали IBM и DARPA, - это модификация аппаратного обеспечения адресации и таблицы страниц для поддержки глобального общего пространства памяти для кластеров POWER7. Это позволяет ученым-исследователям программировать кластер, как если бы это была единая система, без использования передачи сообщений. С точки зрения производительности это важно, поскольку некоторые ученые не знакомы с MPI или другими методами параллельного программирования, используемыми в кластерах. [5]

Дизайн [ править ]

Суперскалярная симметричная многопроцессорная архитектура POWER7 представляет собой существенную эволюцию архитектуры POWER6, в которой больше внимания уделяется энергоэффективности за счет использования нескольких ядер и одновременной многопоточности (SMT). [6] Архитектура POWER6 была создана с нуля, чтобы максимизировать частоту процессора за счет энергоэффективности. Он достиг замечательной частоты 5 ГГц. В то время как POWER6 оснащен двухъядерным процессором, каждый из которых поддерживает двустороннюю одновременную многопоточность (SMT), процессор IBM POWER 7 имеет до восьми ядер и четыре потока на ядро, что в сумме составляет 32 одновременных потока. [7]

IBM заявила на ISCA 29 [8], что пиковая производительность достигается за счет высокочастотных схем с 10–20 задержками FO4 на ступень конвейера за счет энергоэффективности. Однако двоичный модуль с плавающей запятой POWER6 обеспечивает «6- тактный конвейер из 13 FO4 ». [9] [ требуется пояснение ] Таким образом, конвейер для ЦП POWER7 был снова изменен, как и для проектов POWER5 и POWER6. В некоторых отношениях эта переработка аналогична повороту Intel в 2005 году, когда была оставлена ​​микроархитектура x86 7-го поколения P4.

Технические характеристики [ править ]

Суперскалярный симметричный мультипроцессор POWER7 доступен с 4, 6 или 8 физическими ядрами на микрочип, в исполнении от 1 до 32, с до 1024 SMT и немного другой микроархитектурой и интерфейсами для поддержки расширенных / дополнительных спецификаций в отношении Power ISA и / или другие системные архитектуры. Например, в Supercomputing (HPC) System Power 775 он упакован как 32-процессорный четырехчиповый модуль (QCM) с 256 физическими ядрами и 1024 SMT. [10] Также есть специальный TurboCoreрежим, который может отключать половину ядер восьмиядерного процессора, но эти 4 ядра имеют доступ ко всем контроллерам памяти и кэш-памяти третьего уровня на повышенных тактовых частотах. Это повышает производительность каждого ядра, что важно для рабочих нагрузок, требующих максимальной последовательной производительности за счет снижения параллельной производительности. Режим TurboCore может снизить «затраты на программное обеспечение вдвое для тех приложений, которые лицензируются по числу ядер, при одновременном повышении производительности по числу ядер этого программного обеспечения». [11] Новые масштабируемые высокопроизводительные серверы IBM Power 780 с новым режимом оптимизации рабочих нагрузок TurboCore и обеспечивают удвоенную производительность на ядро ​​систем на базе POWER6. [11]

Каждое ядро ​​поддерживает четырехстороннюю одновременную многопоточность (SMT). POWER7 имеет приблизительно 1,2 миллиарда транзисторов и имеет размер 567 мм 2, изготовленный по 45-нм техпроцессу. Заметным отличием от POWER6 является то, что POWER7 выполняет инструкции не по порядку, а по порядку. Несмотря на снижение максимальной частоты по сравнению с POWER6 (4,25 ГГц против 5,0 ГГц), каждое ядро ​​имеет более высокую производительность, чем POWER6, а количество ядер каждого процессора в 4 раза больше.

POWER7 имеет следующие характеристики: [12] [13]

  • 45 нм процесс SOI , 567 мм 2
  • 1,2 миллиарда транзисторов
  • Тактовая частота 3,0–4,25 ГГц
  • макс.4 микросхемы на четырехчиповый модуль
    • 4, 6 или 8 ядер C1 на чип
      • 4 потока SMT на ядро ​​C1 (доступно в AIX 6.1 TL05 (выпуск в апреле 2010 г.) и выше)
      • 12 исполнительных блоков на ядро ​​C1:
        • 2 устройства с фиксированной точкой
        • 2 единицы загрузки / магазина
        • 4 модуля с плавающей запятой двойной точности
        • 1 векторный блок, поддерживающий VSX
        • 1 десятичный блок с плавающей запятой
        • 1 филиал
        • 1 блок регистра условий
    • 32 + 32 КБ кэш-памяти L1 для инструкций и данных (на каждое ядро) [14]
    • Кэш L2 256 КБ (на ядро ​​C1)
    • Кэш L3 4 МБ на каждое ядро ​​C1 с поддержкой до 32 МБ. Кэш-память реализована в eDRAM , которая не требует такого количества транзисторов на ячейку, как стандартная SRAM [5], поэтому позволяет использовать кэш большего размера при использовании той же области, что и SRAM.

В технической спецификации дополнительно указывается: [15]

Каждое ядро ​​процессора POWER7 реализует агрессивное выполнение инструкций вне очереди (OoO), чтобы обеспечить высокую эффективность использования доступных путей выполнения. Процессор POWER7 имеет блок последовательности инструкций, который может отправлять до шести инструкций за цикл в набор очередей. Блокам выполнения инструкций может быть передано до восьми инструкций за цикл.

Это дает следующие теоретические показатели производительности одинарной точности (SP) (на основе 8-ядерной реализации 4,14 ГГц):

  • макс 99,36 GFLOPS на ядро
  • макс 794,88 GFLOPS на чип

4 64-битных модуля SIMD на ядро ​​и 128-битный модуль SIMD VMX на ядро ​​могут выполнять 12 операций умножения-сложения за цикл, что дает 24 операции SP FP за цикл. На частоте 4,14 ГГц это дает 4,14 миллиарда * 24 = 99,36 SP GFLOPS, а на 8 ядрах - 794,88 SP GFLOPS.

Пиковая производительность с двойной точностью (DP) составляет примерно половину от максимальной производительности SP.

Для сравнения, последняя микроархитектура от Intel, Haswell (вышедшая на 3 года позже, чем POWER7!), Может выполнять 16 DP FLOP или 32 SP FLOP за цикл (8/16 DP / SP слияния с умножением и сложением на 2 × 256 -разрядные AVX2 векторных единицы FP). [16] На частоте 3,4 ГГц (i7-4770) это означает 108,8 SP GFLOPS на ядро ​​и 435,2 SP GFLOPS на пиковую производительность для 4-ядерного чипа, что дает примерно одинаковые уровни производительности на каждое ядро, без учета эффектов или преимуществ Технология Intel Turbo Boost .

Это теоретическое сравнение пиковой производительности справедливо и на практике: POWER7 и i7-4770 получили одинаковые оценки в тестах SPEC CPU2006 с плавающей запятой (однопоточные): 71,5 [17] для POWER7 против 74,0 [18] для i7-4770.

Обратите внимание, что чип POWER7 значительно превзошел (2 × –5 ×) i7 в некоторых тестах (bwaves, cactusADM, lbm), а также был значительно медленнее (2x-3x) в большинстве других. Это указывает на основные архитектурные различия между двумя чипами / материнскими платами / системами памяти и т. Д .: они были разработаны с учетом различных рабочих нагрузок.

Однако в целом, в очень широком смысле, можно сказать, что производительность с плавающей запятой у POWER7 аналогична таковой у Haswell i7.

POWER7 + [ редактировать ]

IBM представила процессор POWER7 + на конференции Hot Chips 24 в августе 2012 года. Это обновленная версия с более высокими скоростями, большим объемом кэш-памяти и встроенными ускорителями. Он изготовлен по 32-нм техпроцессу. [19]

Первыми коробками с процессорами POWER7 + были серверы IBM POWER 770 и 780. Чипы имеют до 80 МБ кэш-памяти третьего уровня (10 МБ на ядро), повышенную тактовую частоту (до 4,4 ГГц) и 20 разделов LPAR на ядро. [20]

Продукты [ править ]

По состоянию на октябрь 2011 года ассортимент систем POWER7 включает модели «Express» (710, 720, 730, 740 и 750), модели Enterprise (770, 780 и 795) и модели высокопроизводительных вычислений (755 и 775). Корпоративные модели отличаются наличием возможностей Capacity on Demand. Максимальные характеристики приведены в таблице ниже.

IBM также предлагает 5 BladeCenters на базе POWER7 . [21] Технические характеристики приведены в таблице ниже.

Следующие суперкомпьютерные проекты используют процессор POWER7:

  • PERCS
  • Watson

См. Также [ править ]

  • МОЩНОСТЬ6
  • Микропроцессоры IBM POWER
  • rPerf

Ссылки [ править ]

  1. ^ Authier, Isabelle (17 февраля 2011). "IBM Bromont au coeur de Watson" . Киберпресс . Киберпресс . Проверено 17 февраля 2011 года .
  2. ^ «IBM представляет новые системы POWER7 для управления сервисами, обрабатывающими все больше и больше данных» . IBM . 8 февраля 2010 . Проверено 13 сентября 2010 года .
  3. ^ «Новые системы оптимизации рабочих нагрузок POWER7» . YouTube . IBM. 5 февраля 2010 . Проверено 22 февраля 2010 года .
  4. ^ «Крэй, IBM выбрала для вычислительных усилий США в петафлопах» . EE Times . Проверено 22 Ноябрь 2 006 .
  5. ^ a b «Hot Chips XXI Preview» . Технологии реального мира . Проверено 17 августа 2009 года .
  6. ^ Кантер, Дэвид. «Новая информация о POWER7» . Проверено 11 августа 2011 года .
  7. ^ Вархол, Питер. «IBM запускает процессор POWER 7 9 февраля 2010 г.» . Проверено 11 августа 2011 года .
  8. ^ «Заметки конференции ISCA 29» . Проверено 11 августа 2011 года .
  9. ^ "Архитектура процессора IBM Tips Power6" . Информационная неделя . Проверено 6 февраля 2006 года .
  10. ^ «Решение IBM Power Systems 775 HPC» (PDF) . Проверено 28 апреля 2020 .
  11. ^ a b «IBM представляет новые системы POWER7 для управления сервисами, обрабатывающими все больше и больше данных» . IBM.com . Проверено 11 августа 2011 года .
  12. ^ «IBM в образовании - Бизнес и технологические решения» . IBM . Архивировано из оригинала 8 декабря 2012 года . Проверено 8 июля 2009 года .
  13. ^ "8-ядерный IBM POWER7: вдвое мощнее, вдвое меньше транзисторов" . Ars Technica . Проверено 1 сентября 2009 года .
  14. ^ "Технические характеристики Bluewater HW" . Национальный центр суперкомпьютерных приложений . Источник +31 декабрь 2009 .
  15. ^ «IBM Power 770 и 780: технический обзор и введение» (PDF) . IBM . Проверено 21 августа 2011 года .
  16. Ананд Лал Шимпи (5 октября 2012 г.). «Анализ архитектуры Intel Haswell: создание нового ПК и нового Intel» . Anandtech .
  17. ^ "Результат SPEC CFP2006, сервер IBM Power 780 (3,86 ГГц, 16 ядер)" .
  18. ^ "Результат SPEC CFP2006, материнская плата Intel DH87MC (Intel Core i7-4770)" .
  19. ^ Горячие чипы: обновление для IBM Power7
  20. ^ Реестр: запуск сервера Power7 +.
  21. ^ "Оборудование IBM Power Systems - Блейд-серверы" . IBM . Проверено 30 января 2012 года .

Внешние ссылки [ править ]

  • Системы IBM POWER7 - страница продукта IBM POWER7
  • Технология и системы IBM POWER7 - журнал исследований и разработок IBM (опубликован IEEE Xplore)
  • IBM выиграла DARPA HPCS Phase-III
  • IBM выиграла DARPA HPCS Phase-II
  • У IBM есть PERCS
  • POWER 780 SPECint_rate_base2006 результат
  • IBM BladeCenter PS703 и PS704: технический обзор и введение