Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

POWER10 обозначает предлагаемое семейство суперскалярных , многопоточных , симметричных мультипроцессоров на основе Power ISA с открытым исходным кодом , о котором было объявлено в августе 2020 года на конференции Hot Chips ; Системы с процессорами POWER10 предназначены для клиентов в четвертом квартале 2021 года.

Процессор рассчитан на 15 доступных ядер , но запасное ядро ​​будет включено во время производства для экономичного решения проблем с производительностью .

Процессоры на базе POWER10 будут производиться Samsung по 7-нм техпроцессу с 18 слоями металла и 18 миллиардами транзисторов на кремниевом кристалле 602 мм 2 . [1] [2] [3] [4]

Основными особенностями POWER10 являются более высокая производительность на ватт и лучшая архитектура памяти и ввода-вывода с упором на рабочие нагрузки с искусственным интеллектом (AI). [5]

Дизайн [ править ]

Каждое ядро ​​POWER10 увеличено вдвое на большинстве функциональных блоков по сравнению с его предшественником POWER9 . Ядро является восьмипоточным многопоточным (SMT8) и имеет кеш-память L1 для инструкций по 48 кБ и данных по 32 кБ , большой кэш L2 2 МБ и очень большой буфер быстрого преобразования (TLB) с 4096 записями. [3] Значительно уменьшены циклы задержки для различных этапов кеширования и TLB. Каждое ядро ​​имеет восемь исполнительных секторов, каждый с одним блоком с плавающей запятой (FPU), арифметико-логическим блоком (ALU), предсказателем ветвления , блоком загрузки-сохранения и SIMD-механизмом , который может быть загружен128-битные (64 + 64) инструкции из новых инструкций префикса / предохранителя Power ISA v.3.1. Каждый исполнительный срез может обрабатывать 20 инструкций каждый, с резервной копией общей таблицей инструкций на 512 записей и подачей в очередь загрузки шириной 128 записей (64 однопоточных) и очередь хранилища шириной 80 записей (40 однопоточных). Улучшенные функции прогнозирования ветвлений удвоили точность. Ядро имеет четыре механизма поддержки математических вычислений (MMA) для лучшей обработки кода SIMD, особенно для инструкций умножения матриц, где рабочие нагрузки логического вывода AI имеют 20-кратное увеличение производительности. [6]

Весь процессор имеет две «полусферы» с восемью ядрами, совместно использующие кэш L3 объемом 64 МБ, что в сумме составляет 16 ядер и кеш-память L3 объемом 128 МБ. Из-за проблем с выходом по крайней мере одно ядро ​​всегда отключено, уменьшая кэш L3 на 8 МБ до полезного общего количества 15 ядер и 120 МБ кэша L3. Каждый чип также имеет восемь криптоускорителей, разгружающих общие алгоритмы, такие как AES и SHA-3 .

Увеличенное тактовое стробирование и переработанная микроархитектура на каждом этапе, вместе с инструкциями слияния / префикса, позволяющими больше работать с меньшим количеством рабочих единиц, и более интеллектуальным кешем с меньшими задержками памяти и эффективной маркировкой адресов, сокращающей промахи в кэше, позволяет ядру POWER10 потреблять половину энергии, чем POWER9. . В сочетании с улучшением вычислительных мощностей до 30% производительность всего процессора на ватт в 2,6 раза выше, чем у его предшественника. А в случае установки двух ядер в один и тот же модуль - до 3 раз быстрее при том же энергопотреблении.

Поскольку ядра могут действовать как восемь логических процессоров, 15-ядерный процессор для операционной системы выглядит как 120 ядер . На двухчиповом модуле это становится 240 одновременных потоков на сокет .

I / O [ править ]

В чипах полностью переработана память и архитектура ввода-вывода. Интерфейс открытой памяти ( OMI ) обеспечивает ОЗУ с чрезвычайно низкой задержкой и высокой пропускной способностью. Использование последовательной связи памяти с внешними контроллерами сокращает количество каналов передачи сигналов к микросхеме и от нее, увеличивает пропускную способность и делает процессор независимым от того, какая технология используется в памяти, что делает систему гибкой и надежной. [4]

ОЗУ может быть любым, от DDR3 до DDR5 до GDDR и HBM или постоянной памяти , все в зависимости от того, что практично для приложения.

  • DDR4 - Поддержка до 4 ТБ ОЗУ, 410 ГБ / с, задержка 10 нс
  • GDDR6 - до 800 ГБ / с
  • Постоянное хранилище - до 2 ПБ

POWER10 обеспечивает шифрование данных без потери производительности на всех этапах - от ОЗУ, ускорителей и узлов кластера до данных в состоянии покоя.

POWER10 поставляется с функцией PowerAXON , позволяющей от микросхемы к микросхеме, от системы к системе и шины OpenCAPI для ускорителей, ввода-вывода и других высокопроизводительных когерентных периферийных устройств кэширования . Он управляет обменом данными между узлами в кластере SCM с 16 разъемами или в кластере DCM с 4 разъемами. Он также управляет семантикой памяти для кластеризации систем, обеспечивая доступ для загрузки / сохранения из ядра до 2 ПБ ОЗУ на всем кластере POWER10. IBM называет эту функцию Memory Inception .

И OMI, и PowerAXON могут обрабатывать данные со скоростью 1 ТБ / с вне кристалла.

POWER10 включает PCIe 5 . SCM имеет 32 канала, а DCM - 64 канала PCIe 5. IBM и Nvidia согласились, что включение NVLink в POWER10 будет избыточным, поскольку PCIe 5 достаточно быстр для подключения графических процессоров, поэтому NVLink отсутствует. [3] Поддержка NVLink на кристалле ранее была уникальным аргументом в пользу POWER8 и POWER9.

Варианты [ править ]

POWER10 будет доступен в двух вариантах, в зависимости от прошивки в упаковке. Несмотря на то, что микросхемы идентичны, а разница установлена ​​в прошивке, ее не могут изменить ни пользователь, ни сама IBM. [7]

  • 15 × SMT8 ядер
  • 30 × SMT4 ядер

Модули [ править ]

POWER10 приходит в два флип - чип-пластиковые массив земли сетки (FC-ПМГК) пакеты , [8] один единый модуль чип (SCM) , и один двойной модуль микросхемы (ДХМ).

  • SCM - 4+ ГГц, до 15 ядер SMT8. Может быть объединено до 16 розеток. x32 PCIe 5 полос.
  • DCM - 3,5+ ГГц, до 30 ядер SMT8. Можно объединить до четырех розеток. x64 PCIe 5 полос. DCM находится в том же температурном диапазоне, что и предыдущие предложения.

Поддержка операционной системы [ править ]

  • Linux , версия 5.9 [9]
  • PowerVM с вложенной виртуальной машиной на основе ядра (KVM)
  • AIX [10]
  • IBM i [10]

Сравнение с более ранними процессорами POWER [ править ]

Переход на 7-нм техпроцесс приводит к значительному повышению производительности на ватт.

Возможности PowerAXON теперь расширяются до 2 ПБ унифицированного пространства кластерной памяти, совместно используемого несколькими узлами кластера , и включают поддержку PCIe 5 .

Новые инструкции SIMD и новые типы данных, включая bfloat16 , INT4 (INTEGER) и INT8 (BIGINT) . [11] [12] направлены на улучшение рабочих нагрузок ИИ.

См. Также [ править ]

  • Микропроцессоры IBM POWER
  • Фонд OpenPOWER
  • МОЩНОСТЬ9

Ссылки [ править ]

  1. ^ Д-р Катресс, Ян (2020-08-17). «Онлайн-блог Hot Chips 2020: процессор IBM POWER10 на базе 7-нм техпроцесса Samsung» . AnandTech .
  2. ^ Quach, Katyanna (2020-08-17). «IBM сокращает количество процессоров Power10 до 7-нм с Samsung, поставка должна быть произведена к концу 2021 года» . Реестр .
  3. ^ a b c Шиллинг, Андреас (17 августа 2020 г.). «IBM Power10 предлагает 30 ядер с SMT8, PCIe 5.0 и DDR5» . Оборудование LUXX (на немецком языке).
  4. ^ a b Кеннеди, Патрик (2020-08-17). «IBM POWER10 в поисках Святого Грааля вычислений» . ServeTheHome .
  5. ^ «IBM представляет процессор IBM POWER10 следующего поколения» . IBM . 2020-08-17.
  6. ^ Рассел, Джон (2020-08-17). «IBM представляет Power10; рекламирует новую схему памяти, безопасность и логический вывод» . HPCwire .
  7. ^ Прикетт Морган, Тимоти (2020-08-31). «Возможные проекты IBM для систем Power10» . ИТ-джунгли .
  8. ^ Оимет, Сильвен и Кейси, Джон и Марстон, Кеннет и Muncy, Дженнифер и Корбин, Джон и Jadhav, Virendra и Wassick, Том и Depatie, Isabelle (июнь 2008). «Разработка 50-миллиметрового пакета пластикового наземного массива с двойным флип-чипом для серверных приложений»: 1900–1906. DOI : 10.1109 / ECTC.2008.4550241 . Цитировать журнал требует |journal=( помощь )CS1 maint: несколько имен: список авторов ( ссылка )
  9. ^ Ларабель, Майкл (2020-08-09). «Linux 5.9 обеспечивает дополнительную поддержку IBM POWER10, новый / более быстрый системный вызов SCV ABI» . Фороникс .
  10. ^ a b Прикетт Морган, Тимоти (2019-08-06). «Говоря о высокой пропускной способности с помощью IBM POWER10 Architect» . Следующая платформа .
  11. ^ Патрицио, Энди (18 августа 2020). «IBM подробно рассказывает о процессоре POWER10 следующего поколения» . Сетевой мир .
  12. ^ "Псевдонимы типов данных" . 26 августа 2020.