мощность10


Power10суперскалярное , многопоточное , многоядерное семейство микропроцессоров , основанное на Power ISA с открытым исходным кодом и анонсированное в августе 2020 года на конференции Hot Chips ; системы с процессорами Power10. Общедоступно с сентября 2021 года на сервере IBM Power10 Enterprise E1080.

Процессор рассчитан на 15 доступных ядер , но при производстве будет включено запасное ядро, чтобы с минимальными затратами решить проблемы с производительностью .

Процессоры на базе Power10 будут производиться компанией Samsung по 7-нм техпроцессу с 18 слоями металла и 18 миллиардами транзисторов на кремниевом кристалле площадью 602 мм 2 . [1] [2] [3] [4]

Основными особенностями Power10 являются более высокая производительность на ватт и улучшенная архитектура памяти и ввода-вывода с упором на рабочие нагрузки искусственного интеллекта (ИИ). [5]

Каждое ядро ​​Power10 удвоило большинство функциональных единиц по сравнению с его предшественником POWER9 . Ядро является восьмипоточным ( SMT8 ) и имеет 48 КБ инструкций и 32 КБ кэша L1 для данных , 2 МБ большого кэша L2 и очень большой резервный буфер трансляции (TLB) с 4096 записями. [3] Циклы задержки для различных этапов кэша и TLB были значительно сокращены. Каждое ядро ​​имеет восемь исполнительных слайсов, каждый с одним блоком операций с плавающей запятой (FPU), арифметико-логическим блоком (ALU), предсказателем ветвления , блоком загрузки-сохранения и SIMD-механизмом , которые можно подавать.128-битные (64+64) инструкции из новых инструкций префикса/фьюза Power ISA v.3.1. Каждый исполнительный слайс может обрабатывать по 20 инструкций, резервируемых общей таблицей инструкций на 512 записей и направляемых в очередь загрузки на 128 записей (64 однопоточных) и очередь сохранения на 80 записей (40 однопоточных). Улучшенные функции прогнозирования переходов удвоили точность. Ядро имеет четыре механизма поддержки матричной математики (MMA) для лучшей обработки кода SIMD, особенно для инструкций умножения матриц , где рабочие нагрузки вывода ИИ имеют 20-кратное увеличение производительности. [6]

Процессор имеет два «полушария» по восемь ядер в каждом, разделяя кэш-память L3 объемом 64 МБ, всего 16 ядер, и кэш-память L3 объемом 128 МБ. Из-за проблем с производительностью по крайней мере одно ядро ​​​​всегда отключено, что уменьшает кэш-память L3 на 8 МБ до общего количества полезных 15 ядер и 120 МБ кэш-памяти L3. Каждый чип также имеет восемь криптоускорителей , разгружающих общие алгоритмы, такие как AES и SHA-3 .