Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Процессор UltraSPARC T1

Sun Microsystems " UltraSPARC T1 микропроцессор , известный до его 14 ноября 2005 года заявления его развития под кодовым названиемНиагара “, является многопоточность , многоядерные CPU . ЦП, разработанный для снижения энергопотребления серверных компьютеров , обычно потребляет мощность 72 Вт на частоте 1,4 ГГц.

Компания Afara Websystems стала пионером в разработке радикального многопоточного SPARC. Компания была куплена Sun, и интеллектуальная собственность стала основой линейки процессоров CoolThreads, начиная с T1. T1 - это новая микропроцессорная реализация SPARC, которая соответствует спецификации UltraSPARC Architecture 2005 и выполняет полный набор команд SPARC V9 . Sun производила два предыдущих многоядерных процессора ( UltraSPARC IV и IV +), но UltraSPARC T1 был ее первым микропроцессором, который одновременно является многоядерным имногопоточный. Безопасность была встроена с самого первого выпуска на кремнии, с аппаратными криптографическими модулями в T1, в отличие от процессоров общего назначения от конкурирующих производителей того времени. Процессор доступен с четырьмя, шестью или восемью ядрами ЦП, каждое из которых может одновременно обрабатывать четыре потока . Таким образом, процессор может одновременно обрабатывать до 32 потоков.

UltraSPARC T1 можно разделить аналогично высокопроизводительным SMP- системам Sun. Таким образом, несколько ядер могут быть разделены для запуска одного или группы процессов и / или потоков, в то время как другие ядра работают с остальными процессами в системе.

Ядра [ править ]

План микропроцессора Т1
Конвейер UltraSPARC T1

UltraSPARC T1 был разработан с нуля как многопоточный специализированный процессор и, таким образом, представил совершенно новую архитектуру для достижения производительности. Вместо того, чтобы пытаться сделать каждое ядро ​​максимально интеллектуальным и оптимизированным, целью Sun было запустить как можно больше параллельных потоков и максимально использовать конвейер каждого ядра. Ядра T1 менее сложны, чем у конкурирующих процессоров, что позволяет разместить 8 ядер на одном кристалле. Ядра не имеют работы вне очереди или значительного объема кеша .

Однопоточные процессоры сильно зависят от больших кешей для своей производительности, потому что промахи кеша приводят к ожиданию, пока данные будут извлечены из основной памяти. За счет увеличения размера кэша вероятность промаха кэша уменьшается, но влияние промаха остается тем же.

Ядра T1 в значительной степени обходят проблему пропусков кеша из-за многопоточности. Каждое ядро ​​представляет собой цилиндрический процессор , то есть в каждом цикле переключается между доступными потоками. Когда происходит событие с большой задержкой, такое как промах в кэше, поток выводится из ротации, в то время как данные загружаются в кэш в фоновом режиме. После завершения события с большой задержкой поток снова становится доступным для выполнения. Совместное использование конвейера несколькими потоками может замедлить работу каждого потока, но общая пропускная способность (и использование) каждого ядра намного выше. Это также означает, что влияние промахов кэша значительно снижается, и T1 может поддерживать высокую пропускную способность с меньшим объемом кэша. Кэш больше не должен быть достаточно большим, чтобы содержать весь или большую часть «рабочего набора», только последние промахи кеша каждого потока.

Тесты показывают, что этот подход очень хорошо работает на коммерческих (целочисленных) многопоточных рабочих нагрузках, таких как серверы приложений Java, серверы приложений планирования ресурсов предприятия (ERP), серверы электронной почты (например, Lotus Domino ) и веб-серверы. Эти тесты показывают, что каждое ядро ​​UltraSPARC T1 более мощное, чем одноядерный, однопоточный UltraSPARC III примерно 2001 года, и при сравнении чипа к чипу значительно превосходит другие процессоры в многопоточных целочисленных рабочих нагрузках. [ необходима цитата ]

Физические характеристики [ править ]

UltraSPARC T1 содержит 279 миллионов транзисторов и имеет площадь 378 мм 2 . Он был изготовлен компанией Texas Instruments (TI) по их процессу 90 нм, комплементарному металл-оксид-полупроводник (CMOS) с девятью уровнями межсоединения из меди . [1] Каждое ядро ​​имеет кэш инструкций L1 размером 16 КБ и кэш данных 8 КБ. Кэш L2 составляет 3 МБ, а кэш L3 отсутствует.

Системы [ править ]

Сервер Sun Fire T1000

Процессор T1 можно найти в следующих продуктах Sun и Fujitsu Computer Systems :

  • Серверы Sun / Fujitsu / Fujitsu Siemens SPARC Enterprise T1000 и T2000
  • Серверы Sun Fire T1000 и T2000
  • Сервер Sun Netra T2000
  • Лезвие Sun Netra CP3060
  • Серверный модуль Sun Blade T6300

Целевой рынок [ править ]

Микропроцессор UltraSPARC T1 уникален по своим сильным и слабым сторонам и поэтому ориентирован на определенные рынки. Вместо того, чтобы использоваться для высокопроизводительных приложений обработки чисел и сверхвысокой производительности, чип нацелен на сетевые серверы с высокими требованиями, такие как веб-серверы с высоким трафиком и приложения Java, ERP и CRM среднего уровня. серверы, которые часто используют большое количество отдельных потоков. Одним из ограничений конструкции T1 является то, что один блок с плавающей запятой(FPU) используется всеми 8 ядрами, что делает T1 непригодным для приложений, выполняющих много вычислений с плавающей запятой. Однако, поскольку предполагаемые рынки процессоров обычно не используют много операций с плавающей запятой, Sun не ожидала, что это будет проблемой. Sun предоставляет инструмент для анализа уровня параллелизма приложения и использования инструкций с плавающей запятой, чтобы определить, подходит ли оно для использования на платформе T1 или T2. [2]

Помимо обработки уровня веб-приложений и приложений, UltraSPARC T1 может хорошо подходить для небольших приложений баз данных, которые имеют большое количество пользователей. Один клиент опубликовал результаты, показывающие, что приложение MySQL, работающее на сервере UltraSPARC T1, работает в 13,5 раз быстрее, чем на сервере AMD Opteron. [3]

Виртуализация [ править ]

T1 - это первый процессор SPARC, поддерживающий режим выполнения Hyper-Privileged. Гипервизор SPARC работает в этом режиме и может разделить систему T1 на 32 логических домена , каждый из которых может запускать экземпляр операционной системы.

В настоящее время поддерживаются Solaris , Linux , NetBSD и OpenBSD .

Проблемы с лицензированием программного обеспечения [ править ]

Традиционно коммерческие программные пакеты, такие как Oracle Database, взимают плату с клиентов в зависимости от количества процессоров, на которых работает программное обеспечение. В начале 2006 года Oracle изменила модель лицензирования, введя коэффициент процессора . С коэффициентом процессора 0,25 для T1 8-ядерный T2000 требует только лицензии на 2 процессора. [4]

«Таблица коэффициентов ядра процессора Oracle» [5] с тех пор регулярно обновлялась по мере появления на рынке новых процессоров.

В третьем квартале 2006 года IBM представила концепцию ценообразования Value Unit (VU). Каждое ядро ​​T1 составляет 30 PVU (каждое ядро ​​T2 - 50 PVU, а T3 - 70 PVU) вместо значения по умолчанию в 100 PVU на ядро. [6]

Слабые стороны [ править ]

T1 предлагал только один модуль с плавающей запятой для совместного использования 8 ядрами, что ограничивало использование в средах HPC. Этот недостаток был устранен с помощью последующего процессора UltraSPARC T2 , который включал 8 модулей с плавающей запятой, а также другие дополнительные функции.

Кроме того, T1 был доступен только в однопроцессорных системах, что ограничивало вертикальную масштабируемость в крупных корпоративных средах. Этот недостаток был смягчен с помощью следующего за ним « UltraSPARC T2 Plus » [7], а также SPARC T3 и SPARC T4 следующего поколения . Все UltraSPARC T2 +, SPARC T3 и SPARC T4 предлагают конфигурации с одним, двумя и четырьмя сокетами.

T1 имел выдающуюся пропускную способность с огромным количеством потоков, поддерживаемых процессором, но старые приложения, обремененные узкими местами в одном потоке, иногда демонстрировали низкую общую производительность. Слабость однопоточных приложений была устранена с помощью следующего процессора SPARC T4 . Количество ядер T4 было уменьшено до 8 (с 16 на T3), ядра были сделаны более сложными, тактовая частота была почти удвоена - все это способствовало повышению производительности однопоточного процессора (от 300% до 500% по сравнению с предыдущими поколениями. [8]Были предприняты дополнительные усилия по добавлению «API критического потока», в котором операционная система обнаруживала узкое место и временно выделяла ресурсы всего ядра вместо 1 (из 8) потоков целевым процессам приложений, демонстрирующим однопоточный ЦП. связанное поведение. [9] Это позволило T4 уникальным образом устранить узкие места в однопоточном режиме, при этом не пришлось идти на компромисс в архитектуре в целом для достижения огромной многопоточной пропускной способности.

Настройка приложения [ править ]

Использование огромного количества параллелизма на уровне потоков (TLP), доступного на платформе CoolThreads, может потребовать различных методов разработки приложений, чем для традиционных серверных платформ. Использование TLP в приложениях - ключ к достижению хорошей производительности. Sun опубликовала ряд Sun BluePrints, чтобы помочь программистам приложений в разработке и развертывании программного обеспечения на серверах CoolThreads на базе T1 или T2. Основная статья Настройка приложений на UltraSPARC T1 Chip Многопоточность Systems , [10] рассматриваются вопросы для общих прикладных программистов. Также есть статья BluePrints об использовании модулей криптографического ускорителя на процессорах T1 и T2. [11]

Тематические исследования [ править ]

На платформе CoolThreads был оптимизирован широкий спектр приложений, включая Symantec Brightmail AntiSpam, [12] приложения Oracle Siebel , [13] и Sun Java System Web Proxy Server . [14] Sun также задокументировала свой опыт переноса собственного интернет-магазина на серверный кластер T2000 [15] и опубликовала две статьи о веб-консолидации на CoolThreads с использованием контейнеров Solaris . [16] [17]

У Sun была страница настройки производительности для ряда приложений с открытым исходным кодом , включая MySQL , PHP , gzip и ImageMagick . [18] Правильная оптимизация для систем CoolThreads может привести к значительному выигрышу: когда компилятор Sun Studio используется с рекомендованными настройками оптимизации, производительность MySQL повышается на 268% по сравнению с использованием только флага -O3 .

Современные и последующие проекты [ править ]

Архитектура Coolthreads ™, начиная с UltraSPARC T1 (с ее положительными и отрицательными аспектами), безусловно, оказала влияние на параллельные и будущие разработки процессоров SPARC.

"Рок" [ править ]

Оригинальный UltraSPARC T1 был разработан только для однопроцессорных систем и не поддерживает SMP. «Rock» был более амбициозным проектом, предназначенным для поддержки серверных архитектур с несколькими микросхемами, ориентированного на традиционные рабочие нагрузки, связанные с данными, такие как базы данных. Было видно , как более Последующий по процессорам Sun, SMP , такие как UltraSPARC IV , а не замена для UltraSPARC T1 или T2, но был отменен в срок от приобретения Oracle, Солнца .

UltraSPARC T2 [ править ]

Ранее известный под кодовым названием Niagara 2 , являющийся продолжением UltraSPARC T1, T2 имеет восемь ядер. В отличие от T1, каждое ядро ​​поддерживает 8 потоков на ядро, один FPU на ядро, один усовершенствованный криптографический блок на ядро ​​и встроенные в ЦП сетевые контроллеры 10 Gigabit Ethernet.

UltraSPARC T2 Plus [ править ]

В феврале 2007 года Sun объявила на своем ежегодном саммите аналитиков, что ее проект одновременной многопоточности третьего поколения под кодовым названием Victoria Falls был выпущен в октябре 2006 года. Двухсокетный сервер (2 RU ) будет иметь 128 потоков, 16 ядер, и увеличение производительности в 65 раз по сравнению с UltraSPARC III. [7]

На конференции Hot Chips 19 Sun объявила, что у водопада Виктория будут двух- и четырехсторонние серверы. Таким образом, один 4-сторонний SMP-сервер будет поддерживать 256 параллельных аппаратных потоков. [19]

В апреле 2008 года Sun выпустила двусторонние серверы UltraSPARC T2 Plus, SPARC Enterprise T5140 и T5240.

В октябре 2008 года Sun выпустила 4-процессорный сервер UltraSPARC T2 Plus SPARC Enterprise T5440. [20]

SPARC T3 [ править ]

В октябре 2006 года Sun сообщила, что Niagara 3 будет построена по 45-нм техпроцессу. [ необходима цитата ] В июне 2008 года The Register сообщил, что микропроцессор будет иметь 16 ядер, ошибочно предполагая, что каждое ядро ​​будет иметь 16 потоков. Во время конференции Hot Chips 21 Sun сообщила, что у этого чипа всего 16 ядер и 128 потоков. [21] [22] Согласно презентации ISSCC 2010:

«16-ядерный процессор SPARC SoC обеспечивает до 512 потоков в 4-процессорной бесклеевой системе для максимальной пропускной способности. Кэш L2 6 МБ со скоростью 461 ГБ / с и 308-контактный ввод-вывод SerDes со скоростью 2,4 Тбит / с обеспечивают необходимую пропускную способность. . Шесть тактовых частот и четыре области напряжения, а также методы управления питанием и схемы оптимизируют производительность, мощность, изменчивость и дают компромиссы для кристалла 377 мм 2 ». [23]

SPARC T4 [ править ]

ЦП T4 был выпущен в конце 2011 года. Новый ЦП T4 упадет с 16 ядер (на T3) до 8 ядер (как используется на T1, T2 и T2 +). В новом дизайне ядра T4 (названном «S3») улучшена производительность для каждого потока за счет введения внеочередного выполнения, а также дополнительно улучшена производительность для однопоточных программ. [24] [25]

В 2010 году Ларри Эллисон объявил, что Oracle предложит Oracle Linux на платформе UltraSPARC, и этот порт должен был быть доступен в сроки T4 и T5. [26]

Джон Фаулер, исполнительный вице-президент по системам Oracle на конференции Openworld 2014, сказал, что в какой-то момент Linux сможет работать на Sparc.[27] [28] [29] [30]

SPARC T5 [ править ]

Новый ЦП T5 имеет 128 потоков по 16 ядрам и изготовлен по 28-нанометровой технологии.

Открытый дизайн [ править ]

21 марта 2006 г. Sun предоставила процессору UltraSPARC T1 доступную под Стандартной общественной лицензией GNU через проект OpenSPARC . [31] Опубликованная информация включает:

  • Исходный код Verilog дизайна UltraSPARC T1;
  • Пакет верификации и имитационные модели;
  • Спецификация ISA (UltraSPARC Architecture 2005);
  • В Solaris 10 моделирования OS изображений.

Ссылки [ править ]

  1. ^ McGhan, Харлан (6 ноября 2006). «Ниагара 2 открывает шлюзы». Отчет микропроцессора .
  2. ^ "cooltst: Инструмент выбора крутых тем" . Блог о характеристиках рабочих нагрузок . Sun Microsystems . 6 апреля 2006 . Проверено 30 мая 2008 .
  3. ^ Томас Рампельберг; Джейсон Дж. Уильямс (09.05.2006). "Круиз с T2k" (PDF) . DigiTar. п. 6 . Проверено 7 февраля 2007 .
  4. ^ «Многоядерные процессоры: влияние на лицензирование процессоров Oracle» (PDF) . Oracle. Архивировано из оригинального (PDF) 20 марта 2007 года . Проверено 12 августа 2007 .
  5. ^ «Таблица коэффициентов ядра процессора Oracle» (PDF) . Oracle . Проверено 8 сентября 2011 года .
  6. ^ «Лицензирование единицы мощности процессора для распределенного ПО» . IBM . Проверено 15 июня 2011 .
  7. ^ a b Фаулер, Джон (6 февраля 2007 г.). «Рост благодаря дизайну» (PDF) . Sun Microsystems . п. 21 . Проверено 7 февраля 2007 .
  8. ^ «Чип Oracle Sparc T4: заплатите ли вы премию Ларри?» . Реестр . Проверено 21 июня 2012 .
  9. ^ «Беседы с новаторами Oracle» . Oracle . Проверено 21 июня 2012 .
  10. ^ «Разработка и настройка приложений на многопоточных системах с чипом UltraSPARC T1» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  11. ^ «Использование криптографических ускорителей в процессорах UltraSPARC T1 и T2» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  12. ^ «Настройка Symantec Brightmail AntiSpam на серверах с процессором UltraSPARC T1 и T2» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  13. ^ «Оптимизация приложений Oracle Siebel на серверах Sun Fire с помощью технологии CoolThreads» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  14. ^ «Высокопроизводительное и надежное решение веб-прокси Sun» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  15. ^ «Объединение Sun Store на серверах Sun Fire T2000» (PDF) . Sun BluePrints Online . Sun Microsystems. Октябрь 2007 . Проверено 9 января 2008 .
  16. ^ «Развертывание Sun Java Enterprise System 2005-Q4 на сервере Sun Fire T2000 с использованием контейнеров Solaris» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  17. ^ «Веб-консолидация на Sun Fire T1000 с использованием контейнеров Solaris» (PDF) . Sun BluePrints Online . Sun Microsystems . Проверено 9 января 2008 .
  18. ^ «Настройка производительности приложений» . Sun Microsystems . Проверено 9 января 2008 .
  19. Стивен, Филлипс (21 августа 2007 г.). «Водопад Виктория: масштабирование процессорных ядер с высокой степенью многопоточности» (PDF) . Sun Microsystems . п. 24 . Проверено 24 августа 2007 .
  20. ^ «Сервер SPARC Enterprise T5440 от Sun и Fujitsu переопределяет корпоративные вычисления среднего уровня с помощью лучших в отрасли ценовых показателей, управления питанием и множества мировых рекордов» . Sun Microsystems . 13 октября 2008 . Проверено 13 октября 2008 .
  21. ^ Санджай Патель, Стивен Филлипс и Аллан Стронг. " Next-Generation многопоточный процессор Sun - Rainbow Falls: Следующее поколение CMT процессор от Sun архивации 2011-07-23 в Wayback Machine ". ГОРЯЧИЕ ЧИПСЫ 21 .
  22. Стоукс, Джон (9 февраля 2010 г.). « Два миллиарда транзисторов: POWER7 и Niagara 3 ». Ars Technica .
  23. ^ Дж. Шин, К. Там, Д. Хуанг, Б. Петрик, Х. Фам, К. Хван, Х. Ли, А. Смит, Т. Джонсон, Ф. Шумахер, Д. Гринхилл, А. Леон, А. . Сильный. «40-нм 16-ядерный 128-поточный процессор CMT SPARC SoC». ISSCC 2010 .
  24. ^ "Чип Oracle SPARC T4: заплатите ли вы премию Ларри?" .
  25. Шон Галлахер (28 сентября 2011 г.), «SPARC T4 выглядит достаточно хорошо, чтобы предотвратить переход к x86, Linux» , arstechnica.com , Ars Technica
  26. ^ Никколай, Джеймс. «Эллисон: Oracle Enterprise Linux переходит на Sparc» . PCWorld.
  27. ^ "Oracle говорит, что чип Sparc M7 положит конец Heartbleed" . Спрашивающий.
  28. ^ "патчи binutils" . binutils ml.
  29. ^ "Патчи ядра Linux" . sparc linux мл.
  30. ^ "Патчи libc" . libc ml.
  31. ^ "Откройте SPARC T1" . oracle.com . Проверено 16 января 2021 .

Внешние ссылки [ править ]

  • OpenSPARC T1 и технические характеристики
  • Обзор OpenSPARC
  • Большой всплеск солнца, Линда Гепперт, в IEEE Spectrum, январь 2005 г.
  • Niagara, 32-процессорный многопоточный процессор SPARC . Авторы: Пунача Конгетира, Катиргамар Айнгаран, Кунле Олукотун , в IEEE Micro, март – апрель 2005 г.