Из Википедии, бесплатной энциклопедии
  (Перенаправлено с микропроцессора Cell )
Перейти к навигации Перейти к поиску

Cell - это многоядерная микропроцессорная микроархитектура, которая сочетает в себе универсальное ядро PowerPC со скромной производительностью с оптимизированными элементами сопроцессора [1], которые значительно ускоряют приложения для обработки мультимедиа и векторной обработки , а также многие другие формы специализированных вычислений. [1]

Он был разработан Sony , Toshiba и IBM , альянсом, известным как STI. Архитектурный проект и первая реализация были выполнены в Центре дизайна STI в Остине, штат Техас, в течение четырехлетнего периода, начиная с марта 2001 г., при бюджете, который, по сообщению Sony, приближается к 400 миллионам долларов США. [2] Cell - это сокращение от Cell Broadband Engine Architecture , обычно сокращенно CBEA полностью или Cell BE частично.

Первым крупным коммерческим приложением Cell была игровая консоль Sony PlayStation 3 , выпущенная в 2006 году. В мае 2008 года суперкомпьютер IBM Roadrunner на базе Cell стал первой системой TOP500 LINPACK с выдержкой 1,0 петафлопс. [3] [4] Компания Mercury Computer Systems также разработала конструкции, основанные на ячейке.

Архитектура Cell включает архитектуру когерентности памяти, которая подчеркивает энергоэффективность, отдает предпочтение полосе пропускания над низкой задержкой и отдает предпочтение пиковой вычислительной производительности над простотой программного кода . По этим причинам Cell считается сложной средой для разработки программного обеспечения . [5] IBM предоставляет платформу разработки на базе Linux, чтобы помочь разработчикам создавать программы для чипов Cell. [6]

История [ править ]

Cell BE, как он отображается в PS3 на материнской плате
Питер Хофсти , один из главных разработчиков микропроцессора Cell.

В середине 2000 года Sony Computer Entertainment , Toshiba Corporation и IBM сформировали альянс, известный как STI, для разработки и производства процессоров. [7]

Центр проектирования STI открылся в марте 2001 года. [8] Ячейка проектировалась в течение четырех лет с использованием усовершенствованных версий инструментов проектирования для процессора POWER4 . Более 400 инженеров из трех компаний работали вместе в Остине при критической поддержке одиннадцати проектных центров IBM. [8] В течение этого периода IBM подала множество патентов на архитектуру Cell, производственный процесс и программную среду. Ранняя патентная версия Broadband Engine представляла собой пакет микросхем, содержащий четыре «элемента обработки», которые были описанием в патенте того, что теперь известно как элемент обработки мощности (PPE). Каждый элемент обработки будет содержать 8«Элементы синергетической обработки» ( SPE ) на микросхеме. Этот пакет микросхем должен был работать с тактовой частотой 4 ГГц, а с 32 SPE, обеспечивающими 32  гигафлопса каждый (четверть точности FP8), Broadband Engine теоретически должен был иметь необработанную вычислительную мощность 1 терафлопс.

Конструкция с 4 СИЗ и 32 СИЗ так и не была реализована. Вместо этого Sony и IBM изготовили конструкцию только с одним PPE и 8 SPE. Эта меньшая конструкция, Cell Broadband Engine или Cell / BE, была изготовлена ​​с использованием процесса SOI 90 нм . [9]

В марте 2007 года IBM объявила, что 65-нм версия Cell / BE находится в производстве на ее заводе (в то время - GlobalFoundries) в Ист-Фишкилле, штат Нью-Йорк . [9] [10]

Bandai Namco Entertainment использовала процессор Cell / BE для своей аркадной платы 357, а также для последующих 369.

В феврале 2008 года IBM объявила, что начнет производство процессоров Cell по 45-нм техпроцессу. [11]

В мае 2008 года IBM представила высокопроизводительную версию процессора Cell с плавающей запятой двойной точности, PowerXCell 8i , [12] с размером элемента 65 нм.

В мае 2008 года суперкомпьютер IBM Roadrunner на базе Opteron и PowerXCell 8i стал первой в мире системой, достигающей одного петафлопс, и был самым быстрым компьютером в мире до третьего квартала 2009 года. Три самых энергоэффективных суперкомпьютера в мире. , представленные списком Green500 , аналогичным образом основаны на PowerXCell 8i.

45-нм процессор Cell был представлен вместе с Sony PlayStation 3 Slim в августе 2009 года [13].

К ноябрю 2009 года IBM прекратила разработку процессора Cell с 32 APU [14] [15], но продолжала разрабатывать другие продукты Cell. [16]

Коммерциализация [ править ]

17 мая 2005 года Sony Computer Entertainment подтвердила некоторые спецификации процессора Cell, который будет поставляться в будущей консоли PlayStation 3 . [17] [18] [19] Эта конфигурация ячейки имеет один PPE в ядре с восемью физическими SPE в кремнии. [19] В PlayStation 3 один SPE блокируется во время процесса тестирования, что помогает повысить производительность, а другой зарезервирован для ОС, оставляя 6 бесплатных SPE для использования в коде игр. [20] Целевая тактовая частота при введении составляет 3,2  ГГц . [18]Вводный дизайн изготавливается с использованием процесса SOI 90 нм, при этом начальное серийное производство планируется на предприятии IBM в Ист-Фишкилле, штат Нью-Йорк . [9]

Отношения между ядрами и потоками - частый источник путаницы. Ядро PPE является двухпотоковым и проявляется в программном обеспечении как два независимых потока выполнения, в то время как каждый активный SPE проявляется как один поток. В конфигурации PlayStation 3, описанной Sony, процессор Cell обеспечивает девять независимых потоков выполнения.

28 июня 2005 г. IBM и Mercury Computer Systems объявили о партнерском соглашении по созданию компьютерных систем на основе Cell для встроенных приложений, таких как медицинская визуализация , промышленный контроль , аэрокосмическая промышленность и оборона , обработка сейсмических данных и телекоммуникации . [21] С тех пор Mercury выпустила блейд-серверы , обычные стоечные серверы и платы ускорителей PCI Express с процессорами Cell. [21]

Осенью 2006 года IBM выпустила блейд-модуль QS20, в котором используются процессоры двойного Cell BE, обеспечивающие потрясающую производительность в определенных приложениях, достигнув пика в 410 гигафлопс при четверть точности FP8 на модуль. QS22 на основе процессора PowerXCell 8i был использован для IBM Roadrunner суперкомпьютер. Mercury и IBM используют полностью загруженный процессор Cell с восемью активными SPE. 8 апреля 2008 г. компания Fixstars Corporation выпустила плату ускорителя PCI Express на базе процессора PowerXCell 8i. [22]

В высокопроизводительном сервере мультимедийных вычислений Sony ZEGO используется процессор Cell / BE с частотой 3,2 ГГц.

Обзор [ править ]

Cell Broadband Engine , или сотовый , как это обычно известно, является микропроцессор предназначен как гибрид обычных настольных процессоров (таких , как Athlon 64 , и Core 2 семей) и более специализированных высокопроизводительных процессоров, таких как NVIDIA и Графические процессоры ( GPU ) ATI . Более длинное название указывает на его предполагаемое использование, а именно в качестве компонента в существующих и будущих системах онлайн-распространения ; как таковой он может использоваться в дисплеях высокой четкости и записывающем оборудовании, а также в системах HDTV . Кроме того, процессор может быть адаптирован для обработки цифровых изображений.системы (медицинские, научные и т. д. ) и физическое моделирование ( например , научное и структурное инженерное моделирование).

При простом анализе процессор Cell можно разделить на четыре компонента: внешние структуры ввода и вывода, главный процессор, называемый элементом обработки мощности (PPE) (двустороннее и многопоточное ядро PowerPC 2.02 ), [23] полностью восемь. функциональные сопроцессоры, называемые элементами синергетической обработки , или SPE, и специализированная широкополосная кольцевая шина данных, соединяющая PPE, элементы ввода / вывода и SPE, называемая шиной межсоединения элементов или EIB.

Для достижения высокой производительности, необходимой для математически сложных задач, таких как декодирование / кодирование потоков MPEG , генерация или преобразование трехмерных данных или выполнение анализа Фурье данных, процессор Cell объединяет SPE и PPE через EIB, чтобы предоставить доступ через полностью согласованный DMA (прямой доступ к памяти) как к основной памяти, так и к другим внешним хранилищам данных. Чтобы максимально использовать возможности EIB и перекрывать вычисления и передачу данных, каждый из девяти элементов обработки (PPE и SPE) оснащен механизмом прямого доступа к памяти . Поскольку инструкции загрузки / сохранения SPE могут получить доступ только к его собственной локальной оперативной памятикаждый SPE полностью зависит от DMA для передачи данных в основную память и локальную память других SPE и из них. Операция DMA может передавать либо одну область блока размером до 16 КБ, либо список от 2 до 2048 таких блоков. Одним из основных дизайнерских решений в архитектуре Cell является использование DMA в качестве центрального средства передачи данных внутри кристалла с целью обеспечения максимальной асинхронности и параллелизма при обработке данных внутри кристалла. [24]

PPE, на котором может работать обычная операционная система, контролирует SPE и может запускать, останавливать, прерывать и планировать процессы, выполняемые на SPE. С этой целью PPE имеет дополнительные инструкции, относящиеся к управлению SPE. В отличие от SPE, PPE может читать и записывать основную память и локальную память SPE с помощью стандартных инструкций загрузки / сохранения. Несмотря на наличие полной архитектуры Тьюринга , SPE не являются полностью автономными и требуют, чтобы PPE запускал их, прежде чем они смогут выполнять какую-либо полезную работу. Поскольку большая часть «лошадиных сил» системы поступает от элементов синергетической обработки, использование DMA как метод передачи данных, и ограниченный объем локальной памяти каждого SPE представляет собой серьезную проблему для разработчиков программного обеспечения, которые хотят максимально использовать эту мощность, требуя тщательной ручной настройки программ для извлечения максимальной производительности из этого процессора.

Архитектура PPE и шины включает в себя различные режимы работы, обеспечивающие разные уровни защиты памяти , что позволяет защитить области памяти от доступа определенных процессов, выполняемых на SPE или PPE.

И PPE, и SPE являются архитектурами RISC с 32-битным форматом инструкций фиксированной ширины. PPE содержит 64-битный набор регистров общего назначения (GPR), 64-битный набор регистров с плавающей запятой (FPR) и 128-битный набор регистров Altivec . SPE содержит только 128-битные регистры. Их можно использовать для скалярных типов данных размером от 8 до 64 бит или для вычислений SIMD в различных целочисленных форматах и ​​форматах с плавающей запятой. Адреса системной памяти для PPE и SPE выражаются как 64-битные значения для теоретического диапазона адресов 2 64байт (16 эксабайт или 16 777 216 терабайт). На практике не все эти биты реализованы аппаратно. Адреса локального хранилища, внутренние для процессора SPU (Synergistic Processor Unit), выражаются 32-битным словом. В документации, относящейся к ячейке, слово всегда означает 32 бита, двойное слово означает 64 бита, а четверное слово означает 128 бит.

PowerXCell 8i [ править ]

В 2008 году IBM анонсировала обновленный вариант Cell под названием PowerXCell 8i , [25] который доступен в блейд- серверах QS22 от IBM. PowerXCell производится по 65-нм техпроцессу и добавляет поддержку до 32 ГБ памяти DDR2 со слотами, а также значительно улучшает производительность с плавающей запятой двойной точности на SPE с пикового значения примерно 12,8  GFLOPS до 102,4 GFLOPS в сумме для восемь SPE, которые, по совпадению, имеют такую ​​же пиковую производительность, что и векторный процессор NEC SX-9 , выпущенный примерно в то же время. IBM Roadrunnerсуперкомпьютер, самый быстрый в мире в 2008–2009 годах, состоял из 12 240 процессоров PowerXCell 8i и 6 562 процессоров AMD Opteron . [26] Суперкомпьютеры с питанием от PowerXCell 8i также доминировали во всех шести самых «зеленых» системах в списке Green500 с самым высоким в мире соотношением MFLOPS / Watt. [27] Помимо QS22 и суперкомпьютеров, процессор PowerXCell также доступен в качестве ускорителя на карте PCI Express и используется в качестве основного процессора в проекте QPACE .

Поскольку в PowerXCell 8i был удален интерфейс памяти RAMBUS и добавлены интерфейсы DDR2 значительно большего размера, а также улучшенные SPE, пришлось переработать компоновку микросхемы, что привело к увеличению размера кристалла и корпуса. [28]

Архитектура [ править ]

Хотя чип Cell может иметь несколько различных конфигураций, базовая конфигурация представляет собой многоядерный чип, состоящий из одного «элемента процессора питания» («PPE») (иногда называемого «элементом обработки» или «PE») и нескольких «Элементы синергетической обработки» («SPE»). [29] PPE и SPE связаны между собой внутренней высокоскоростной шиной, получившей название «Element Interconnect Bus» («EIB»).

Элемент процессора питания (PPE) [ править ]

Средства индивидуальной защиты [30] [31] [32] является PowerPC на основе двойного вопрос в заказе двухстороннего с одновременным многопоточным процессором ядром с 23-ступенчатым конвейером , действующим в качестве контроллера для восьми КСНО, которые обрабатывают большую часть вычислительная нагрузка. СИЗ имеет ограниченные возможности исполнения вне очереди; он может выполнять нагрузки не по порядку и имеет отложенные конвейеры выполнения . PPE будет работать с обычными операционными системами из-за его сходства с другими 64-битными процессорами PowerPC, в то время как SPE предназначены для выполнения векторизованного кода с плавающей запятой. PPE содержит кеш-память уровня 1 размером 64 КБ.(Инструкция 32 КБ и данные 32 КБ) и кэш-память уровня 2 512 КБ. Размер строки кэша составляет 128 байт. Кроме того, IBM включила модуль AltiVec (VMX) [33], который полностью конвейеризован для работы с числами с плавающей запятой одинарной точности (Altivec 1 не поддерживает векторы с плавающей запятой двойной точности .), 32-битный модуль с фиксированной точкой (FXU) с 64 -битными числами. битовый регистровый файл на поток, модуль загрузки и хранения (LSU) , 64-разрядный модуль с плавающей запятой (FPU) , модуль ветвления (BRU) и модуль выполнения ветвей (BXU). [30]PPE состоит из трех основных блоков: блока инструкций (IU), блока выполнения (XU) и блока векторного / скалярного исполнения (VSU). IU содержит кэш инструкций L1, оборудование для предсказания ветвлений, буферы инструкций и логин для проверки зависимостей. XU содержит целочисленные исполнительные блоки (FXU) и блок загрузки-сохранения (LSU). VSU содержит все ресурсы выполнения для FPU и VMX. Каждый PPE может выполнять две операции двойной точности за такт с использованием скалярной инструкции слияния-умножения-сложения, которая преобразуется в 6,4  GFLOPS на частоте 3,2 ГГц; или восемь операций с одинарной точностью за такт с помощью векторной инструкции слияния-умножения-сложения, что соответствует 25,6 гигафлопс на частоте 3,2 ГГц. [34]

Ксенон в Xbox 360 [ править ]

PPE был разработан специально для процессора Cell, но во время разработки Microsoft обратилась к IBM с просьбой создать высокопроизводительное процессорное ядро ​​для Xbox 360 . IBM выполнила это требование и создала трехъядерный процессор Xenon на основе слегка модифицированной версии PPE с добавленными расширениями VMX128. [35] [36]

Элементы синергетической обработки (SPE)[ редактировать ]

Каждый SPE - это процессор с двойной обработкой, состоящий из «блока синергетической обработки», [37] SPU и «контроллера потока памяти», MFC ( DMA , MMU и интерфейс шины ). SPE не имеют оборудования для прогнозирования ветвлений (следовательно, компилятор ложится тяжелой нагрузкой). [38] Каждый SPE имеет 6 исполнительных блоков, разделенных между нечетными и четными конвейерами на каждом SPE: SPU запускает специально разработанный набор инструкций (ISA) с 128-битной организацией SIMD [33] [39] [40] для одинарной и двойной точности. инструкции. В текущем поколении Cell каждый SPE содержит 256  KiB встроенная SRAM для команд и данных, называемая «Local Storage» (не путать с «Local Memory» в документах Sony, которые относятся к VRAM), которая видна PPE и может быть адресована непосредственно программным обеспечением. Каждый SPE может поддерживать до 4 ГиБ локальной памяти. Локальное хранилище не работает как обычный кэш ЦП, поскольку оно непрозрачно для программного обеспечения и не содержит аппаратных структур, которые предсказывают, какие данные загружать. В КСН содержит 128 бит, 128-запись файла регистров и меры 14,5 мм 2по процессу 90 нм. SPE может работать с шестнадцатью 8-битными целыми числами, восемью 16-битными целыми числами, четырьмя 32-битными целыми числами или четырьмя числами с плавающей запятой одинарной точности за один такт, а также с операцией с памятью. Обратите внимание, что SPU не может напрямую обращаться к системной памяти; 64-битные адреса виртуальной памяти, сформированные SPU, должны быть переданы от SPU к контроллеру потока памяти SPE (MFC) для установки операции DMA в системном адресном пространстве.

В одном типичном сценарии использования система загружает SPE небольшими программами (похожими на потоки ), связывая SPE вместе для обработки каждого шага в сложной операции. Например, телеприставка может загружать программы для чтения DVD, декодирования видео и звука и отображения, и данные будут передаваться от SPE к SPE, пока, наконец, не окажутся на телевизоре. Другая возможность состоит в том, чтобы разделить набор входных данных и иметь несколько SPE, выполняющих одинаковые операции параллельно. На частоте 3,2 ГГц каждый SPE дает теоретическую производительность с одинарной точностью 25,6 Гфлопс .

По сравнению с современными персональными компьютерами , относительно высокая общая производительность процессора Cell с плавающей запятой, по-видимому, затмевает возможности модуля SIMD в процессорах, таких как Pentium 4 и Athlon 64 . Однако сравнение возможностей системы только с плавающей запятой является одномерной метрикой, зависящей от конкретного приложения. В отличие от процессора Cell, такие настольные процессоры больше подходят для универсального программного обеспечения, которое обычно запускается на персональных компьютерах. Помимо выполнения нескольких инструкций за такт, процессоры Intel и AMD имеют предикторы ветвления.. Ячейка предназначена для компенсации этого с помощью компилятора, в котором создаются инструкции по подготовке к переходу. Для операций с плавающей запятой двойной точности, которые иногда используются в персональных компьютерах и часто используются в научных вычислениях, производительность Cell падает на порядок, но все же достигает 20,8 GFLOPS (1,8 GFLOPS на SPE, 6,4 GFLOPS на PPE). Вариант PowerXCell 8i, который был специально разработан для двойной точности, достигает 102,4 GFLOPS при вычислениях с двойной точностью. [41]

Тесты IBM показывают, что SPE могут достичь 98% своей теоретической пиковой производительности при оптимизированном параллельном умножении матриц. [34]

Toshiba разработала сопроцессор на базе четырех SPE, но без PPE, названный SpursEngine, предназначенный для ускорения 3D-эффектов и киноэффектов в бытовой электронике.

Каждый SPE имеет локальную память объемом 256 КБ. [42] В общей сложности SPE имеют 2 МБ локальной памяти.

Element Interconnect Bus (EIB) [ править ]

EIB - это внутренняя коммуникационная шина процессора Cell, которая соединяет различные элементы системы на кристалле: процессор PPE, контроллер памяти (MIC), восемь сопроцессоров SPE и два интерфейса ввода-вывода вне кристалла. от 12 участников PS3 (количество SPU может варьироваться в промышленных приложениях). ЕИБ также включает в себя арбитражный блок, который функционирует как светофор. В некоторых документах IBM называет участников ЕИБ «единицами».

В настоящее время EIB реализован как круговое кольцо, состоящее из четырех однонаправленных каналов шириной 16 байт, которые попарно вращаются в противоположных направлениях. Если шаблоны трафика позволяют, каждый канал может одновременно передавать до трех транзакций. Поскольку EIB работает на половине системной тактовой частоты, эффективная канальная скорость составляет 16 байтов каждые два системных такта. При максимальном параллелизме с тремя активными транзакциями в каждом из четырех колец пиковая мгновенная полоса пропускания EIB составляет 96 байтов за такт (12 одновременных транзакций × 16 байтов шириной / 2 системных такта на передачу). Хотя эта цифра часто цитируется в литературе IBM, просто масштабировать ее по тактовой частоте процессора нереально. Арбитражная единица накладывает дополнительные ограничения .

Старший инженер IBM Дэвид Кролак , ведущий разработчик EIB, объясняет модель параллелизма:

Кольцо может начинать новую операцию каждые три цикла. Каждая передача всегда занимает восемь ударов. Это было одно из сделанных нами упрощений, оно оптимизировано для потоковой передачи большого количества данных. Если вы выполняете небольшие операции, это не сработает так же хорошо. Если вы думаете о поездах из восьми вагонов, курсирующих по этому рельсовому пути, до тех пор, пока поезда не сталкиваются друг с другом, они могут сосуществовать на рельсах. [43]

У каждого участника EIB есть один 16-байтовый порт чтения и один 16-байтовый порт записи. Ограничение для одного участника - это чтение и запись со скоростью 16 байтов за такт EIB (для простоты часто считается 8 байтов за тактовый сигнал системы). Каждый процессор SPU содержит выделенную очередь управления DMA, способную планировать длинные последовательности транзакций для различных конечных точек, не мешая текущим вычислениям SPU; этими очередями DMA можно управлять локально или удаленно, что обеспечивает дополнительную гибкость модели управления.

Данные передаются по каналу EIB ступенчато по кольцу. Поскольку участников двенадцать, общее количество шагов по каналу до исходной точки равно двенадцати. Шесть шагов - это самое большое расстояние между любой парой участников. Каналу EIB не разрешается передавать данные, требующие более шести шагов; такие данные должны идти по более короткому маршруту по кругу в другом направлении. Количество шагов, участвующих в отправке пакета, очень мало влияет на задержку передачи: тактовая частота, управляющая шагами, очень высока по сравнению с другими соображениями. Тем не менее, более длинные расстояния связи являются вредными для общей производительности EIB , поскольку они уменьшают доступный параллелизм.

Несмотря на первоначальное желание IBM реализовать EIB как более мощную перекладину, круговая конфигурация, которую они использовали для экономии ресурсов, редко является ограничивающим фактором для производительности чипа Cell в целом. В худшем случае программист должен проявить особую осторожность, чтобы спланировать шаблоны связи, при которых EIB может работать при высоких уровнях параллелизма.

Давид Кролак объяснил:

Ну, в начале, в начале процесса разработки, несколько человек настаивали на перекрестном переключателе, и, как спроектирована шина, вы могли бы вытащить EIB и вставить перекрестный переключатель, если бы вы были готовы выделить больше кремния. место на микросхеме до проводки. Нам нужно было найти баланс между возможностью подключения и площадью, и просто не хватило места для установки полноценного перекрестного переключателя. Итак, мы придумали эту кольцевую структуру, которая, на наш взгляд, очень интересна. Он вписывается в ограничения по площади и по-прежнему имеет очень впечатляющую пропускную способность. [43]

Оценка пропускной способности [ править ]

На частоте 3,2 ГГц каждый канал имеет скорость 25,6 ГБ / с. Если рассматривать EIB отдельно от элементов системы, которые он соединяет, выполнение двенадцати одновременных транзакций с такой скоростью потока дает абстрактную полосу пропускания EIB 307,2 ГБ / с. Основываясь на этой точке зрения, многие публикации IBM описывают доступную пропускную способность EIB как «более 300 ГБ / с». Это число отражает пиковую мгновенную полосу пропускания EIB, масштабируемую в зависимости от частоты процессора. [44]

Однако в механизме арбитража для пакетов, принимаемых на шину, присутствуют и другие технические ограничения. Группа IBM Systems Performance объяснила:

Каждый блок на EIB может одновременно отправлять и получать 16 байтов данных в каждом цикле шины. Максимальная полоса пропускания данных всего EIB ограничена максимальной скоростью, с которой адреса отслеживаются по всем модулям в системе, которая составляет один за цикл шины. Поскольку каждый запрос отслеживаемого адреса потенциально может передавать до 128 байтов, теоретическая пиковая пропускная способность данных на EIB на частоте 3,2 ГГц составляет 128Bx1,6 ГГц = 204,8 ГБ / с. [34]

Эта цитата, по-видимому, полностью отражает публичное раскрытие IBM этого механизма и его влияния. Блок арбитража EIB, механизм отслеживания и генерация прерывания при ошибках трансляции сегментов или страниц недостаточно хорошо описаны в документации, которая еще не опубликована IBM. [ необходима цитата ]

На практике эффективная полоса пропускания EIB также может быть ограничена вовлеченными участниками кольца. В то время как каждое из девяти процессорных ядер может поддерживать одновременное чтение и запись со скоростью 25,6 ГБ / с, контроллер интерфейса памяти (MIC) привязан к паре каналов памяти XDR, обеспечивающих максимальный поток 25,6 ГБ / с для операций чтения и записи вместе, а также документировано, что два контроллера ввода-вывода поддерживают максимальную комбинированную скорость ввода 25,6 ГБ / с и пиковую комбинированную скорость вывода 35 ГБ / с.

Чтобы усугубить путаницу, некоторые старые публикации ссылаются на полосу пропускания EIB, исходя из системной частоты 4 ГГц. Этот опорный кадр приводит к мгновенному показателю пропускной способности EIB в 384 ГБ / с и параметру полосы пропускания, ограниченному арбитражем, равному 256 ГБ / с.

Считается, что наиболее часто упоминаемое теоретическое число 204,8 ГБ / с - лучшее, что нужно иметь в виду. Группа IBM Systems Performance продемонстрировала, что потоки данных, ориентированные на SPU, достигают 197 ГБ / с на процессоре Cell, работающем на частоте 3,2 ГГц, так что это число также является справедливым отражением практики. [45]

Контроллеры памяти и ввода / вывода [ править ]

Cell содержит двухканальный макрос Rambus XIO, который взаимодействует с памятью Rambus XDR . Контроллер интерфейса памяти (MIC) отделен от макроса XIO и разработан IBM. Канал XIO-XDR работает со скоростью 3,2 Гбит / с на вывод. Два 32-битных канала могут обеспечить теоретический максимум 25,6 ГБ / с.

Интерфейс ввода-вывода, также разработанный Rambus, известен как FlexIO . Интерфейс FlexIO состоит из 12 полос, каждая из которых представляет собой однонаправленный двухточечный путь шириной 8 бит. Пять двухточечных маршрутов шириной 8 бит являются входящими полосами для Cell, а остальные семь - исходящими. Это обеспечивает теоретическую пиковую пропускную способность 62,4 ГБ / с (36,4 ГБ / с для исходящего трафика, 26 ГБ / с для входящего трафика) на частоте 2,6 ГГц. Интерфейс FlexIO можно синхронизировать независимо, тип. на частоте 3,2 ГГц. 4 входящие + 4 исходящие полосы поддерживают согласованность памяти.

Возможные приложения [ править ]

Карточка обработки видео [ править ]

Некоторые компании, такие как Leadtek , выпустили карты PCI-E на основе Cell, позволяющие транскодировать видео H.264 , MPEG-2 и MPEG-4 «быстрее, чем в реальном времени» . [46]

Блейд-сервер [ править ]

29 августа 2007 года IBM анонсировала BladeCenter QS21. Производя измеренное значение 1,05 гига операций с плавающей запятой в секунду (гигафлопс) на ватт, с максимальной производительностью примерно 460 гигафлопс, это одна из самых энергоэффективных вычислительных платформ на сегодняшний день. Одно шасси BladeCenter может выполнять 6,4 терафлопс операций с плавающей запятой в секунду (терафлопс) и более 25,8 терафлопс в стандартной стойке 42U. [47]

13 мая 2008 г. IBM анонсировала BladeCenter QS22. QS22 представляет процессор PowerXCell 8i, производительность которого с плавающей запятой двойной точности в пять раз выше, чем у QS21, а также емкость блейд-памяти DDR2 объемом до 32 ГБ. [48]

IBM прекратила выпуск линейки блейд-серверов на базе процессоров Cell с 12 января 2012 г. [49]

Плата PCI Express [ править ]

Несколько компаний предоставляют платы PCI-e, использующие IBM PowerXCell 8i. Производительность составляет 179,2 гигафлопс (SP), 89,6 гигафлопс (DP) на 2,8 ГГц. [50] [51]

Консольные видеоигры [ править ]

Sony «s PlayStation 3 игровая консоль была первым приложением производства процессора Cell, работающий на частоте 3,2  ГГц и содержит семь из восьми операционных КСН, чтобы позволить Sony увеличить выход на производство процессоров. Только шесть из семи SPE доступны разработчикам, поскольку один зарезервирован ОС. [20]

Домашний кинотеатр [ править ]

Toshiba производит телевизоры высокой четкости с использованием Cell. Они представили систему для одновременного декодирования 48 потоков MPEG-2 стандартной четкости одновременно на экране 1920 × 1080 . [52] [53] Это может позволить зрителю выбрать канал на основе десятков миниатюр видео, отображаемых одновременно на экране.

Суперкомпьютеры [ править ]

Суперкомпьютер IBM , IBM Roadrunner , был гибридом General Purpose x86-64 Opteron, а также процессоров Cell. Эта система заняла первое место в списке 500 лучших компьютеров за июнь 2008 года как первый суперкомпьютер, работающий на скорости в петафлопс , получив стабильную скорость 1,026 петафлопс при использовании стандартного теста Linpack . IBM Roadrunner использовала версию процессора Cell PowerXCell 8i, изготовленную по 65-нм технологии, и усовершенствованные блоки SPU, которые могут обрабатывать вычисления двойной точности в 128-битных регистрах, достигая 102 гигафлопс двойной точности на чип. [54] [55]

Кластерные вычисления [ править ]

Кластеры консолей PlayStation 3 - привлекательная альтернатива высокопроизводительным системам на базе блейд-серверов Cell. Лаборатория инновационных вычислений, группа под руководством Джека Донгарра с факультета компьютерных наук Университета Теннесси, тщательно исследовала такое приложение. [56] Terrasoft Solutions продает кластеры PS3 с 8 и 32 узлами с предустановленной Yellow Dog Linux , что является результатом исследования Донгарры.

Как впервые сообщил Wired 17 октября 2007 г. [57] , интересное приложение использования PlayStation 3 в кластерной конфигурации было реализовано астрофизиком Гауравом Ханной из физического факультета Массачусетского университета в Дартмуте , который заменил время, используемое на суперкомпьютерах, на кластер из восьми PlayStation 3. Впоследствии следующее поколение этой машины, теперь называемой PlayStation 3 Gravity Grid , использует сеть из 16 машин и использует процессор Cell для предполагаемого приложения, которое представляет собой двоичное слияние черных дыр с использованием теории возмущений . В частности, кластер выполняет астрофизическое моделирование большихсверхмассивные черные дыры захватывают более мелкие компактные объекты и генерируют числовые данные, которые многократно публиковались в соответствующей научно-исследовательской литературе. [58]Версия процессора Cell, используемая PlayStation 3, имеет основной ЦП и 6 SPE, доступных пользователю, что дает машине Gravity Grid сеть из 16 процессоров общего назначения и 96 векторных процессоров. Единовременная стоимость сборки машины составляет 9000 долларов, и она подходит для моделирования черных дыр, которое в противном случае стоило бы 6000 долларов за запуск на обычном суперкомпьютере. Вычисления черных дыр не требуют интенсивного использования памяти и легко локализуются, поэтому хорошо подходят для этой архитектуры. Ханна утверждает, что производительность кластера превосходит производительность традиционного Linux-кластера на базе ядра Intel Xeon 100+ на основе его моделирования. PS3 Gravity Grid привлекала значительное внимание средств массовой информации в 2007, [59] 2008, [60] [61] 2009, [62] [63] [64]и 2010. [65] [66]

Лаборатория вычислительной биохимии и биофизики Университета Помпеу Фабра в Барселоне в 2007 году развернула систему BOINC под названием PS3GRID [67] для совместных вычислений на основе программного обеспечения CellMD, первой системы, разработанной специально для процессора Cell.

США Air Force Research Laboratory развернула кластер PlayStation 3 более чем 1700 единиц, по прозвищу «Condor Cluster», для анализа высокого разрешения спутниковых снимков . Военно-воздушные силы заявляют, что Condor Cluster станет 33-м по величине суперкомпьютером в мире по мощности. [68] Лаборатория открыла суперкомпьютер для использования университетами для исследований. [69]

Распределенные вычисления [ править ]

Благодаря вычислительной мощности более полумиллиона консолей PlayStation 3 проект распределенных вычислений Folding @ home был признан Книгой рекордов Гиннеса самой мощной распределенной сетью в мире. Первый рекорд был достигнут 16 сентября 2007 года, когда проект превысил один петафлопс , который ранее никогда не был достигнут в распределенной вычислительной сети. Кроме того, коллективные усилия позволили одной только PS3 23 сентября 2007 года достичь отметки в петафлопс. Для сравнения, это второй по мощности суперкомпьютер в мире в то время, IBM BlueGene / Lпроизводительность составляет около 478,2 терафлопс, что означает, что вычислительная мощность Folding @ home примерно в два раза больше, чем у BlueGene / L (хотя межсоединение ЦП в BlueGene / L более чем в миллион раз быстрее, чем средняя скорость сети в Folding @ home). По состоянию на 7 мая 2011 года Folding @ home работает со скоростью около 9,3 x86 петафлопс, из которых 1,6 петафлопса генерируются только 26000 активными PS3. В конце 2008 года кластер из 200 консолей PlayStation 3 был использован для создания поддельного SSL- сертификата, который эффективно взломал его шифрование. [70]

Мэйнфреймы [ править ]

25 апреля 2007 года IBM объявила о начале интеграции микропроцессоров Cell Broadband Engine Architecture в линейку мэйнфреймов компании . [71] Это привело к Gameframe .

Взлом пароля [ править ]

Архитектура процессора делает его более подходящим для приложений аппаратных криптографических атак методом грубой силы, чем обычные процессоры. [72]

Программная инженерия [ править ]

Из-за гибкого характера ячейки существует несколько возможностей использования ее ресурсов, не ограничиваясь только разными вычислительными парадигмами: [73]

Очередь заданий [ править ]

PPE поддерживает очередь заданий, планирует задания в SPE и отслеживает ход выполнения. Каждый SPE запускает «мини-ядро», роль которого заключается в получении задания, его выполнении и синхронизации с PPE.

Самостоятельная многозадачность SPE [ править ]

Мини-ядро и планирование распределяются по SPE. Задачи синхронизируются с помощью мьютексов или семафоров, как в обычной операционной системе . Готовые к запуску задачи ожидают в очереди, пока SPE их выполнит. SPE используют общую память для всех задач в этой конфигурации.

Обработка потока [ править ]

Каждый SPE запускает отдельную программу. Данные поступают из входного потока и отправляются в SPE. Когда SPE завершает обработку, выходные данные отправляются в выходной поток.

Это обеспечивает гибкую и мощную архитектуру для потоковой обработки и позволяет явное планирование для каждого SPE отдельно. Другие процессоры также могут выполнять задачи потоковой передачи, но ограничены загруженным ядром.

Разработка программного обеспечения с открытым исходным кодом [ править ]

В 2005 году разработчиками IBM были представлены исправления, обеспечивающие поддержку Cell в ядре Linux. [74] Арнд Бергманн (один из разработчиков вышеупомянутых патчей) также описал архитектуру Cell на основе Linux на LinuxTag 2005. [75] Начиная с версии 2.6.16 (20 марта 2006 г.), ядро ​​Linux официально поддерживает Cell. процессор. [76]

И PPE, и SPE программируются на C / C ++ с использованием общего API, предоставляемого библиотеками.

Fixstars Solutions предоставляет Yellow Dog Linux для систем на базе IBM и Mercury Cell, а также для PlayStation 3. [77] Terra Soft в стратегическом партнерстве с Mercury предоставила пакет поддержки Linux Board для Cell, а также поддержку и разработку программных приложений на различные другие платформы Cell, включая IBM BladeCenter JS21 и Cell QS20, а также решения на основе Mercury Cell. [78] Terra Soft также поддерживает набор инструментов для построения и управления кластеров Y-HPC (высокопроизводительные вычисления) и инструменты для секвенирования генов Y-Bio. Y-Bio основан на стандарте RPM Linux для управления пакетами и предлагает инструменты, которые помогают исследователям в области биоинформатики выполнять свою работу с большей эффективностью. [79]IBM разработала псевдофайловую систему для Linux, названную «Spufs», которая упрощает доступ к ресурсам SPE и их использование. В настоящее время IBM поддерживает ядро Linux и порты GDB , а Sony поддерживает набор инструментов GNU ( GCC , binutils ). [80]

В ноябре 2005 года IBM выпустила на свой веб-сайт «Комплект разработчика программного обеспечения Cell Broadband Engine (CBE) версии 1.0», состоящий из симулятора и различных инструментов. Версии для разработки последнего ядра и инструментов для Fedora Core 4 поддерживаются на веб-сайте Barcelona Supercomputing Center . [81]

В августе 2007 года Mercury Computer Systems выпустила комплект разработки программного обеспечения для PlayStation 3 для высокопроизводительных вычислений. [82]

В ноябре 2007 года Fixstars Corporation выпустила новый модуль «CVCell», направленный на ускорение нескольких важных API OpenCV для Cell. В серии программных расчетных тестов они зафиксировали время выполнения на процессоре Cell с тактовой частотой 3,2 ГГц, которое было в 6–27 раз быстрее по сравнению с тем же программным обеспечением на Intel Core 2 Duo с тактовой частотой 2,4 ГГц. [83]

Галерея [ править ]

Иллюстрации различных поколений процессоров Cell / BE и PowerXCell 8i. Изображения не в масштабе; Все пакеты Cell / BE имеют размеры 42,5 × 42,5 мм, а PowerXCell 8i - 47,5 × 47,5 мм.

  • 90-нм Cell / BE, который поставлялся с первой PlayStation 3. Обычно его можно увидеть с закрытой крышкой, так как она приклеена и ее нелегко снять.

  • 90-нм Cell / BE, который поставлялся с первой PlayStation 3. У него снята крышка, чтобы показать размер кристалла процессора под ней.

  • На нижней стороне 90-нм процессора Cell / BE показаны 1242 шарика припоя диаметром 0,6 мм каждый и набор из 35 конденсаторов.

  • 65-нм Cell / BE, поставляемый с обновленными PlayStation 3. Крышка снята, чтобы показать размер кристалла процессора под ней.

  • 45-нм Cell / BE, который поставлялся с обновленными PlayStation 3, такими как версии Slim и Super Slim. Крышка снята, чтобы показать размер кристалла процессора под ней.

  • 65-нм высокопроизводительный PowerXCell 8i с дополнительными конденсаторами наверху из-за необходимости развязки для шумов, вносимых интерфейсом DDR2.

См. Также [ править ]

  • Центр компетенции STI по ​​процессорам клеток
  • Архитектура Adapteva Epiphany , аналогичная сеть-на-кристалле с локальными магазинами и DMA, но с большим количеством ядер и более простой коммуникацией вне ядра.
  • Vision Processing Unit , новый класс процессоров с некоторыми похожими функциями
  • MPSoC
  • Осьминог
  • Ксенон (процессор)
  • IBM PowerPC

Ссылки [ править ]

  1. ^ a b Gschwind, Майкл; Хофсти, Х. Питер; Флакс, Брайан; Хопкинс, Мартин; Ватанабэ, Юкио; Ямазаки, Такеши (2006). «Синергетическая обработка в многоядерной архитектуре Cell». IEEE Micro . IEEE. 26 (2): 10–24. DOI : 10.1109 / MM.2006.41 . S2CID  17834015 .
  2. ^ «Cell Designer говорит о PS3 и IBM Cell Processors» . Архивировано из оригинального 21 августа 2006 года . Проверено 22 марта 2007 года .
  3. Годен, Шарон (9 июня 2008 г.). «IBM Roadrunner преодолевает 4-минутную милю суперкомпьютеров» . Компьютерный мир . Архивировано из оригинального 24 декабря 2008 года . Проверено 10 июня 2008 года .
  4. ^ Филдс, Джонатан (9 июня 2008). «Суперкомпьютер задает темп в петафлоп» . BBC News . Проверено 9 июня 2008 года .
  5. ^ Шенкленд, Стивен (22 февраля 2006). «Octopiler стремится вооружить программистов Cell» . CNET . Проверено 22 марта 2007 года .
  6. ^ "Пакет разработки программного обеспечения Cell Broadband Engine Версия 1.0" . LWN. 10 ноября 2005 . Проверено 22 марта 2007 года .
  7. ^ Krewell, Кевин (14 февраля 2005). «Клетка движется в центр света». Отчет микропроцессора .
  8. ^ a b «Введение в мультипроцессор Cell» . Журнал исследований и разработок IBM. 7 августа 2005 года Архивировано из оригинального 28 февраля 2007 года . Проверено 22 марта 2007 года .
  9. ^ a b c «IBM производит сотовый процессор с использованием новой технологии производства» . X-bit labs. Архивировано из оригинального 15 марта 2007 года . Проверено 12 марта 2007 года .
  10. ^ "Начато производство 65-нм процессоров CELL" . Вселенная PlayStation. 30 января, 2007. Архивировано из оригинала 2 февраля 2007 года . Проверено 18 мая 2007 года .
  11. Стоукс, Джон (7 февраля 2008 г.). «IBM сокращает Cell до 45 нм. За более дешевыми PS3 последуют» . Arstechnica.com . Проверено 19 сентября 2012 года .
  12. ^ «IBM предлагает высокопроизводительные вычисления вне лаборатории» . IBM . Проверено 15 мая 2008 года .
  13. ^ «Sony отвечает на наши вопросы о новой PlayStation 3» . Ars Technica . 18 августа 2009 . Проверено 19 августа 2009 года .
  14. ^ "Будет ли Roadrunner последним ура для клетки?" . 27 октября 2009 года архивации с оригинала на 31 октября 2009 года.
  15. ^ "SC09: IBM lässt Cell-Prozessor auslaufen" . HeiseOnline . 20 ноября 2009 . Проверено 21 ноября 2009 года .
  16. ^ «IBM не остановила разработку процессоров Cell» . DriverHeaven.net. 23 ноября 2009 года Архивировано из оригинального 25 ноября 2009 года . Проверено 24 ноября 2009 года .
  17. Беккер, Дэвид (7 февраля 2005 г.). «У чипа PlayStation 3 раздвоение личности» . CNET . Проверено 18 мая 2007 года .
  18. ^ a b Терротт, Пол (17 мая 2005 г.). «Sony повышает ставки с PlayStation 3» . WindowsITPro. Архивировано из оригинала на 30 сентября 2007 года . Проверено 22 марта 2007 года .
  19. ^ a b Ропер, Крис (17 мая 2005 г.). «E3 2005: Демонстрации технологии сотовых процессоров» . IGN . Проверено 22 марта 2007 года .
  20. ^ а б Мартин Линклейтер. «Оптимизация ядра клетки». Разработчик игры Magazine, апрель 2007 . С. 15–18. Чтобы увеличить производительность, Sony поставляет процессоры PlayStation 3 Cell только с семью рабочими SPE. И из этих семи один SPE будет использоваться операционной системой для различных задач. Остается шесть SPE и 1 PPE для использования программистами игр.
  21. ^ a b «Меркьюри выигрывает награду IBM PartnerWorld Beacon Award» . Суперкомпьютерные сети. 12 апреля 2007 . Проверено 18 мая 2007 года .[ мертвая ссылка ]
  22. ^ «Fixstars выпускает плату ускорителя с PowerXCell 8i» . Корпорация Fixstars. 8 апреля 2008 года в архив с оригинала на 5 января 2009 года . Проверено 18 августа 2008 года .
  23. ^ Koranne, Sandeep (2009). Практическое программирование на ядре широкополосной сотовой связи . Springer Science & Business Media. п. 17. ISBN 9781441903082.
  24. ^ Gschwind, Майкл (2006). «Чип многопроцессорности и ядро ​​широкополосной сотовой связи» . ACM . Проверено 29 июня 2008 года .
  25. ^ Справочник по программированию Cell Broadband Engine, включая процессор PowerXCell 8i (PDF) (редакция 1.11). 12 мая 2008 г.
  26. ^ "IBM анонсирует блейд-сервер PowerXCell 8i, QS22" . Beyond3D. Май 2008. Архивировано из оригинального 16 -го июня 2008 года . Проверено 10 июня 2008 года .
  27. ^ «Список Green500 - ноябрь 2009 г.» . Архивировано из оригинального 23 февраля 2011 года.
  28. ^ «Упаковка микропроцессора Cell Broadband Engine для суперкомпьютерных приложений» (PDF) . Архивировано из оригинального (PDF) 4 января 2014 года . Проверено 4 января 2014 года .
  29. ^ "Краткое описание микропроцессора клетки" . IBM, Sony Computer Entertainment Inc., Toshiba Corp.7 февраля 2005 г.
  30. ^ а б http://www.cc.gatech.edu/~hyesoon/spr11/lec_cell.pdf
  31. ^ Практические вычисления на движке сотовой широкополосной связи Сандип Коранн, Springer Science + Business Media, 2009, стр.19.
  32. ^ http://www.research.ibm.com/people/a/ashwini/E3%202005%20Cell%20Blade%20reports/All_About_Cell_Cool_Chips_Final.pdf
  33. ^ a b «Дизайн энергоэффективного процессора и процессор ячеек» (PDF) . IBM. 16 февраля 2005 г.
  34. ^ a b c «Архитектура Cell Broadband Engine и ее первая реализация» . IBM developerWorks. 29 ноября 2005 . Проверено 6 апреля 2006 года .
  35. ^ " Обработка правды: интервью с Дэвидом Шиппи ", Ли Александр, Гамасутра , 16 января 2009 г.
  36. « Игра в дурака », Джонатан В. Ласт, Wall Street Journal , 30 декабря 2008 г.
  37. ^ «Архивная копия» (PDF) . Архивировано из оригинала (PDF) в 18 ноября 2014 года . Проверено 24 января 2015 года . CS1 maint: заархивированная копия как заголовок ( ссылка )
  38. ^ "IBM Research - Cell" . IBM . Проверено 11 июня 2005 года .
  39. ^ «Синергетическая обработка в многоядерной архитектуре Cell» (PDF) . IEEE Micro. Март 2006 . Проверено 1 ноября 2006 года .
  40. ^ "Новая архитектура SIMD для гетерогенного многопроцессорного чипа Cell" (PDF) . Hot Chips 17. 15 августа 2005 года Архивировано из оригинального (PDF) 9 июля 2008 года . Проверено 1 января 2006 года .
  41. ^ "Преемник ячейки с турбо-режимом - PowerXCell 8i" . PPCNux. Ноября 2007 . Проверено 10 июня 2008 года .
  42. ^ Поддержка OpenMP на Cell , IBM T. J Watson Research
  43. ^ a b «Познакомьтесь с экспертами: Дэвид Кролак о шине EIB Cell Broadband Engine» . IBM. 6 декабря 2005 . Проверено 18 марта 2007 года .
  44. ^ "Многопроцессорная коммуникационная сеть соты: построена для скорости" (PDF) . IEEE. Архивировано из оригинального (PDF) 7 января 2007 года . Проверено 22 марта 2007 года .
  45. ^ «Архитектура Cell Broadband Engine и ее первая реализация» . Ibm.com. 29 ноября 2005 . Проверено 19 сентября 2012 года .
  46. ^ "Карта транскодирования Leadtek PxVC1100 MPEG-2 / H.264" .
  47. ^ "IBM удваивается на Cell Blade" (пресс-релиз). Армонк, Нью-Йорк: IBM . 29 августа 2007 . Проверено 19 июля 2017 года .
  48. ^ «IBM предлагает высокопроизводительные вычисления вне лаборатории» (пресс-релиз). Армонк, Нью-Йорк: IBM . 13 мая 2008 . Проверено 19 июля 2017 года .
  49. Морган, Тимоти Прикетт (28 июня 2011 г.). «IBM потушит последний блейд-сервер Cell» . Реестр . Проверено 19 июля 2017 года .
  50. ^ "Пресс-релиз Fixstars" . Архивировано из оригинала на 5 января 2009 года . Проверено 18 августа 2008 года .
  51. ^ "Плата сопроцессора на базе соты работает под управлением Linux" . Архивировано из оригинала 2 мая 2009 года.
  52. ^ «Toshiba демонстрирует сотовый микропроцессор, одновременно декодирующий 48 потоков MPEG-2» . Tech-On !. 25 апреля 2005 г.
  53. ^ «Победитель: Мультимедийный монстр» . IEEE Spectrum . 1 января 2006 года Архивировано из оригинала 18 января 2006 года . Проверено 22 января 2006 года .
  54. ^ "За пределами одной клетки" (PDF) . Лос-Аламосская национальная лаборатория. Архивировано из оригинального (PDF) 8 июля 2009 года . Проверено 6 апреля 2017 года .
  55. ^ «Потенциал клеточного процессора для научных вычислений» . ACM Computing Frontiers . Проверено 6 апреля 2017 года .
  56. ^ «SCOP3: приблизительное руководство по научным вычислениям на PlayStation 3» (PDF) . Департамент компьютерных наук, Университет Теннесси. Архивировано из оригинального (PDF) 15 октября 2008 года . Проверено 8 мая 2007 года .
  57. Гардинер, Брайан (17 октября 2007 г.). «Астрофизик заменяет суперкомпьютер на восемь PlayStation 3» . Проводной . Проверено 17 октября 2007 года .
  58. ^ "PS3 Gravity Grid" . Гаурав Ханна, доцент инженерного колледжа Массачусетского университета в Дартмуте.
  59. ^ «Кластер PS3 создает самодельный более дешевый суперкомпьютер» .
  60. ^ Highfield, Роджер (17 февраля 2008). «Почему ученые любят игровые приставки» . Дейли телеграф . Лондон.
  61. Пекхэм, Мэтт (23 декабря 2008 г.). «Ничто не ускользнет от притяжения PlayStation 3, даже черная дыра» . Вашингтон Пост .
  62. Малик, Тарик (28 января 2009 г.). «Консоли PlayStation 3 преодолевают вибрации черной дыры» . Space.com .
  63. ^ Lyden, Jacki (21 февраля 2009). «PlayStation 3: суперкомпьютер со скидкой?» . NPR .
  64. Перейти ↑ Wallich, Paul (1 апреля 2009 г.). «Суперкомпьютер становится персональным» . IEEE Spectrum .
  65. ^ "Суперкомпьютер с питанием от PlayStation" . BBC News . 4 сентября 2010 г.
  66. Фаррелл, Джон (12 ноября 2010 г.). «Черные дыры и квантовые петли: больше, чем просто игра» . Forbes .
  67. ^ "PS3GRID.net" .
  68. ^ «Министерство обороны обсуждает новый суперкомпьютер Sony PlayStation» .
  69. ^ «Кластеры PlayStation 3, обеспечивающие университеты недорогими суперкомпьютерами» . Архивировано из оригинального 14 мая 2013 года .
  70. ^ «PlayStation 3 использовалась для взлома SSL, Xbox использовалась для игры Boogie Bunnies» . Engadget . Проверено 19 сентября 2012 года .
  71. ^ "IBM Mainframes Go 3-D" . eWeek . 26 апреля 2007 . Проверено 18 мая 2007 года .
  72. ^ «PlayStation ускоряет зондирование пароля» . BBC News . 30 ноября 2007 . Проверено 17 января 2011 года .
  73. ^ «CELL: новая платформа для цифровых развлечений» . Sony Computer Entertainment Inc. 9 марта 2005. Архивировано из оригинала 28 октября 2005 года.
  74. Бергманн, Арнд (21 июня 2005 г.). «ppc64: представьте платформу Cell / BPA, v3» . Проверено 22 марта 2007 года .
  75. ^ "Модель программирования сотового процессора" . LinuxTag 2005 . Архивировано из оригинального 18 ноября 2005 года . Проверено 11 июня 2005 года .
  76. ^ Шенкленд, Стивен (21 марта 2006). «Linux получает встроенную поддержку процессоров Cell» . CNET . Проверено 22 марта 2007 года .
  77. ^ «Terra Soft предоставит Linux для PLAYSTATION3» . Архивировано из оригинала на 30 марта 2009 года.
  78. ^ Terra Soft - Linux for Cell, PlayStation PS3, QS20, QS21, QS22, IBM System p, Mercury Cell и Apple PowerPC. Архивировано 23 февраля 2007 г. на Wayback Machine.
  79. ^ "Y-Bio" . 31 августа, 2007. Архивировано из оригинала на 2 сентября 2007 года.
  80. ^ "Арнд Бергманн на клетке" . IBM developerWorks. 25 июня 2005 г.
  81. ^ "Linux в системах на основе Cell BE" . Барселонский суперкомпьютерный центр. Архивировано из оригинала на 8 марта 2007 года . Проверено 22 марта 2007 года .
  82. ^ "Mercury Computer Systems выпускает комплект разработки программного обеспечения для PLAYSTATION (R) 3 для высокопроизводительных вычислений" . PRNewswire-FirstCall. 3 августа 2007 г.
  83. ^ « « CVCell »- модуль, разработанный Fixstars, который ускоряет библиотеку OpenCV для процессора Cell / BE» . Корпорация Fixstars. 28 ноября, 2007. Архивировано из оригинала 17 июля 2010 года . Проверено 12 декабря 2008 года .

Внешние ссылки [ править ]

  • Ресурсный центр Cell Broadband Engine
  • Страница ресурсов Sony Computer Entertainment Incorporated Cell
  • Конфигурируемый многопроцессорный комплект для разработки Cmpware для Cell BE
  • ISSCC 2005: Микропроцессор CELL, всесторонний обзор микроархитектуры CELL
  • Святой Чип!
  • Маленький широкополосный движок, который мог
  • Представляем сотовый процессор IBM / Sony / Toshiba - Часть I: процессоры SIMD
  • Представляем сотовый процессор IBM / Sony / Toshiba - Часть II: Сотовая архитектура
  • Душа клетки: интервью с доктором Х. Питером Хофсти