Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску
RSX 'Reality Synthesizer' на материнской плате PlayStation 3

В «Reality Synthesizer» RSX является патентованной графический процессор (GPU) codeveloped от Nvidia и Sony для PlayStation 3 игровой консоли. Это графический процессор, основанный на графическом процессоре Nvidia 7800GTX и, согласно Nvidia, представляет собой гибридную архитектуру G70 / G71 (ранее известную как NV47) с некоторыми модификациями. RSX имеет отдельные конвейеры вершинных и пиксельных шейдеров . Графический процессор использует 256 МБ оперативной памяти GDDR3 с тактовой частотой 650 МГц с эффективной скоростью передачи 1,3 ГГц и до 224 МБ основной памяти XDR с частотой 3,2 ГГц через ЦП (максимум 480 МБ). Несмотря на то, что он выполняет большую часть обработки графики, Cell Broadband Engine, процессор консоли , также дополнительно используется для некоторых вычислительных нагрузок консоли, связанных с графикой.

Технические характеристики [ править ]

Длина чипа внизу: 4,28 см

Если не указано иное, следующие спецификации основаны на пресс-релизе Sony на конференции E3 2005 [1], слайдах с той же конференции [2] и слайдах из презентации Sony на конференции Game Developer's Conference 2006 . [ необходима цитата ]

  • 550 МГц тактовая частота пиксельного шейдера / 500 МГц тактовая частота вершинного шейдера по процессу 90 нм (уменьшена до 65 нм в 2008 году [3] и до 40 нм в 2010 году [4] ), более 300 миллионов транзисторов
  • На базе NV47 ( архитектура Nvidia GeForce 7800 )
  • Little Endian
  • 24 блока фильтрации текстур (TF) и 8 блоков адресации текстуры вершин (TA)
    • 24 отфильтрованных отсчета за такт
    • Максимальная скорость заполнения Texel: 13,2 гигатекселя в секунду (24 текстуры * 550 МГц)
    • 32 нефильтрованных образца текстуры за такт (8 TA * 4 образца текстуры)
    • 8 блоков вывода рендеринга (ROP) / конвейеров рендеринга пикселей
      • Пиковая скорость заполнения пикселей (теоретическая): 4,4 гигапикселя в секунду
      • Максимальная частота дискретизации Z-буферизации : 8,8 гигасэмплов в секунду (2 Z-отсчета * 8 ROP * 550 МГц)
    • Максимальное количество операций скалярного произведения: 51 миллиард в секунду (в сочетании с Cell CPU)
    • 128-битная точность пикселей обеспечивает рендеринг с расширенным динамическим диапазоном
  • 256 МБ оперативной памяти GDDR3 при 650 МГц
    • 128-битная ширина шины памяти
    • Пропускная способность чтения и записи 20,8 ГБ / с
  • Интерфейс шины Cell FlexIO
    • Ширина шины интерфейса памяти Rambus XDR : 56 бит из 64 бит (последовательный)
    • 20 ГБ / с, чтение в ячейку и память XDR
    • 15 ГБ / с запись в ячейку и память XDR
  • 576 КБ кэша текстур (96 КБ на четверть пиксельных конвейеров)
  • Поддержка PSGL (OpenGL ES 1.1 + Nvidia Cg )
  • Поддержка сжатия текстур S3 [5]

Другие особенности: Поддержка билинейной трилинейной , анизотропной, Quincunx фильтрация текстур, сглаживание в шахматном порядке, до 4x MSAA , SSAA , Alpha для покрытия и Alphakill.

Номера моделей [ править ]

90 нм:

  • CXD2971AGB
  • CXD2971DGB
  • CXD2971GB
  • CXD2971-1GB
  • CXD297BGB

65 нм:

  • CXD2982
  • CXD2982GB
  • CXD2991GB
  • CXD2991BGB
  • CXD2991GGB
  • CXD2991CGB
  • CXD2991EGB

40 нм:

  • CXD5300AGB
  • CXD5300A1GB
  • CXD5301DGB
  • CXD5302DGB
  • CXD5302A1GB

Локальная структура физической памяти GDDR3 [ править ]

  • Общий объем памяти 256 МБ
  • 2 раздела (128 МБ)
  • 64-битная шина на раздел
  • 8 банков на раздел (16 МБ)
  • 4096 страниц в банке (4 КБ) -> 12-битный адрес строки
  • Блок памяти на странице -> 9-битный адрес столбца
  • Минимальная гранулярность доступа = 8 байтов -> такая же, как ширина шины между RSX <> GDDR

Карта памяти RSX [ править ]

Несмотря на то, что RSX имеет 256 МБ оперативной памяти GDDR3, не вся она пригодна для использования. Последние 4 МБ зарезервированы для отслеживания внутреннего состояния RSX и выданных команд. 4 МБ данных графического процессора содержат RAMIN, RAMHT, RAMFC, объекты DMA, графические объекты и графический контекст. Ниже приводится разбивка адреса в пределах 256 МБ RSX.

Помимо локальной памяти GDDR3, RSX также может получить доступ к основной памяти XDR, которая ограничена:

  • 0 МБ - 256 МБ (0x00000000 - 0x0FFFFFFF)
-или же-
  • 0 МБ - 512 МБ (0x00000000 - 0x1FFFFFFF)

Скорость, пропускная способность и задержка [ править ]

Пропускная способность системы (теоретический максимум):

  • Ячейка в / из 256 МБ XDR: 25,6 ГБ / с
  • От ячейки до RSX (IOIFO): 20 ГБ / с (практично: 15,8 ГБ / с при размере пакета 128 ГБ)
  • Ячейка от RSX (IOIFI): 15 ГБ / с (практично: 11,9 ГБ / с при размере пакета 128 Б)
  • RSX в / из 256 МБ GDDR3: 20,8 ГБ / с (@ 650 МГц)

Из-за вышеупомянутой схемы пути связи между различными микросхемами, а также различий в задержке и полосе пропускания между различными компонентами, существуют разные скорости доступа в зависимости от направления доступа по отношению к источнику и получателю. Ниже приведена диаграмма, показывающая скорость чтения и записи в память GDDR3 и XDR с точки зрения Cell и RSX. Обратите внимание, что это измеренные скорости (а не расчетные скорости), и они должны быть хуже, если задействован доступ RSX и GDDR3, потому что эти цифры были измерены, когда RSX работал на частоте 550 МГц, а память GDDR3 - на частоте 700 МГц. Поставляемая PS3 имеет RSX с тактовой частотой 500 МГц (передняя и задняя части, хотя пиксельные шейдеры работают отдельно внутри на частоте 550 МГц). Кроме того, память GDDR3 также была понижена до 650 МГц.

Таблица скорости [ править ]

Из-за очень низкой скорости чтения ячеек из памяти GDDR3 объемом 256 МБ, для ячейки более эффективно работать в XDR, а затем RSX извлекает данные из XDR и записывает их в GDDR3 для вывода на дисплей HDMI . Вот почему в RSX были включены дополнительные инструкции по поиску текстур, позволяющие загружать данные из памяти XDR (в отличие от локальной памяти GDDR3).

Библиотеки RSX [ править ]

RSX предназначен для трехмерной графики, и разработчики могут использовать различные библиотеки API для доступа к его функциям. Самый простой способ - использовать PSGL высокого уровня, который в основном представляет собой OpenGL | ES с добавленным программируемым конвейером, однако это непопулярно из-за накладных расходов на производительность на относительно слабом процессоре консоли. На более низком уровне разработчики могут использовать LibGCM , API, который строит буферы команд RSX на более низком уровне. (PSGL фактически реализован поверх LibGCM). Это делается путем настройки команд (через контекст FIFO) и объектов DMA и передачи их в RSX через вызовы DMA.

Отличия от архитектуры G70 [ править ]

RSX «Reality Synthesizer» основан на архитектуре G70, но имеет несколько изменений в ядре. [6] Самая большая разница между двумя чипами заключается в том, как работает пропускная способность памяти. G70 поддерживает рендеринг только в локальную память , тогда как RSX может выполнять рендеринг как в системную, так и в локальную память. Поскольку рендеринг из системной памяти имеет гораздо большую задержку по сравнению с рендерингом из локальной памяти, пришлось изменить архитектуру чипа, чтобы избежать потери производительности. Это было достигнуто за счет увеличения размера чипа для размещения больших буферов и кешей , чтобы сохранить графический конвейер.полный. В результате RSX имеет только 60% пропускной способности локальной памяти G70, что заставляет разработчиков использовать системную память для достижения целевых показателей производительности. [6]

Другие особенности / отличия RSX:

  • Дополнительные инструкции шейдера
  • Дополнительная логика поиска текстур (помогает RSX переносить данные из XDR)
  • Быстрая векторная нормализация

Пресс-релизы [ править ]

В журнале PlayStation Magazine процитировали сотрудники Sony, заявившие, что «RSX во многом похож на NVIDIA 7800, основанную на архитектуре G70». [ необходима цитата ] Поскольку G70 способен выполнять 136 операций шейдера за такт, ожидалось, что RSX будет иметь такое же количество параллельных конвейеров пиксельных и вершинных шейдеров, что и G70, который содержит 24 пиксельных и 8 вершинных конвейеров.

Генеральный директор Nvidia Джен-Хсун Хуанг заявил во время предварительной пресс-конференции Sony на E3 2005, что RSX вдвое мощнее GeForce 6800 Ultra. [2]

См. Также [ править ]

  • Xenos - графический процессор, используемый в Xbox 360
  • Cell Broadband Engine - ЦП, используемый в PlayStation 3

Ссылки [ править ]

  1. ^ "SONY COMPUTER ENTERTAINMENT INC. ЗАПУСКАЕТ СВОЕ ПОКОЛЕНИЕ КОМПЬЮТЕРНОЙ СИСТЕМЫ РАЗВЛЕЧЕНИЙ, PLAYSTATION3 ВЕСНОЙ 2006 ГОДА" (пресс-релиз). Sony Computer Entertainment Inc. 16 мая 2005 г.
  2. ^ a b «Sony представляет PlayStation 3, запуск которой состоится в 2006 году» . AnandTech. 2005-05-16.
  3. ^ "Графический чип PS3 осенью перейдет на 65 нм" . Edge Online. 26 июня 2008 г.
  4. ^ "Sony PS3 модернизирована с помощью более прохладного 40-нм графического чипа RSX, прибыль ждет (обновлено)" . Engadget. 26 апреля 2010 г.
  5. ^ Gantayat, Anoop (2006-01-30). «Новые инструменты PS3» . IGN.com . Проверено 28 августа 2006 .
  6. ^ a b «Microsoft Xbox 360, Sony PS3 - Обсуждение оборудования» . Проверено 8 марта 2014 .