В «Reality Synthesizer» RSX является патентованной графический процессор (GPU) codeveloped от Nvidia и Sony для PlayStation 3 игровой консоли. Это графический процессор, основанный на графическом процессоре Nvidia 7800GTX и, согласно Nvidia, представляет собой гибридную архитектуру G70 / G71 (ранее известную как NV47) с некоторыми модификациями. RSX имеет отдельные конвейеры вершинных и пиксельных шейдеров . Графический процессор использует 256 МБ оперативной памяти GDDR3 с тактовой частотой 650 МГц с эффективной скоростью передачи 1,3 ГГц и до 224 МБ основной памяти XDR с частотой 3,2 ГГц через ЦП (максимум 480 МБ). Несмотря на то, что он выполняет большую часть обработки графики, Cell Broadband Engine, процессор консоли , также дополнительно используется для некоторых вычислительных нагрузок консоли, связанных с графикой.
Характеристики
Если не указано иное, следующие спецификации основаны на пресс-релизе Sony на конференции E3 2005 [1], слайдах с той же конференции [2] и слайдах из презентации Sony на конференции Game Developer's Conference 2006 . [ необходима цитата ]
- 550 МГц тактовая частота пиксельного шейдера / 500 МГц тактовая частота вершинного шейдера по процессу 90 нм (уменьшена до 65 нм в 2008 году [3] и до 40 нм в 2010 году [4] ), более 300 миллионов транзисторов
- На базе NV47 ( архитектура Nvidia GeForce 7800 )
- Little Endian
- 24 блока фильтрации текстур (TF) и 8 блоков адресации текстуры вершин (TA)
- 24 отфильтрованных отсчета за такт
- Максимальная скорость заполнения Texel: 13,2 гигатекселя в секунду (24 текстуры * 550 МГц)
- 32 нефильтрованных образца текстуры за такт (8 TA * 4 образца текстуры)
- 8 блоков вывода рендеринга (ROP) / конвейеров рендеринга пикселей
- Пиковая скорость заполнения пикселей (теоретическая): 4,4 гигапикселя в секунду
- Максимальная частота дискретизации Z-буферизации : 8,8 гигасэмплов в секунду (2 Z-отсчета * 8 ROP * 550 МГц)
- Максимальное количество операций скалярного произведения: 51 миллиард в секунду (в сочетании с Cell CPU)
- 128-битная точность пикселей обеспечивает рендеринг с расширенным динамическим диапазоном
- 256 МБ оперативной памяти GDDR3 при 650 МГц
- 128-битная ширина шины памяти
- Пропускная способность чтения и записи 20,8 ГБ / с
- Интерфейс шины Cell FlexIO
- Ширина шины интерфейса памяти Rambus XDR : 56 бит из 64 бит (последовательный)
- 20 ГБ / с, чтение в ячейку и память XDR
- 15 ГБ / с запись в ячейку и память XDR
- 576 КБ кэша текстур (96 КБ на четверть пиксельных конвейеров)
- Поддержка PSGL (OpenGL ES 1.1 + Nvidia Cg )
- Поддержка сжатия текстур S3 [5]
Другие особенности: Поддержка билинейной трилинейной , анизотропной, Quincunx фильтрация текстур, сглаживание в шахматном порядке, до 4x MSAA , SSAA , Alpha для покрытия и Alphakill.
Номера моделей
90 нм:
- CXD2971AGB
- CXD2971DGB
- CXD2971GB
- CXD2971-1GB
- CXD297BGB
65 нм:
- CXD2982
- CXD2982GB
- CXD2991GB
- CXD2991BGB
- CXD2991GGB
- CXD2991CGB
- CXD2991EGB
40 нм:
- CXD5300AGB
- CXD5300A1GB
- CXD5301DGB
- CXD5302DGB
- CXD5302A1GB
Локальная структура физической памяти GDDR3
- Общий объем памяти 256 МБ
- 2 раздела (128 МБ)
- 64-битная шина на раздел
- 8 банков на раздел (16 МБ)
- 4096 страниц в банке (4 КБ) -> 12-битный адрес строки
- Блок памяти на странице -> 9-битный адрес столбца
- Минимальная гранулярность доступа = 8 байтов -> такая же, как ширина шины между RSX <> GDDR
Карта памяти RSX
Несмотря на то, что RSX имеет 256 МБ оперативной памяти GDDR3, не вся она пригодна для использования. Последние 4 МБ зарезервированы для отслеживания внутреннего состояния RSX и выданных команд. 4 МБ данных графического процессора содержат RAMIN, RAMHT, RAMFC, объекты DMA, графические объекты и графический контекст. Ниже приводится разбивка адреса в пределах 256 МБ RSX.
Диапазон адресов | Размер | Комментарий |
---|---|---|
0000000-FBFFFFF | 252 МБ | Кадровый буфер |
FC00000-FFFFFFF | 4 МБ | Данные графического процессора |
FF80000-FFFFFFF | 512 КБ | RAMIN: Экземплярная память |
FF90000-FF93FFF | 16 КБ | RAMHT: хеш-таблица |
FFA0000-FFA0FFF | 4 КБ | RAMFC: контекст FIFO |
FFC0000-FFCFFFF | 64 КБ | Объекты DMA |
FFD0000-FFDFFFF | 64 КБ | Графические объекты |
FFE0000-FFFFFFF | 128 КБ | ГРАФИК: графический контекст |
Помимо локальной памяти GDDR3, RSX также может получить доступ к основной памяти XDR, которая ограничена:
- 0 МБ - 256 МБ (0x00000000 - 0x0FFFFFFF)
- -или же-
- 0 МБ - 512 МБ (0x00000000 - 0x1FFFFFFF)
Скорость, пропускная способность и задержка
Пропускная способность системы (теоретический максимум):
- Ячейка в / из 256 МБ XDR: 25,6 ГБ / с
- От ячейки до RSX (IOIFO): 20 ГБ / с (практично: 15,8 ГБ / с при размере пакета 128 ГБ)
- Ячейка от RSX (IOIFI): 15 ГБ / с (практично: 11,9 ГБ / с при размере пакета 128 Б)
- RSX в / из 256 МБ GDDR3: 20,8 ГБ / с (@ 650 МГц)
Из-за вышеупомянутой схемы пути связи между различными микросхемами, а также различий в задержке и полосе пропускания между различными компонентами, существуют разные скорости доступа в зависимости от направления доступа по отношению к источнику и получателю. Ниже приведена диаграмма, показывающая скорость чтения и записи в память GDDR3 и XDR с точки зрения Cell и RSX. Обратите внимание, что это измеренные скорости (а не расчетные скорости), и они должны быть хуже, если задействован доступ RSX и GDDR3, потому что эти цифры были измерены, когда RSX работал на частоте 550 МГц, а память GDDR3 - на частоте 700 МГц. Поставляемая PS3 имеет RSX с тактовой частотой 500 МГц (передняя и задняя части, хотя пиксельные шейдеры работают отдельно внутри на 550 МГц). Кроме того, память GDDR3 также была понижена до 650 МГц.
Таблица скорости
Процессор | 256 МБ XDR | 256 МБ GDDR3 |
---|---|---|
Ячейка Читать | 16,8 ГБ / с | 16 МБ / с (15,6 МБ / с при 650 МГц) |
Запись в ячейку | 24,9 ГБ / с | 4 ГБ / с |
RSX Читать | 15,5 ГБ / с | 22,4 ГБ / с (20,8 ГБ / с при 650 МГц) |
RSX Запись | 10,6 ГБ / с | 22,4 ГБ / с (20,8 ГБ / с при 650 МГц) |
Из-за очень низкой скорости чтения ячеек из памяти GDDR3 объемом 256 МБ, для ячейки более эффективно работать в XDR, а затем RSX извлекает данные из XDR и записывает их в GDDR3 для вывода на дисплей HDMI . Вот почему в RSX были включены дополнительные инструкции по поиску текстур, позволяющие загружать данные из памяти XDR (в отличие от локальной памяти GDDR3).
Библиотеки RSX
RSX предназначен для трехмерной графики, и разработчики могут использовать различные библиотеки API для доступа к его функциям. Самый простой способ - использовать PSGL высокого уровня, который в основном представляет собой OpenGL | ES с добавленным программируемым конвейером, однако это непопулярно из-за накладных расходов на производительность на относительно слабом процессоре консоли. На более низком уровне разработчики могут использовать LibGCM , API, который строит буферы команд RSX на более низком уровне. (PSGL фактически реализован поверх LibGCM). Это делается путем настройки команд (через контекст FIFO) и объектов DMA и передачи их в RSX через вызовы DMA.
Отличия от архитектуры G70
RSX «Reality Synthesizer» основан на архитектуре G70, но имеет несколько изменений в ядре. [6] Самая большая разница между двумя чипами заключается в том, как работает пропускная способность памяти. G70 поддерживает рендеринг только в локальную память , тогда как RSX может выполнять рендеринг как в системную, так и в локальную память. Поскольку рендеринг из системной памяти имеет гораздо большую задержку по сравнению с рендерингом из локальной памяти, пришлось изменить архитектуру чипа, чтобы избежать потери производительности. Это было достигнуто за счет увеличения размера чипа для размещения больших буферов и кешей , чтобы поддерживать графический конвейер заполненным. В результате RSX имеет только 60% пропускной способности локальной памяти G70, что заставляет разработчиков использовать системную память для достижения целевых показателей производительности. [6]
Разница | RSX | nVidia 7800GTX |
---|---|---|
Шина памяти GDDR3 | 128 бит | 256 бит |
ROP | 8 | 16 |
Кэш пост-преобразования и освещения | 63 макс. Вершины | 45 макс. Вершин |
Общий кэш текстур на четыре пиксельных канала (L1 и L2) | 96 КБ | 48кБ |
ЦП интерфейс | FlexIO | PCI-Экспресс 16x |
Технология | 28 нм / 40 нм / 65 нм / 90 нм | 110 нм |
Другие особенности / отличия RSX:
- Дополнительные инструкции по шейдеру
- Дополнительная логика поиска текстур (помогает RSX переносить данные из XDR)
- Быстрая векторная нормализация
пресс-релизы
В журнале PlayStation Magazine процитировали сотрудников Sony, в которых говорилось, что «RSX имеет много общего с NVIDIA 7800, основанной на архитектуре G70». [ необходима цитата ] Поскольку G70 способен выполнять 136 операций шейдера за такт, ожидалось, что RSX будет иметь такое же количество параллельных конвейеров пиксельных и вершинных шейдеров, что и G70, который содержит 24 пиксельных и 8 вершинных конвейеров.
Генеральный директор Nvidia Джен-Хсун Хуанг заявил во время предварительной пресс-конференции Sony на E3 2005, что RSX вдвое мощнее GeForce 6800 Ultra. [2]
Смотрите также
- Xenos - графический процессор, используемый в Xbox 360
- Cell Broadband Engine - ЦП, используемый в PlayStation 3
Рекомендации
- ^ "SONY COMPUTER ENTERTAINMENT INC. ЗАПУСК СВОЕГО ПОКОЛЕНИЯ КОМПЬЮТЕРНОЙ СИСТЕМЫ РАЗВЛЕЧЕНИЙ, PLAYSTATION3 ВЕСНОЙ 2006 ГОДА" (пресс-релиз). Sony Computer Entertainment Inc. 16 мая 2005 г.
- ^ а б «Sony представляет PlayStation 3, запуск которой состоится в 2006 году» . AnandTech. 2005-05-16.
- ^ «Графический чип PS3 осенью перейдет на 65 нм» . Edge Online. 26 июня 2008 г.
- ^ «Sony PS3 модернизирована с более крутым 40-нм графическим чипом RSX, прибыли ждут (обновлено)» . Engadget. 26 апреля 2010 г.
- ^ Гантаят, Ануп (30 января 2006 г.). «Новые инструменты PS3» . IGN.com . Проверено 28 августа 2006 .
- ^ а б «Microsoft Xbox 360, Sony PS3 - Обсуждение оборудования» . Проверено 8 марта 2014 .