Синтезатор реальности RSX - RSX Reality Synthesizer
Эта статья возможно содержит оригинальные исследования.Март 2018 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В RSX 'синтезатор реальности' это проприетарный графический процессор (GPU), код разработки Nvidia и Sony для PlayStation 3 игровая консоль. Это графический процессор на базе Nvidia. 7800GTX графический процессор и, согласно Nvidia, представляет собой гибридную архитектуру G70 / G71 (ранее известную как NV47) с некоторыми модификациями. RSX имеет отдельные вершинный и пиксельный шейдер. трубопроводы. Графический процессор использует 256 МБ GDDR3 ОЗУ с тактовой частотой 650 МГц с эффективной скоростью передачи 1,3 ГГц и до 224 МБ основной памяти XDR с частотой 3,2 ГГц через ЦП (макс. 480 МБ). Несмотря на то, что она выполняет большую часть обработки графики, Ячейка широкополосного доступа, консоли ЦПУ, также используется дополнительно для некоторых связанных с графикой вычислительных нагрузок консоли.
Характеристики
Если не указано иное, следующие характеристики основаны на пресс-релизе Sony на E3 Конференция 2005 г.,[1] слайды с той же конференции,[2] и слайды с презентации Sony на выставке 2006 г. Конференция разработчиков игр.[нужна цитата ]
- Частота пиксельного шейдера 550 МГц / частота вершинного шейдера 500 МГц 90 нм процесс (уменьшен до 65 нм в 2008[3] и до 40 нм в 2010 г.[4]), 300+ миллионов транзисторов
- На базе NV47 (Nvidia GeForce 7800 архитектура)
- Little Endian
- Многосторонние программируемые параллельные конвейеры шейдеров с плавающей запятой, независимая архитектура пиксельных / вершинных шейдеров
- 24 параллельных пиксельных шейдера ALU конвейеры с тактовой частотой 550 МГц
- 5 операций ALU на конвейер, на цикл (2 вектора4, 2 скалярных / двойных / совместных и туманных ALU, 1 текстурный ALU)[нужна цитата ]
- 16 операций с плавающей запятой на конвейер за цикл[5]
- Операций с плавающей запятой в секунду (только пиксельные шейдеры): 211,2 GFLOPS (550 * 24 * 16) [6]
- 8 параллельных вершинных конвейеров
- 2 операции ALU на конвейер, на цикл (1 вектор4 и 1 скаляр, двойная проблема)
- 10 FLOPS на трубопровод, за цикл[7]
- Операций с плавающей запятой в секунду (только вершинные конвейеры): 40 GFLOPS (500 * 8 * 10)
- Общее количество операций с плавающей запятой в секунду (пиксель + вершина): 251,2 GFLOPS (211,2 + 40)
- 24 блока фильтрации текстур (TF) и 8 блоков адресации текстуры вершин (TA)
- 24 отфильтрованных отсчета за такт
- Максимальная скорость заполнения Texel: 13,2 гигатекселя в секунду (24 текстуры * 550 МГц)
- 32 нефильтрованных образца текстуры за такт (8 TA * 4 образца текстуры)
- 8 модулей вывода (ROP) / конвейеров рендеринга пикселей
- Пиковая скорость заполнения пикселей (теоретическая): 4,4 гигапикселя в секунду
- Максимум Z-буферизация частота дискретизации: 8,8 гигасэмплов в секунду (2 Z-отсчета * 8 ROP * 550 МГц)
- Максимальное количество операций скалярного произведения: 51 миллиард в секунду (в сочетании с Cell CPU)
- 128-битная точность пикселей Рендеринг с расширенным динамическим диапазоном
- 24 параллельных пиксельных шейдера ALU конвейеры с тактовой частотой 550 МГц
- 256 МБ оперативной памяти GDDR3 при 650 МГц
- 128-битная ширина шины памяти
- Пропускная способность чтения и записи 20,8 ГБ / с
- Интерфейс шины Cell FlexIO
- Рамбус XDR Ширина шины интерфейса памяти: 56 бит из 64 бит (последовательный)
- 20 ГБ / с, чтение в ячейку и память XDR
- 15 ГБ / с запись в ячейку и память XDR
- 576 КБ кэша текстур (96 КБ на четверть пиксельных конвейеров)
- Поддержка PSGL (OpenGL ES 1.1 + Nvidia Cg )
- Поддержка для Сжатие текстур S3[8]
Другие особенности: поддержка билинейной, трехлинейный, анизотропный, Quincunx фильтрация текстур, сглаживание quincunx, до 4xMSAA, SSAA, Альфа в Покрытие и Alphakill.
Номера моделей
90 нм:
- CXD2971AGB
- CXD2971DGB
- CXD2971GB
- CXD2971-1GB
- CXD297BGB
65 нм:
- CXD2982
- CXD2982GB
- CXD2991GB
- CXD2991BGB
- CXD2991GGB
- CXD2991CGB
- CXD2991EGB
40 нм:
- CXD5300AGB
- CXD5300A1GB
- CXD5301DGB
- CXD5302DGB
- CXD5302A1GB
Локальная структура физической памяти GDDR3
- Общий объем памяти 256 МБ
- 2 раздела (128 МБ)
- 64-битная шина на раздел
- 8 банков на раздел (16 МБ)
- 4096 страниц в банке (4 КБ) -> 12-битный адрес строки
- Блок памяти на странице -> 9-битный адрес столбца
- Минимальная гранулярность доступа = 8 байтов -> такая же, как ширина шины между RSX <> GDDR
Карта памяти RSX
Хотя RSX имеет 256 МБ ОЗУ GDDR3, не все из них можно использовать. Последние 4 МБ зарезервированы для отслеживания внутреннего состояния RSX и выданных команд. 4 МБ данных графического процессора содержат RAMIN, RAMHT, RAMFC, объекты DMA, графические объекты и графический контекст. Ниже приводится разбивка адресов в пределах 256 МБ RSX.
Диапазон адресов | Размер | Комментарий |
---|---|---|
0000000-FBFFFFF | 252 МБ | Кадровый буфер |
FC00000-FFFFFFF | 4 МБ | Данные GPU |
FF80000-FFFFFFF | 512 КБ | RAMIN: Экземплярная память |
FF90000-FF93FFF | 16 КБ | RAMHT: хеш-таблица |
FFA0000-FFA0FFF | 4 КБ | RAMFC: контекст FIFO |
FFC0000-FFCFFFF | 64 КБ | Объекты DMA |
FFD0000-FFDFFFF | 64 КБ | Графические объекты |
FFE0000-FFFFFFF | 128 КБ | ГРАФИК: графический контекст |
Помимо локальной памяти GDDR3, RSX также может получить доступ к основной памяти XDR, которая ограничена:
- 0 МБ - 256 МБ (0x00000000 - 0x0FFFFFFF)
- -или же-
- 0 МБ - 512 МБ (0x00000000 - 0x1FFFFFFF)
Скорость, пропускная способность и задержка
Пропускная способность системы (теоретический максимум):
- Ячейка в / из 256 МБ XDR: 25,6 ГБ / с
- От ячейки к RSX (IOIFO): 20 ГБ / с (практично: 15,8 ГБ / с при размере пакета 128 ГБ)
- Ячейка от RSX (IOIFI): 15 ГБ / с (практично: 11,9 ГБ / с при размере пакета 128 Б)
- RSX в / из 256 МБ GDDR3: 20,8 ГБ / с (@ 650 МГц)
Из-за вышеупомянутой схемы пути связи между различными микросхемами, а также различий в задержке и полосе пропускания между различными компонентами существуют разные скорости доступа в зависимости от направления доступа по отношению к источнику и получателю. Ниже приведена диаграмма, показывающая скорость чтения и записи в память GDDR3 и XDR с точки зрения Cell и RSX. Обратите внимание, что это измеренные скорости (а не расчетные скорости), и они должны быть хуже, если задействован доступ RSX и GDDR3, потому что эти цифры были измерены, когда RSX работал на частоте 550 МГц, а память GDDR3 - на частоте 700 МГц. Поставляемая PS3 имеет RSX с тактовой частотой 500 МГц (передняя и задняя части, хотя пиксельные шейдеры работают отдельно внутри на 550 МГц). Кроме того, память GDDR3 также была уменьшена до 650 МГц.
Таблица скорости
Процессор | 256 МБ XDR | 256 МБ GDDR3 |
---|---|---|
Ячейка Читать | 16,8 ГБ / с | 16 МБ / с (15,6 МБ / с при 650 МГц) |
Запись в ячейку | 24,9 ГБ / с | 4 ГБ / с |
RSX Читать | 15,5 ГБ / с | 22,4 ГБ / с (20,8 ГБ / с при 650 МГц) |
RSX Запись | 10,6 ГБ / с | 22,4 ГБ / с (20,8 ГБ / с при 650 МГц) |
Из-за очень низкой скорости чтения ячеек из памяти GDDR3 256 МБ, для ячейки более эффективно работать в XDR, а затем RSX извлекает данные из XDR и записывает их в GDDR3 для вывода в HDMI отображать. Вот почему в RSX были включены дополнительные инструкции по поиску текстур, позволяющие загружать данные из памяти XDR (в отличие от локальной памяти GDDR3).
Библиотеки RSX
RSX предназначен для трехмерной графики, и разработчики могут использовать различные библиотеки API для доступа к его функциям. Самый простой способ - использовать PSGL высокого уровня, который в основном представляет собой OpenGL | ES с добавленным программируемым конвейером, однако это непопулярно из-за накладных расходов на производительность на относительно слабом процессоре консоли. На более низком уровне разработчики могут использовать LibGCM, который представляет собой API, создающий RSX командные буферы на более низком уровне. (PSGL фактически реализован поверх LibGCM). Это делается путем настройки команд (через контекст FIFO) и объектов DMA и отправки их в RSX через вызовы DMA.
Отличия от архитектуры G70
RSX «Reality Synthesizer» основан на архитектуре G70, но имеет несколько изменений в ядре.[9] Самая большая разница между двумя чипами заключается в том, как работает пропускная способность памяти. G70 поддерживает рендеринг только в локальная память, в то время как RSX может выполнять рендеринг как в системную, так и в локальную память. Поскольку рендеринг из системной памяти имеет гораздо более высокую задержку по сравнению с рендерингом из локальной памяти, пришлось изменить архитектуру чипа, чтобы избежать потери производительности. Это было достигнуто за счет увеличения размера чипа для размещения большего буферы и тайники чтобы сохранить графический конвейер полный. В результате RSX имеет только 60% пропускной способности локальной памяти G70, что заставляет разработчиков использовать системную память для достижения целевых показателей производительности.[9]
Разница | RSX | nVidia 7800GTX |
---|---|---|
Шина памяти GDDR3 | 128 бит | 256 бит |
ROP | 8 | 16 |
Кэш пост-преобразования и освещения | 63 макс. Вершины | 45 макс. Вершин |
Общий кэш текстур на четыре пиксельных канала (L1 и L2) | 96 КБ | 48кБ |
ЦП интерфейс | FlexIO | PCI-Express 16x |
Технологии | 28 нм / 40 нм / 65 нм / 90 нм | 110 нм |
Другие особенности / отличия RSX:
- Дополнительные инструкции шейдера
- Дополнительная логика поиска текстур (помогает RSX переносить данные из XDR)
- Быстрая векторная нормализация
пресс-релизы
Сотрудники Sony цитировались в Журнал PlayStation говоря, что "RSX имеет много общего с NVIDIA 7800 который основан на архитектуре G70 ».[нужна цитата ] Поскольку G70 способен выполнять 136 операций шейдера за такт, ожидалось, что RSX будет иметь такое же количество параллельных конвейеров пиксельных и вершинных шейдеров, что и G70, который содержит 24 пиксельных и 8 вершинных конвейеров.
Генеральный директор Nvidia Джен-Сун Хуан заявил во время пред-показательной пресс-конференции Sony в E3 2005 г., что RSX вдвое мощнее GeForce 6800 Ultra.[2]
Смотрите также
- Ксенос - GPU используется в Xbox 360
- Ячейка широкополосного доступа - ЦПУ используется в PlayStation 3
Рекомендации
- ^ "SONY COMPUTER ENTERTAINMENT INC. ВЕСНОЙ 2006 ГОДА ЗАПУСКАЕТ СВОЮ КОМПЬЮТЕРНУЮ СИСТЕМУ РАЗВЛЕЧЕНИЙ СВОЕГО ПОКОЛЕНИЯ, PLAYSTATION3" (пресс-релиз). Sony Computer Entertainment Inc. 16 мая 2005 г.
- ^ а б «Sony представляет PlayStation 3, запуск которой состоится в 2006 году». AnandTech. 2005-05-16.
- ^ «Графический чип PS3 осенью перейдет на 65 нм». Edge Online. 26 июня 2008 г.
- ^ «Sony PS3 модернизирована с помощью более прохладного 40-нм графического чипа RSX, прибыль ждет (обновлено)». Engadget. 2010-04-26.
- ^ Габриэль Торрес (22 июня 2005 г.). «Покрытие выпуска GeForce 7800 GTX».
- ^ «Секреты PlayStation 3».
- ^ Вычислительная техника (22.06.2005). «Стр. 3 - GeForce 7800 GTX: ядерный вариант Nvidia». ExtremeTech. Получено 2013-06-25.
- ^ Гантаят, Ануп (30 января 2006 г.). «Новые инструменты PS3». IGN.com. Получено 2006-08-28.
- ^ а б "Microsoft Xbox 360, Sony PS3 - Обсуждение оборудования". Получено 2014-03-08.