Элемент обработки энергии - Power Processing Element

Элемент обработки энергии
Общая информация
Запущен2005
Снято с производстваПодарок
ПродаетсяIBM, Sony, Microsoft
РазработаноIBM
Общий производитель (ы)
Спектакль
Максимум. ЦПУ тактовая частотаОт 2,8 ГГц до 3,2 ГГц
Кеш
L1 тайник32 КБ инструкции + 32 КБ данных
Архитектура и классификация
ЗаявлениеИгровая консоль, HPC
Мин. размер элементаОт 90 нм до 45 нм
МикроархитектураPPU
Набор инструкцийPowerPC 2.02
Физические характеристики
Ядра
  • 1
GPU (ы)Ксенос, в XCGPU вариант.
Продукты, модели, варианты
Вариант (ы)Ячейка BE, XCPU, XCGPU, PowerXCell 8i

В Элемент обработки энергии (СИЗ) включает Блок обработки энергии (PPU) и кэш-память L2 объемом 512 КБ. В большинстве случаев PPU используется в PPE. PPU - это 64-битный двухпоточный чтобы PowerPC 2.02 микропроцессор основной разработано IBM для использования в основном в Игровые приставки PlayStation 3 и Xbox 360, но также нашел применение в высокопроизводительных вычислениях в суперкомпьютеры например, установка записи IBM Roadrunner.

PPU используется в качестве основного ядра ЦП в трех различных процессорах:

  • В Ячейка широкополосного доступа (Cell BE), который используется в основном в Sony с PlayStation 3 игровая консоль. Он использует PPE и поставляется в трех версиях: 90 нм, 65 нм и 45 нм.
  • В PowerXCell 8i который является версией Cell BE с улучшенным FPU и подсистемой памяти. Он выпускался только в единственной 65-нм версии.
  • В XCPU который используется в трехъядерной конфигурации и унифицированном кэше L2 объемом 1 МБ внутри Microsoft Xbox 360. Он поставляется в трех версиях: 90 нм и 65 нм, а также 45 нм. XCGPU со встроенным графический процессор из ATI.

Основные особенности

Единицы исполнения

Чтобы

PPU является процессором в порядке очереди, но у него есть некоторые уникальные особенности, которые позволяют ему достичь некоторых преимуществ выполнения вне очереди без дорогостоящего переупорядочивания оборудования. При достижении промаха кэша L1 - он может выполняться после промаха кэша, останавливаясь только тогда, когда инструкция фактически зависит от загрузки. Он может отправлять до 8 инструкций загрузки в кэш L2 в неупорядоченном порядке. У него есть конвейер задержки инструкций - побочный путь, который позволяет ему выполнять инструкции, которые обычно вызывают стойла трубопроводов не задерживая остальных трубопровод. Конвейер задержки инструкций используется для загрузки / сохранения вне очереди: промахи кэша помещаются туда, пока он перемещается.

Трубопровод СИЗ

PPE имеет 23 этапа общего конвейера с дополнительными 11 этапами, возможными для микрокода и дополнительными 4 этапами, возможными для прогнозирования ветвлений. [2]

Многопоточность

PPU запускает два аппаратные потоки одновременно. В основные регистры для выполнения кода дублируются, как и регистры исключений и обработки прерываний, а также несколько важных массивов и очередей. Они могут одновременно генерировать исключения и выполнять прогнозирование ветвлений для своих индивидуальных историй ветвлений. Механизм выполнения и кеши не дублируются, так что это все еще одноядерный дизайн.[3]

Емкость с плавающей запятой

это 64-битный двойная точность блок с плавающей запятой и 128 бит Блок VMX (с использованием AltiVec набор команд), может выполнять теоретические 12 операций с плавающей запятой за цикл, поскольку его модуль с плавающей запятой может выполнять умножение-сложение с плавающей запятой и имеет размер не менее 64 бит. Это дает 3,2 миллиарда тактовых циклов × 12 = 38,4 миллиарда операций с плавающей запятой в секунду.

PPU улучшен в PowerXCell 8i процессор, позволяющий выполнять операции с плавающей запятой двойной точности за один цикл, адаптированный для высокопроизводительных вычислений на суперкомпьютерах.

Блок VMX в XCPU в Xbox 360 усилено 128 регистры и не полностью совместим с обычным AltiVec.

Рекомендации

  1. ^ Коран, Сандип (2009). Практическое программирование на ядре широкополосной сотовой связи. Springer Science & Business Media. п. 17. ISBN  9781441903082.
  2. ^ Архитектура Cell Broadband Engine и ее первая реализация
  3. ^ Глава 2 - Элемент обработки энергии (СИЗ)