МОЩНОСТЬ7 - POWER7
8-процессорный процессор IBM Power7 4 ГГц (снятый с производства) от IBM 9119 | |
Общая информация | |
---|---|
Запущен | 2010 |
Разработано | IBM |
Спектакль | |
Максимум. ЦПУ тактовая частота | От 2,4 ГГц до 4,25 ГГц |
Кеш | |
L1 тайник | 32 + 32 КБ / ядро |
Кэш L2 | 256 КБ / ядро |
Кэш L3 | 4 МБ / ядро |
Архитектура и классификация | |
Мин. размер элемента | 45 нм |
Набор инструкций | Питание ISA (Power ISA v.2.06 ) |
Физические характеристики | |
Ядра |
|
История | |
Предшественник | МОЩНОСТЬ6 |
Преемник | МОЩНОСТЬ8 |
МОЩНОСТЬ, PowerPC, и Питание ISA архитектуры |
---|
NXP (ранее Freescale и Motorola) |
IBM |
IBM / Nintendo |
Другой |
Ссылки по теме |
Отменено серым цветом, исторический курсивом |
МОЩНОСТЬ7 это семья суперскалярный симметричные мультипроцессоры на основе Питание ISA 2.06 архитектура набора команд выпущенный в 2010 году, пришедший на смену МОЩНОСТЬ6. POWER7 был разработан IBM на нескольких сайтах, включая IBM Рочестер, Миннесота; Остин, Техас; Essex Junction, VT; Исследовательский центр Т. Дж. Уотсона, Нью-Йорк; Бромон, королевский адвокат[1] и IBM Deutschland Research & Development GmbH, Бёблинген, Лаборатории Германии. IBM анонсировала серверы на базе POWER7 8 февраля 2010 года.[2][3]
История
IBM выиграла 244 миллиона долларов DARPA контракт в ноябре 2006 г. на разработку петаскейл суперкомпьютер архитектура до конца 2010 г. в HPCS проект. В контракте также указано, что архитектура будет коммерчески доступной. Предложение IBM, PERCS (Производительная, простая в использовании, надежная компьютерная система), с которой они выиграли контракт, основана на процессоре POWER7, AIX операционная система и Общая параллельная файловая система.[4]
Одна из функций, над которой совместно работали IBM и DARPA, - это модификация аппаратного обеспечения адресации и таблицы страниц для поддержки глобального общего пространства памяти для кластеров POWER7. Это позволяет ученым-исследователям программировать кластер, как если бы это была единая система, без использования передачи сообщений. С точки зрения производительности это важно, поскольку некоторые ученые не знакомы с MPI или другие методы параллельного программирования, используемые в кластерах.[5]
Дизайн
POWER7 суперскалярный симметричный мультипроцессор Архитектура представляет собой существенную эволюцию дизайна POWER6 с упором на энергоэффективность за счет использования нескольких ядер и одновременная многопоточность (SMT).[6] Архитектура POWER6 создавалась с нуля, чтобы максимизировать частоту процессора за счет энергоэффективности. Он достиг замечательной частоты 5 ГГц. В то время как POWER6 имеет двухъядерный процессор, каждый из которых поддерживает двустороннюю одновременная многопоточность (SMT) процессор IBM POWER 7 имеет до восьми ядер и четыре потока на ядро, что в сумме дает 32 одновременных потока.[7]
IBM заявила на ISCA 29[8] эта пиковая производительность была достигнута за счет высокочастотных конструкций с 10–20 FO4 задержки на трубопровод этап за счет энергоэффективности. Однако двоичный модуль с плавающей запятой POWER6 обеспечивает "6-тактный, 13-FO4 трубопровод".[9][требуется разъяснение ]Таким образом, конвейер для ЦП POWER7 был снова изменен, как и для проектов POWER5 и POWER6. В некотором отношении эта переработка аналогична повороту Intel в 2005 году, когда P4 покинула микроархитектуру x86 7-го поколения.
Характеристики
СИЛА 7 суперскалярный симметричный мультипроцессор доступен с 4, 6 или 8 физическими ядрами на микрочип, в исполнении от 1 до 32, с до 1024 SMT и немного другим микроархитектура и интерфейсы для поддержки расширенных / дополнительных спецификаций в отношении Power ISA и / или различных системных архитектур. Например, в Supercomputing (HPC) System Power 775 он упакован как 32-процессорный четырехчиповый модуль (QCM) с 256 физическими ядрами и 1024 SMT.[10] Также есть специальный TurboCore режим, который может отключать половину ядер восьмиядерного процессора, но эти 4 ядра имеют доступ ко всем контроллерам памяти и кэш-памяти третьего уровня на повышенных тактовых частотах. Это повышает производительность каждого ядра, что важно для рабочих нагрузок, требующих максимальной последовательной производительности за счет снижения параллельной производительности. Режим TurboCore может снизить «затраты на программное обеспечение вдвое для тех приложений, которые лицензируются на каждое ядро, при одновременном повышении производительности этого программного обеспечения на каждое ядро».[11] Новые масштабируемые высокопроизводительные серверы IBM Power 780 с новым режимом оптимизации рабочих нагрузок TurboCore обеспечивают удвоенную производительность на ядро систем на базе POWER6.[11]
Каждое ядро поддерживает четырехстороннюю одновременную многопоточность (SMT). POWER7 имеет примерно 1,2 миллиарда транзисторов и составляет 567 мм.2 большие, изготовленные по процессу 45 нм. Заметным отличием от POWER6 является то, что POWER7 выполняет инструкции не по порядку, а по порядку. Несмотря на снижение максимальной частоты по сравнению с POWER6 (4,25 ГГц против 5,0 ГГц), каждое ядро имеет более высокую производительность, чем POWER6, а количество ядер каждого процессора в 4 раза больше.
POWER7 имеет следующие характеристики:[12][13]
- 45 нм ТАК ЧТО Я процесс, 567 мм2
- 1,2 миллиарда транзисторы
- Тактовая частота 3,0–4,25 ГГц
- макс 4 фишки на четырехчиповый модуль
- 4, 6 или 8 ядер C1 на чип
- 4 SMT потоки на ядро C1 (доступно в AIX 6.1 TL05 (выпуски в апреле 2010 г.) и выше)
- 12 исполнительных блоков на ядро C1:
- 2 устройства с фиксированной точкой
- 2 единицы загрузки / магазина
- 4 модуля двойной точности с плавающей запятой
- 1 векторный блок поддержки VSX
- 1 десятичный блок с плавающей запятой
- 1 филиал
- 1 блок регистра условий
- 32 + 32 КБ кэш-памяти L1 для инструкций и данных (на ядро)[14]
- Кэш L2 256 КБ (на ядро C1)
- Кэш L3 4 МБ на каждое ядро C1 с поддержкой до 32 МБ. Кэш реализован в eDRAM, который не требует такого количества транзисторов на ячейку, как стандартный SRAM[5] поэтому он позволяет использовать больший кэш при использовании той же области, что и SRAM.
- 4, 6 или 8 ядер C1 на чип
«Каждое ядро процессора POWER7 реализует агрессивное выполнение инструкций вне очереди (OoO), чтобы обеспечить высокую эффективность использования доступных путей выполнения. В процессоре POWER7 есть блок последовательности инструкций, который способен отправлять до шести инструкций за цикл в набор очередей. . До восьми инструкций за цикл может быть выдано блокам выполнения инструкций. Процессор POWER7 имеет набор из двенадцати исполнительных блоков, как [описано выше] "[15]
Это дает следующие теоретические одинарная точность (SP) показатели производительности (на основе 8-ядерной реализации 4,14 ГГц):
- макс 99,36 GFLOPS на ядро
- макс 794,88 GFLOPS на чип
4 64-битных модуля SIMD на ядро и 128-битный модуль SIMD VMX на каждое ядро могут выполнять 12 операций умножения-сложения за цикл, что дает 24 операции SP FP за цикл. На частоте 4,14 ГГц это дает 4,14 миллиарда * 24 = 99,36 SP GFLOPS, а на 8 ядрах - 794,88 SP GFLOPS.
Вершина горы двойная точность (DP) производительность составляет примерно половину максимальной производительности SP.
Для сравнения последняя микроархитектура от Intel, Haswell (который вышел на 3 года позже, чем POWER7!), может выполнять 16 DP FLOP или 32 SP FLOP за цикл (8/16 DP / SP слитное умножение-сложение распространение по 2 × 256 бит AVX2 Векторные блоки FP).[16] На частоте 3,4 ГГц (i7-4770) это означает 108,8 SP GFLOPS на ядро и 435,2 SP GFLOPS на пиковую производительность 4-ядерного чипа, что дает примерно одинаковые уровни производительности на ядро, без учета эффектов или преимуществ Intel. Турбо ускорение технологии.
Это теоретическое сравнение пиковой производительности справедливо и на практике: POWER7 и i7-4770 получили аналогичные оценки в SPEC CPU2006 плавающая точка тесты (однопоточные): 71,5[17] для POWER7 по сравнению с 74.0[18] для i7-4770.
Обратите внимание, что чип POWER7 значительно превзошел (2 × –5 ×) i7 в некоторых тестах (bwaves, cactusADM, lbm), а также был значительно медленнее (2x-3x) в большинстве других. Это указывает на основные архитектурные различия между двумя чипами / материнскими платами / системами памяти и т. Д.: Они были разработаны с учетом различных рабочих нагрузок.
Однако в целом, в очень широком смысле, можно сказать, что производительность с плавающей запятой у POWER7 схожа с таковой у Haswell i7.
POWER7 +
IBM представила POWER7 + процессор на Горячие чипсы 24 конференция в августе 2012 года. Это обновленная версия с более высокими скоростями, большим кешем и интегрированными ускорителями. Он изготовлен по технологии 32 нм.[19]
Первыми коробками с процессорами POWER7 + были серверы IBM POWER 770 и 780. Чипы имеют до 80 МБ кэш-памяти L3 (10 МБ / ядро), улучшенные тактовые частоты (до 4,4 ГГц) и 20 LPAR на ядро.[20]
Товары
По состоянию на октябрь 2011 г.[Обновить]линейка систем POWER7 включает модели «Express» (710, 720, 730, 740 и 750), модели Enterprise (770, 780 и 795) и модели высокопроизводительных вычислений (755 и 775). Корпоративные модели отличаются наличием возможностей Capacity on Demand. Максимальные характеристики приведены в таблице ниже.
Имя | Количество розеток | Количество ядер | Тактовая частота процессора |
---|---|---|---|
710 Экспресс | 1 | 6 | 4,2 ГГц |
710 Экспресс | 1 | 8 | 4,2 ГГц |
720 Экспресс | 1 | 8 | 3,6 ГГц |
730 Экспресс | 2 | 12 | 4,2 ГГц |
730 Экспресс | 2 | 16 | 3,6 ГГц или 4,2 ГГц |
740 Экспресс | 2 | 12 | 4,2 ГГц |
740 Экспресс | 2 | 16 | 3,6 ГГц или 4,2 ГГц |
750 Экспресс | 4 | 24 | 3,72 ГГц |
750 Экспресс | 4 | 32 | 3,22 ГГц или 3,61 ГГц |
755 | 4 | 32 | 3,61 ГГц |
770 | 8 | 48 | 3,7 ГГц |
770 | 8 | 64 | 3,3 ГГц |
775 (на узел) | 32 | 256 | 3,83 ГГц |
780 (режим MaxCore) | 8 | 64 | 3,92 ГГц |
780 (режим TurboCore) | 8 | 32 | 4,14 ГГц |
780 (4-розеточный узел) | 16 | 96 | 3,44 ГГц |
795 | 32 | 192 | 3,72 ГГц |
795 (режим MaxCore) | 32 | 256 | 4,0 ГГц |
795 (режим TurboCore) | 32 | 128 | 4,25 ГГц |
IBM также предлагает 5 моделей на базе POWER7. BladeCenters.[21] Технические характеристики приведены в таблице ниже.
Имя | Количество ядер | Тактовая частота процессора | Требуются слоты для лезвий |
---|---|---|---|
BladeCenter PS700 | 4 | 3,0 ГГц | 1 |
BladeCenter PS701 | 8 | 3,0 ГГц | 1 |
BladeCenter PS702 | 16 | 3,0 ГГц | 2 |
BladeCenter PS703 | 16 | 2,4 ГГц | 1 |
BladeCenter PS704 | 32 | 2,4 ГГц | 2 |
Следующие суперкомпьютерные проекты используют процессор POWER7:
Смотрите также
Рекомендации
- ^ Отье, Изабель (17 февраля 2011 г.). "IBM Bromont au coeur de Watson". Киберпресс. Киберпресс. Получено 17 февраля 2011.
- ^ «IBM представляет новые системы POWER7 для управления сервисами, все более интенсивно использующими данные». IBM. 8 февраля 2010 г.. Получено 13 сентября 2010.
- ^ «Новые системы оптимизации рабочих нагрузок POWER7». YouTube. IBM. 5 февраля 2010 г.. Получено 22 февраля 2010.
- ^ «Черт побери, IBM выбрала компьютер для США в петафлопсах». EE Times. Получено 22 ноября 2006.
- ^ а б "Hot Chips XXI Preview". Технологии реального мира. Получено 17 августа 2009.
- ^ Кантер, Дэвид. «Новая информация о POWER7». Получено 11 августа 2011.
- ^ Вархол, Питер. "IBM запускает процессор POWER 7 9 февраля 2010 г.". Получено 11 августа 2011.
- ^ «Заметки конференции ISCA 29». Получено 11 августа 2011.
- ^ "Архитектура процессора IBM Tips Power6". Информационная неделя. Получено 6 февраля 2006.
- ^ "Решение IBM Power Systems 775 HPC" (PDF). Получено 28 апреля 2020.
- ^ а б «IBM представляет новые системы POWER7 для управления сервисами, все более интенсивно использующими данные». IBM.com. Получено 11 августа 2011.
- ^ "IBM в образовании - Бизнес и технологические решения". IBM. Архивировано из оригинал 8 декабря 2012 г.. Получено 8 июля 2009.
- ^ «8-ядерный IBM POWER7: вдвое мощнее, вдвое меньше транзисторов». Ars Technica. Получено 1 сентября 2009.
- ^ «Технические характеристики Bluewater HW». Национальный центр суперкомпьютерных приложений. Получено 31 декабря 2009.
- ^ «IBM Power 770 и 780: технический обзор и введение» (PDF). IBM. Получено 21 августа 2011.
- ^ Ананд Лал Шимпи (5 октября 2012 г.). «Анализ архитектуры Intel Haswell: создание нового ПК и нового Intel». Анандтех.
- ^ «Результат SPEC CFP2006, сервер IBM Power 780 (3,86 ГГц, 16 ядер)».
- ^ «Результат SPEC CFP2006, материнская плата Intel DH87MC (Intel Core i7-4770)».
- ^ Горячие фишки: обновление для IBM Power7
- ^ Реестр: Запуск сервера Power7 +.
- ^ «Оборудование IBM Power Systems - Блейд-серверы». IBM. Получено 30 января 2012.
внешняя ссылка
- Системы IBM POWER7 - Страница продукта IBM POWER7
- Технология и системы IBM POWER7 - IBM Journal of Research and Development (опубликовано IEEE Xplore)
- IBM выиграла DARPA HPCS Phase-III
- IBM выиграла DARPA HPCS Phase-II
- У IBM есть PERCS
- POWER 780 SPECint_rate_base2006 результат
- IBM BladeCenter PS703 и PS704: технический обзор и введение