NetBurst (микроархитектура) - NetBurst (microarchitecture)

NetBurst
Главная Информация
Запущен20 ноября 2000 г.; 20 лет спустя (20 ноября 2000 г.)
Спектакль
Максимум. ЦПУ тактовая частотаОт 267 МГц до 3,73 ГГц
ФСБ скоростиОт 400 МТ / с до 1066 МТ / с
Кеш
L1 тайникОт 8 КБ до 16 КБ на ядро
Кэш L2От 128 КБ до 2048 КБ
От 256 КБ до 2048 КБ (Xeon)
Кэш L3От 4 МБ до 16 МБ совместно
Архитектура и классификация
АрхитектураNetBurst x86
инструкцииMMX
Расширения
Физические характеристики
Транзисторы
Ядра
  • 1-2 (2-4)
  • 2-6 (2-6) (Xeon)
Розетки)
Продукты, модели, варианты
Модель (ы)
  • Celeron серии
  • Celeron серии D
  • Pentium 4 серии
  • Pentium D серии
  • Xeon серии
История
ПредшественникP6
ПреемникIntel Core
P7 Itanium (IA-64 )

В Микроархитектура NetBurst,[1][2] называется P68 внутри Intel, был преемником Микроархитектура P6 в x86 семья центральные процессоры (CPU) производства Intel. Первым процессором, использующим эту архитектуру, был Pentium 4 с ядром Willamette, выпущенный 20 ноября 2000 г. и первым из Pentium 4 Процессоры; все последующие Pentium 4 и Pentium D варианты также были основаны на NetBurst. В середине 2004 г. Intel выпустила Фостер ядро, которое также было основано на NetBurst, таким образом переключая Xeon ЦП тоже под новую архитектуру. Pentium 4 на базе Celeron ЦП также используют архитектуру NetBurst.

NetBurst был заменен на Основная микроархитектура основан на P6, выпущенном в июле 2006 года.

Технологии

Микроархитектура NetBurst включает в себя такие функции, как Hyper Threading, Гипер конвейерная технология, Механизм быстрого выполнения, Кэш трассировки выполнения, и система воспроизведения которые все были представлены впервые в этой конкретной микроархитектуре, а некоторые больше никогда не появлялись впоследствии.

Hyper Threading

Гиперпоточность является собственностью Intel. одновременная многопоточность (SMT) реализация, используемая для улучшения распараллеливания вычислений (выполнения нескольких задач одновременно), выполняемых на микропроцессорах x86. Intel представила его с процессорами NetBurst в 2002 году. Позже Intel повторно представила его с Микроархитектура Nehalem после его отсутствия в Core 2.

Фронтальный автобус с четырьмя насосами

«Northwood» и «Willamette» имеют внешнюю шину Front-Side, которая работает на частоте 100 МГц и имеет ширину 64 бита, но также имеет четырехкратную прокачку, что обеспечивает пропускную способность памяти 3,2 ГБ / с. Чипсет Intel "Northwood" i850 с двухканальной RD-RAM может обеспечить пропускную способность памяти 3,2 ГБ / с. "Presler" имеет фронтальную шину 800 МГц, ширину 64 бита, способную передавать 6,4 ГБ / с, с памятью DDR2 800 МГц.

Гипер конвейерная технология

Так называется 20-ступенчатая конвейер команд внутри ядра Willamette. Это значительное увеличение количества ступеней по сравнению с Pentium III, у которого в конвейере было всего 10 ступеней. Ядро Prescott имеет 31-этапный конвейер (некоторые этапы просто перемещают данные по ЦП). Хотя более глубокий конвейер имеет повышенный штраф за неправильное предсказание переходов, большее количество этапов в конвейере позволяет ЦП иметь более высокие тактовые частоты, что, как считалось, компенсирует любые потери в производительности. Меньший инструкции в час (IPC) является косвенным следствием глубины трубопровода - это вопрос компромисса при проектировании (небольшое количество длинных конвейеров имеет меньший IPC, чем большее количество коротких конвейеров). Еще одним недостатком наличия большего количества стадий в конвейере является увеличение количества стадий, которые необходимо отследить в том случае, если предсказатель ветвления делает ошибку, увеличивая штраф, уплаченный за неверный прогноз. Чтобы решить эту проблему, Intel разработала Rapid Execution Engine и много вложила в свою технологию прогнозирования переходов, которая, по утверждению Intel, сокращает неверные предсказания ветвей на 33% больше Pentium III.[3]

Механизм быстрого выполнения

Благодаря этой технологии два арифметико-логические устройства (ALU) в ядре ЦП работают с двойной подкачкой, что означает, что они фактически работают с удвоенной тактовой частотой ядра. Например, в процессоре с частотой 3,8 ГГц ALU эффективно работают на частоте 7,6 ГГц. Причина этого в том, чтобы обычно компенсировать низкое количество IPC; кроме того, это значительно увеличивает целочисленную производительность процессора. Intel также заменила высокоскоростной баррель шифтер с исполнительным блоком сдвига / поворота, который работает на той же частоте, что и ядро ​​ЦП. Обратной стороной является то, что некоторые инструкции теперь намного медленнее (относительно и абсолютно), чем раньше, что затрудняет оптимизацию для нескольких целевых процессоров. Примером могут служить операции сдвига и поворота, которые страдают от отсутствия механизма сдвига, который присутствовал на каждом процессоре x86, начиная с i386, включая основной процессор конкурента, Athlon.

Кэш трассировки выполнения

Intel включила в кэш L1 ЦП свой кэш трассировки выполнения. Он хранит декодированные микрооперации, так что при выполнении новой инструкции, вместо повторной выборки и декодирования инструкции, ЦП напрямую обращается к декодированным микрооперациям из кэша трассировки, тем самым значительно экономя время. Более того, микрооперации кэшируются в соответствии с их прогнозируемым путем выполнения, что означает, что, когда ЦП выбирает инструкции из кеша, они уже присутствуют в правильном порядке выполнения. Позже Intel представила аналогичную, но более простую концепцию с Песчаный Мост называется кэш микроопераций (Кеш UOP).[4]

Система воспроизведения

Система воспроизведения - это подсистема в процессоре Intel Pentium 4 для перехвата операций, которые были ошибочно отправлены для выполнения планировщиком процессора. Операции, обнаруженные системой воспроизведения, затем повторно выполняются в цикле до тех пор, пока не будут выполнены условия, необходимые для их правильного выполнения.

Подсказки предсказания ветвления

Архитектура Intel NetBurst позволяет предсказание ветвления подсказки, которые необходимо вставить в код, чтобы определить, следует ли выполнять статическое прогнозирование или нет, тогда как эта функция была оставлена ​​в более поздних процессорах Intel. По данным Intel, алгоритм прогнозирования ветвлений NetBurst на 33% лучше, чем в P6.[5][6]

Проблемы с масштабированием

Несмотря на эти улучшения, архитектура NetBurst создала препятствия для инженеров, пытающихся повысить ее производительность. С помощью этой микроархитектуры Intel стремилась достичь тактовой частоты 10 ГГц,[7] но из-за увеличения тактовой частоты Intel столкнулась с возрастающими проблемами с удержанием рассеиваемой мощности в допустимых пределах. Intel достигла скоростного барьера 3,8 ГГц в ноябре 2004 года, но столкнулась с проблемами при попытке достичь даже этого. Intel отказалась от NetBurst в 2006 году после того, как проблемы с перегревом достигли уровня серьезности, а затем развились. Основная микроархитектура, вдохновленный ядром P6 Core Pentium Pro к Туалатин Pentium III -S и прямо Pentium M.

Редакции

РедакцияБренд (ы) процессораЭтапы трубопровода
Вилламетт (180 нм)Celeron, Pentium 420
Нортвуд (130 морских миль)Celeron, Pentium 4, Pentium 4 HT20
Галлатин (130 нм)Pentium 4 HT Extreme Edition, Xeon20
Прескотт (90 нм)Celeron D, Pentium 4, Pentium 4 HT,
Pentium 4 Extreme Edition
31
Кедровая мельница (65 нм)Celeron D, Pentium 431
Смитфилд (90 нм)Pentium D31
Преслер (65 нм)Pentium D31

Intel заменила оригинал Willamette ядро с переработанной версией микроархитектуры NetBurst под названием Northwood в январе 2002 года. Northwood дизайн сочетал в себе увеличенный размер кэша, меньший производственный процесс 130 нм и Hyper Threading (хотя изначально во всех моделях, кроме модели 3,06 ГГц, эта функция была отключена) для создания более современной и высокопроизводительной версии микроархитектуры NetBurst.

В феврале 2004 г. Intel представила Прескотт, более радикальный пересмотр микроархитектуры. В Прескотт Ядро было произведено по 90-нм техпроцессу и включало несколько серьезных изменений конструкции, включая добавление еще большего размера кеш-памяти (от 512 КБ в Northwood до 1 МБ и 2 МБ в Prescott 2M), гораздо глубже конвейер команд (31 этап против 20 в Northwood), сильно улучшенный предсказатель ветвления, введение SSE3 инструкции, а затем реализация Intel 64, брендинг Intel для их совместимой реализации x86-64 64-битная версия x86 микроархитектура (как и при гиперпоточности, все Прескотт чипы Pentium 4 HT имеют оборудование для поддержки этой функции, но изначально она была включена только на high-end Xeon процессоры, прежде чем они были официально представлены в процессорах с Pentium торговая марка). Потребление энергии и рассеивание тепла также стали серьезными проблемами с Прескотт, которые быстро стали самыми быстрыми и энергоемкими среди одноядерных процессоров Intel x86 и x86-64. Проблемы с питанием и перегревом помешали Intel выпустить Prescott с тактовой частотой выше 3,8 ГГц вместе с мобильной версией ядра с тактовой частотой выше 3,46 ГГц.

Intel также выпустила двухъядерный процессор на базе микроархитектуры NetBurst под маркой Pentium D. Первое ядро ​​Pentium D получило кодовое название Smithfield, который на самом деле представляет собой два ядра Prescott в одном кристалле, а позже Presler, состоящий из двух Кедровая мельница сердечники на двух отдельных плашках (Кедровая мельница усадка 65 нм Прескотт).

Дорожная карта


Преемник

У Intel были преемники на базе Netburst в разработке под названием Теджас и Джейхок от 40 до 50 этапов конвейера, но в конечном итоге решили заменить NetBurst на Основная микроархитектура,[8][9] выпущен в июле 2006 г .; эти преемники были напрямую заимствованы из 1995 г. Pentium Pro (Микроархитектура P6 ). 8 августа 2008 г. закончился выпуск процессоров на базе Intel NetBurst.[10] Причиной отказа от NetBurst стали серьезные проблемы с нагревом, вызванные высокими тактовыми частотами. В то время как некоторые процессоры на базе Core и Nehalem имеют более высокую TDP, большинство процессоров являются многоядерными, поэтому каждое ядро ​​выделяет часть максимального TDP, а одноядерные процессоры на базе ядра с максимальной тактовой частотой выделяют максимум 27 Вт тепла. Процессоры Pentium 4 (одноядерные) для настольных ПК с самой быстрой тактовой частотой имели TDP 115 Вт по сравнению с 88 Вт для мобильных версий с самой быстрой тактовой частотой. Хотя с введением новых степпингов TDP для некоторых моделей в конечном итоге был снижен.

Микроархитектура Nehalem, преемница микроархитектуры Core, на самом деле должна была быть развитием NetBurst в соответствии с дорожными картами Intel, датируемыми 2000 годом. Но из-за отказа от NetBurst Nehalem теперь представляет собой совершенно другой проект, но имеет некоторое сходство с NetBurst. Nehalem заново реализует технологию Hyper-Threading, впервые представленную в 3,06 ГГц. Northwood ядро Pentium 4. Nehalem также реализует кэш L3 в процессорах на его основе. Для реализации процессора потребителя кэш L3 был впервые использован в Галлатин ядро Pentium 4 Extreme Edition, но его странным образом не хватало Прескотт 2М ядро того же бренда.

Чипы на основе NetBurst

Смотрите также

использованная литература

  1. ^ https://pdfs.semanticscholar.org/presentation/cfcc/9d5a7480c4ea87e77084386d74aaff9a1ee1.pdf
  2. ^ «X-bit labs - Версия для печати». web.archive.org. 6 марта 2016 г.
  3. ^ «Блок прогнозирования ветвлений кэша трассировки: новый процессор Intel Pentium 4». Томсаппаратное обеспечение. 20 ноября 2000 г.. Получено 2 января, 2012.
  4. ^ «Блок прогнозирования ветвлений кэша трассировки - новый процессор Intel Pentium 4».
  5. ^ Туман, Агнер (1 декабря 2016 г.). «Микроархитектура процессоров Intel, AMD и VIA» (PDF). п. 36. Получено 22 марта, 2017.
  6. ^ "www.ece.uah.edu" (PDF).
  7. ^ Шимпи, Ананд Лал. «Будущее производственных процессов Intel». Получено 4 апреля, 2018.
  8. ^ «Intel говорит Adios чипам Tejas и Jayhawk». Реестр.
  9. ^ Гудвинз, Руперт. «Intel отменяет Tejas и Jayhawk». ZDNet. Получено 21 августа, 2019.
  10. ^ «Архивная копия». Архивировано из оригинал 17 октября 2015 г.. Получено 29 ноября, 2015.CS1 maint: заархивированная копия как заголовок (ссылка на сайт)

внешние ссылки