Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Микроархитектуры NetBurst , [1] [2] называется P68 внутри Intel , был преемником микроархитектуры P6 в x86 семейство центральных процессоров (CPU) , сделанных Intel. Первым процессором, использующим эту архитектуру, был Pentium 4 с ядром Willamette , выпущенный 20 ноября 2000 года, и первый из процессоров Pentium 4 ; все последующие варианты Pentium 4 и Pentium D также были основаны на NetBurst. В середине 2004 года Intel выпустила ядро Foster , которое также было основано на NetBurst, таким образом заменив XeonЦП тоже под новую архитектуру. Процессоры Celeron на базе Pentium 4 также используют архитектуру NetBurst.

На смену NetBurst пришла микроархитектура Core на базе P6, выпущенная в июле 2006 года.

Технология [ править ]

Микроархитектура NetBurst включает в себя такие функции, как Hyper-threading , Hyper Pipeline Technology , Rapid Execution Engine , Execution Trace Cache и систему воспроизведения, которые были впервые представлены в этой конкретной микроархитектуре, а некоторые из них больше никогда не появлялись впоследствии.

Гиперпоточность [ править ]

Гиперпоточность - это запатентованная Intel реализация одновременной многопоточности (SMT), используемая для улучшения распараллеливания вычислений (одновременное выполнение нескольких задач), выполняемых на микропроцессорах x86. Intel представила его с процессорами NetBurst в 2002 году. Позже Intel повторно представила его в микроархитектуре Nehalem после его отсутствия в Core 2.

Фронтальный автобус с четырьмя насосами [ править ]

«Northwood» и «Willamette» имеют внешнюю интерфейсную шину, которая работает на частоте 100 МГц и имеет ширину 64 бита, но также имеет четырехканальную прокачку, что дает пропускную способность памяти 3,2 ГБ / с. Чипсет Intel "Northwood" i850 с двухканальной RD-RAM может обеспечить пропускную способность памяти 3,2 ГБ / с. «Presler» имеет фронтальную шину 800 МГц, ширину 64 бита, способную передавать 6,4 ГБ / с, с памятью DDR2 800 МГц.

Технология Hyper Pipeline [ править ]

Это имя, данное 20- этапному конвейеру команд в ядре Willamette. Это значительное увеличение количества ступеней по сравнению с Pentium III, у которого в конвейере было всего 10 ступеней. Ядро Prescott имеет 31-этапный конвейер (некоторые этапы просто перемещают данные по ЦП). Хотя более глубокий конвейер имеет повышенный штраф за неправильное предсказание переходов, большее количество этапов в конвейере позволяет ЦП иметь более высокие тактовые частоты, что, как считалось, компенсирует любые потери в производительности. Меньшие инструкции за такт(IPC) является косвенным следствием глубины трубопровода - это вопрос компромисса при проектировании (небольшое количество длинных трубопроводов имеет меньший IPC, чем большее количество коротких трубопроводов). Еще одним недостатком наличия большего количества этапов в конвейере является увеличение количества этапов, которые необходимо отследить в случае ошибки предсказателя ветвления , что увеличивает штраф, уплачиваемый за неверное предсказание. Чтобы решить эту проблему, Intel разработала механизм Rapid Execution Engine и много вложила в свою технологию прогнозирования переходов , которая, по утверждению Intel, снижает количество ошибочных прогнозов переходов на 33% по сравнению с Pentium III . [3]

Механизм быстрого выполнения [ править ]

Благодаря этой технологии два арифметико-логических блока (ALU) в ядре ЦП работают с двойной подкачкой, что означает, что они фактически работают с удвоенной тактовой частотой ядра. Например, в процессоре с частотой 3,8 ГГц ALU эффективно работают на частоте 7,6 ГГц. Причина этого состоит в том, чтобы обычно компенсировать низкое количество IPC; кроме того, это значительно увеличивает целочисленную производительность процессора. Intel также заменила высокоскоростной баррель-шифтер.с исполнительным блоком сдвига / поворота, который работает на той же частоте, что и ядро ​​ЦП. Обратной стороной является то, что некоторые инструкции теперь выполняются намного медленнее (относительно и абсолютно), чем раньше, что затрудняет оптимизацию для нескольких целевых процессоров. Примером могут служить операции сдвига и поворота, которые страдают от отсутствия механизма сдвига, который присутствовал на каждом процессоре x86, начиная с i386, включая процессор основного конкурента, Athlon .

Кэш трассировки выполнения [ править ]

Intel включила в кэш L1 ЦП свой кэш трассировки выполнения. Он хранит декодированные микрооперации , так что при выполнении новой инструкции, вместо повторной выборки и декодирования инструкции, ЦП напрямую обращается к декодированным микрооперациям из кэша трассировки, тем самым значительно экономя время. Более того, микрооперации кэшируются в соответствии с их прогнозируемым путем выполнения, что означает, что, когда ЦП извлекает инструкции из кеша, они уже присутствуют в правильном порядке выполнения. [4] Позже Intel представила аналогичную, но более простую концепцию Sandy Bridge, называемую кешем микроопераций (UOP cache).

Система воспроизведения [ править ]

Система воспроизведения - это подсистема в процессоре Intel Pentium 4 для перехвата операций, которые были ошибочно отправлены для выполнения планировщиком процессора. Операции, обнаруженные системой воспроизведения, затем повторно выполняются в цикле до тех пор, пока не будут выполнены условия, необходимые для их правильного выполнения.

Подсказки предсказания ветвления [ править ]

Архитектура Intel NetBurst позволяет вставлять подсказки прогнозирования ветвлений в код, чтобы определить, следует ли выполнять статическое прогнозирование или нет, в то время как эта функция была оставлена ​​в более поздних процессорах Intel. По данным Intel, алгоритм прогнозирования ветвлений NetBurst на 33% лучше, чем в P6. [5] [6]

Проблемы с увеличением [ править ]

Несмотря на эти улучшения, архитектура NetBurst создала препятствия для инженеров, пытающихся повысить ее производительность. С помощью этой микроархитектуры Intel стремилась достичь тактовой частоты 10 ГГц [7], но из-за увеличения тактовой частоты Intel столкнулась с возрастающими проблемами с удержанием рассеиваемой мощности в приемлемых пределах. Intel достигла скоростного барьера 3,8 ГГц в ноябре 2004 г., но столкнулась с проблемами при попытке достичь даже этого. Intel отказалась от NetBurst в 2006 году после того, как тепловые проблемы стали неприемлемыми , а затем разработали Core Microarchitecture , вдохновленный P6 ядро Pentium Pro к Tualatin Pentium III -S, и наиболее непосредственно Pentium M .

Редакции [ править ]

Intel заменила исходное ядро Willamette на переработанную версию микроархитектуры NetBurst под названием Northwood в январе 2002 года. Дизайн Northwood сочетал в себе увеличенный размер кэша, меньший 130-нм производственный процесс и Hyper-threading (хотя изначально все модели, кроме модели с частотой 3,06 ГГц) если эта функция отключена) для создания более современной и высокопроизводительной версии микроархитектуры NetBurst.

В феврале 2004 года Intel представила Prescott , более радикальную версию микроархитектуры. Прескотт ядро было произведено на нм процесса 90, и включало несколько крупных изменений в конструкции, в том числе добавления еще больший кэш (от 512 КБ в Northwood до 1 МБ и 2 МБ в Prescott 2M), гораздо более глубокий конвейер команд (31 этап по сравнению с 20 в Northwood ), значительно улучшенный предсказатель ветвлений , введение инструкций SSE3 , а позже, реализация Intel 64, брендинг Intel для их совместимой реализации 64-разрядной версии x86-64 x86микроархитектура (как и в случае с гиперпоточностью, все чипы Prescott под маркой Pentium 4 HT имеют оборудование для поддержки этой функции, но изначально она была включена только на высокопроизводительных процессорах Xeon , а затем была официально представлена ​​в процессорах с торговой маркой Pentium ). Энергопотребление и рассеивание тепла также стали серьезными проблемами для Prescott , который быстро стал самым быстродействующим и наиболее энергоемким среди одноядерных процессоров Intel x86 и x86-64. Проблемы с питанием и нагревом помешали Intel выпустить Prescott с тактовой частотой выше 3,8 ГГц вместе с мобильной версией ядра с тактовой частотой выше 3,46 ГГц.

Intel также выпустила двухъядерный процессор на базе микроархитектуры NetBurst под маркой Pentium D. Первое ядро ​​Pentium D получило кодовое название Smithfield , что на самом деле представляет собой два ядра Prescott на одном кристалле, а позднее - Presler , которое состоит из двух ядер Cedar Mill на двух отдельные штампы ( Cedar Mill представляет собой усадочную матрицу Prescott 65 нм ).

Дорожная карта [ править ]


Преемник [ редактировать ]

Intel имел наследников на основе Netburst в развитии называемых Tejas и Jayhawk с между 40 и 50 ступеней конвейера, но в конечном итоге решил заменить NetBurst с микроархитектуры ядра , [8] [9] выпущен в июле 2006 года; эти преемники были непосредственно унаследованы от Pentium Pro 1995 года ( микроархитектура P6 ). 8 августа 2008 года закончился выпуск процессоров на базе Intel NetBurst. [10] Причиной отказа от NetBurst были серьезные проблемы с нагревом, вызванные высокими тактовыми частотами. Хотя некоторые процессоры на базе Core и Nehalem имеют более высокий TDP, большинство процессоров являются многоядерными, поэтому каждое ядро ​​выделяет часть максимального TDP, а одноядерные процессоры на базе ядра с максимальной тактовой частотой выделяют максимум 27 Вт тепла. Процессоры Pentium 4 (одноядерные) для настольных ПК с самой быстрой тактовой частотой имели TDP 115 Вт по сравнению с 88 Вт для мобильных версий с самой быстрой тактовой частотой. Хотя, с введением новых степпингов, TDP для некоторых моделей в конечном итоге был снижен.

Микроархитектура Nehalem, преемница микроархитектуры Core, на самом деле должна была быть развитием NetBurst в соответствии с дорожными картами Intel, датируемыми 2000 годом. Но из-за отказа от NetBurst Nehalem теперь представляет собой совершенно другой проект, но имеет некоторое сходство с NetBurst. Nehalem заново реализует технологию Hyper-threading, впервые представленную в ядре Northwood 3,06 ГГц Pentium 4. Nehalem также реализует кэш L3 в процессорах на его основе. Для реализации процессора потребительского класса кэш L3 впервые был использован в ядре Gallatin Pentium 4 Extreme Edition, но, как ни странно, отсутствовал в ядре Prescott 2M того же производителя.

Чипы на основе NetBurst [ править ]

  • Celeron (NetBurst)
  • Celeron D
  • Pentium 4
  • Pentium 4 Extreme Edition
  • Pentium D
  • Pentium Extreme Edition
  • Xeon , с 2001 по 2006 год

См. Также [ править ]

  • Миф о мегагерцах
  • Список микроархитектур ЦП Intel
  • Список микропроцессоров Intel Celeron
  • Список микропроцессоров Intel Pentium 4
  • Список микропроцессоров Intel Pentium D
  • Список микропроцессоров Intel Xeon
  • Тик-тактовая модель

Ссылки [ править ]

  1. ^ Carmean, Дуги (весна 2002). «Процессор Intel Pentium 4» (PDF) . Intel . Архивировано из оригинального (PDF) 19 апреля 2018 года.
  2. ^ «Воспроизведение: неизвестные особенности ядра NetBurst» . XbitLabs . 6 марта 2016 года Архивировано из оригинала 6 марта 2016 года.
  3. ^ «Блок прогнозирования ветвления кэша трассировки» . Новый процессор Intel Pentium 4 . Оборудование Тома . 20 ноября 2000 . Проверено 30 апреля 2021 года .
  4. ^ «Вход в конвейер выполнения - кэш трассировки Pentium 4, продолжение» . Новый процессор Intel Pentium 4 . Оборудование Тома . 20 ноября 2000 . Проверено 30 апреля 2021 года .
  5. Fog, Agner (1 декабря 2016 г.). «Микроархитектура процессоров Intel, AMD и VIA» (PDF) . п. 36 . Проверено 22 марта 2017 года .
  6. ^ Миленкович, Милена; Миленкович, Александар; Кулик, Джеффри. «Демистификация предсказателей развития отрасли Intel» (PDF) .
  7. ^ Шимпи, Ананд Лал. «Будущее производственных процессов Intel» . Проверено 4 апреля 2018 года .
  8. ^ "Intel говорит Adios чипам Tejas и Jayhawk" . Реестр .
  9. ^ Goodwins, Руперт. «Intel отменяет Tejas и Jayhawk» . ZDNet . Проверено 21 августа 2019 года .
  10. Шилов, Антон (21 мая 2007 г.). «Эра микроархитектуры Intel NetBurst подходит к концу» . XbitLabs . Архивировано из оригинального 17 октября 2015 года . Проверено 29 ноября 2015 года .

Внешние ссылки [ править ]

  • Микроархитектура процессора Pentium 4