Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Intel Core микроархитектуры (ранее названный Next-Generation Micro-Architecture ) представляет собой многоядерный процессор микроархитектуры представила на Intel в 1 квартале 2006 года на основе Yonah конструкции процессора и может рассматриваться как итерация микроархитектуры P6 , введенной в 1995 году Pentium Pro . Высокое энергопотребление и теплоемкость, связанная с этим невозможность эффективного увеличения тактовой частоты и другие недостатки, такие как неэффективный конвейер, были основными причинами, по которым Intel отказалась от микроархитектуры NetBurst.и перешел на другую архитектуру, обеспечивающую высокую эффективность за счет небольшого конвейера, а не высоких тактовых частот. Микроархитектура Core изначально не достигла тактовых частот микроархитектуры NetBurst даже после перехода на 45-нм литографию . Однако после многих поколений последующих микроархитектур, которые использовали Core в качестве своей основы (таких как Nehalem , Sandy Bridge и другие), Intel удалось в конечном итоге превзойти тактовые частоты Netburst с микроархитектурой Devil's Canyon (улучшенная версия Haswell), достигнув базовой частоты 4 ГГц и максимальная протестированная частота 4,4 ГГц с использованием литографии 22 нм.

Первые процессоры, в которых использовалась эта архитектура, носили кодовые названия « Merom », « Conroe » и « Woodcrest »; Merom - для мобильных компьютеров, Conroe - для настольных систем, а Woodcrest - для серверов и рабочих станций. Несмотря на идентичность архитектуры, три линии процессоров различаются используемым разъемом, скоростью шины и потребляемой мощностью. Первоначальные массовые процессоры на базе Core были под маркой Pentium Dual-Core или Pentium, а младшие - под маркой Celeron ; Процессоры на базе ядра для серверов и рабочих станций были названы Xeon , в то время как первые 64-разрядные процессоры Intel для настольных ПК и мобильных процессоров на базе Core были названы Core 2 .

Особенности [ править ]

Ядро микроархитектуры возвращается к снижению тактовой частоты и улучшить использование обоих доступных циклов синхронизации и мощности по сравнению с предыдущим NetBurst микроархитектуры на Pentium 4 и D -Фирменные процессоров. [1] Микроархитектура Core обеспечивает более эффективные этапы декодирования, исполнительные блоки, кеши и шины , снижая энергопотребление процессоров Core 2 при одновременном увеличении их вычислительной мощности. Энергопотребление процессоров Intel сильно различается в зависимости от тактовой частоты, архитектуры и полупроводникового процесса, что показано в таблицах рассеиваемой мощности процессора .

Как и последние процессоры NetBurst, процессоры на базе Core имеют несколько ядер и поддержку аппаратной виртуализации (продается как Intel VT-x ), а также Intel 64 и SSSE3 . Однако процессоры на базе ядра не имеют технологии гиперпоточности, как в процессорах Pentium 4. Это связано с тем, что микроархитектура Core основана на микроархитектуре P6, используемой Pentium Pro, II, III и M.

Размер кэша L1 был увеличен в микроархитектуре Core с 32 КБ на Pentium II / III (16 КБ данных L1 + 16 КБ инструкции L1) до 64 КБ кэша / ядра L1 (32 КБ данных L1 + 32 КБ инструкции L1) на Pentium. M и Core / Core 2. В потребительской версии также отсутствует кэш L3, как в ядре Gallatin Pentium 4 Extreme Edition, хотя он присутствует исключительно в высокопроизводительных версиях процессоров Xeon на базе Core. И кэш L3, и гиперпоточность снова были возвращены в потребительскую линейку в микроархитектуре Nehalem .

Дорожная карта [ править ]


Технология [ править ]

Микроархитектура Intel Core

Хотя микроархитектура Core представляет собой серьезную архитектурную ревизию, она частично основана на семействе процессоров Pentium M , разработанном Intel Israel. [2] Penryn трубопровода 12-14 ступеней длиной [3] - менее половины Prescott «s, подпись особенность широких сердечников выполнения заказа. Преемник Penryn, Nehalem в большей степени заимствовал у Pentium 4 и имеет 20-24 ступени конвейера. [3] Размер исполнительного модуля ядра составляет 4 задачи по сравнению с ядрами с 3 выпусками в P6 , Pentium M и ядрами с 2 выпусками NetBurst.микроархитектуры. Новая архитектура представляет собой двухъядерный дизайн со связанным кешем L1 и общим кешем второго уровня, разработанным для максимальной производительности на ватт и улучшенной масштабируемости.

Одна из новых технологий, включенных в этот проект, - это Macro-Ops Fusion , которая объединяет две инструкции x86 в одну микрооперацию . Например, обычная кодовая последовательность, такая как сравнение, за которым следует условный переход, станет одной микрооперацией. Однако эта технология не работает в 64-битном режиме.

Другие новые технологии включают пропускную способность за 1 цикл (2 цикла ранее) всех 128-битных инструкций SSE и новый дизайн энергосбережения. Все компоненты будут работать с минимальной скоростью, при необходимости динамически повышая скорость (аналогично технологии энергосбережения AMD Cool'n'Quiet и собственной технологии Intel SpeedStep от более ранних мобильных процессоров). Это позволяет чипу выделять меньше тепла и минимизировать энергопотребление.

Для большинства процессоров Woodcrest частота внешней шины (FSB) составляет 1333 МТ / с ; тем не менее, это значение снижено до 1066 МТ / с для вариантов с более низкой частотой 1,60 и 1,86 ГГц. [4] [5] Мобильный вариант Merom изначально был нацелен на работу с FSB 667 МТ / с, в то время как вторая волна Meroms, поддерживающая FSB 800 МТ / с, была выпущена как часть платформы Santa Rosa с другим сокетом. в мае 2007 года. Ориентированная на настольные компьютеры Conroe началась с моделей, имеющих системную шину 800 МТ / с или 1066 МТ / с с линейкой 1333 МТ / с, официально выпущенной 22 июля 2007 года.

Энергопотребление этих новых процессоров очень низкое: среднее потребление энергии должно находиться в диапазоне 1-2 Вт в вариантах со сверхнизким напряжением, с расчетной тепловой мощностью (TDP) 65 Вт для Conroe и большинства Woodcrests, 80 Вт для 3,0 ГГц Woodcrest и 40 Вт для низковольтного Woodcrest. Для сравнения, процессор AMD Opteron 875HE потребляет 55 Вт, в то время как линейка энергоэффективных Socket AM2 умещается в 35-ваттном тепловом конверте (задано другим способом, поэтому его нельзя сравнивать напрямую). Мобильный вариант Merom имеет TDP 35 Вт для стандартных версий и 5 Вт TDP для версий со сверхнизким напряжением (ULV). [ необходима цитата ]

Ранее Intel объявила, что теперь сосредоточится на энергоэффективности, а не на чистой производительности. Однако на форуме разработчиков Intel (IDF) весной 2006 г. Intel рекламировала и то, и другое. Вот некоторые из обещанных цифр:

  • На 20% больше производительности для Merom при том же уровне мощности; по сравнению с Core Duo
  • На 40% выше производительность Conroe при меньшем энергопотреблении на 40%; по сравнению с Pentium D
  • На 80% больше производительности для Woodcrest при уменьшении мощности на 35%; по сравнению с оригинальным двухъядерным Xeon

Ядра процессора [ править ]

Процессоры микроархитектуры Core можно разделить на категории по количеству ядер, размеру кэша и сокету; каждая их комбинация имеет уникальное кодовое название и код продукта, который используется в нескольких брендах. Например, кодовое имя «Allendale» с кодом продукта 80557 имеет два ядра, 2 МБ кэша L2 и использует настольный сокет 775, но продается как Celeron, Pentium, Core 2 и Xeon, каждый с различными наборами включенных функций. Большинство процессоров для мобильных и настольных ПК выпускаются в двух вариантах, которые различаются размером кэша L2, но конкретный объем кеша L2 в продукте также можно уменьшить, отключив компоненты во время производства. Wolfdale-DP и все четырехъядерные процессоры, кроме Dunnington QC, представляют собой многочиповые модули, объединяющие два кристалла. Для процессоров 65 нмодин и тот же код продукта может использоваться процессорами с разными матрицами, но конкретная информация о том, какой из них используется, может быть получена из степпинга.

Конро / Мером (65 нм) [ править ]

Исходные процессоры Core 2 основаны на тех же кристаллах, которые можно идентифицировать как CPUID Family 6 Model 15. В зависимости от конфигурации и упаковки их кодовые названия: Conroe ( LGA 775 , 4 МБ кэш-памяти L2), Allendale (LGA 775, 2). Кэш второго уровня МБ), Merom ( Socket M , кэш второго уровня 4 МБ) и Kentsfield ( многокристальный модуль , LGA 775, кэш второго уровня 2х4 МБ). Процессоры Merom и Allendale с ограниченными функциями входят в состав процессоров Pentium Dual Core и Celeron , в то время как Conroe, Allendale и Kentsfield также продаются как процессоры Xeon .

Дополнительные кодовые названия для процессоров на основе этой модели: Woodcrest (LGA 771, кэш L2 4 МБ), Clovertown (MCM, LGA 771, кэш L2 2 × 4 МБ) и Tigerton (MCM, Socket 604 , кэш L2 2 × 4 МБ), все из которых продаются только под брендом Xeon.

Conroe-L / Merom-L [ править ]

Процессоры Conroe-L и Merom-L основаны на том же ядре, что и Conroe и Merom, но содержат только одно ядро ​​и 1 МБ кеш-памяти второго уровня, что значительно снижает производственные затраты и энергопотребление процессора за счет производительности по сравнению с двухъядерная версия. Он используется только в процессорах Core 2 Solo U2xxx со сверхнизким напряжением и в процессорах Celeron и обозначается как CPUID family 6 model 22.

Пенрин / Вольфдейл (45 морских миль) [ править ]

В цикле Tick-Tock Intel 2007/2008 «Tick» был сокращением микроархитектуры Core до 45 нанометров в качестве модели CPUID 23. В процессорах Core 2 он используется с кодовыми именами Penryn (Socket P), Wolfdale (LGA). 775) и Yorkfield (MCM, LGA 775), некоторые из которых также продаются как процессоры Celeron, Pentium и Xeon. В торговой марке Xeon кодовые названия Wolfdale-DP и Harpertown используются для MCM на базе LGA 771 с двумя или четырьмя активными ядрами Wolfdale.

Архитектурно 45-нм процессоры Core 2 оснащены SSE4.1 и новым механизмом разделения / перемешивания. [6]

Чипы бывают двух размеров: с кэш-памятью второго уровня 6 МБ и 3 МБ. Меньшая версия обычно называется Penryn-3M и Wolfdale-3M и Yorkfield-6M соответственно. Одноядерная версия Penryn, обозначенная здесь как Penryn-L, не является отдельной моделью, такой как Merom-L, а является версией модели Penryn-3M только с одним активным ядром.

Даннингтон [ править ]

Процессор Xeon «Dunnington» (CPUID Family 6, модель 29) тесно связан с Wolfdale, но имеет шесть ядер и встроенный кэш L3 и предназначен для серверов с Socket 604, поэтому он продается только как Xeon, а не как Ядро 2.

Steppings [ править ]

Микроархитектура Core использует несколько ступенчатых уровней (степпингов), которые, в отличие от предыдущих микроархитектур, представляют собой постепенные улучшения и различные наборы функций, такие как размер кеша и режимы низкого энергопотребления. Большинство этих степпингов используются разными брендами, как правило, путем отключения некоторых функций и ограничения тактовой частоты на чипах младшего класса.

В степпингах с уменьшенным размером кэша используется отдельная схема именования, что означает, что выпуски больше не расположены в алфавитном порядке. Добавленные степпинги использовались во внутренних и инженерных примерах, но не указаны в таблицах.

Многие высокопроизводительные процессоры Core 2 и Xeon используют многочиповые модули из двух или трех микросхем, чтобы получить больший размер кеша или более двух ядер.

Шаги по 65 нм техпроцессу[ редактировать ]

Ранние степпинги ES / QS: B0 (CPUID 6F4h), B1 (6F5h) и E0 (6F9h).

Степпинги B2 / B3, E1 и G0 процессоров модели 15 (cpuid 06fx) представляют собой этапы эволюции стандартного кристалла Merom / Conroe с кеш-памятью L2 4 МБ, при этом кратковременный степпинг E1 используется только в мобильных процессорах. Степпинг L2 и M0 - это чипы Allendale с кеш-памятью второго уровня всего 2 МБ, что снижает производственные затраты и энергопотребление процессоров младшего класса.

Степпинги G0 и M0 улучшают энергопотребление в режиме ожидания в состоянии C1E и добавляют состояние C2E в процессоры настольных ПК. В мобильных процессорах, каждый из которых поддерживает состояния ожидания с C1 по C4, степпинги E1, G0 и M0 добавляют поддержку платформы Mobile Intel 965 Express ( Santa Rosa ) с Socket P , в то время как более ранние степпинги B2 и L2 появляются только для Socket M на базе Intel Mobile 945 Express ( обновление Napa ) платформы.

Модель 22 степпинга A1 (cpuid 10661h) знаменует собой существенное изменение дизайна: всего одно ядро ​​и кэш L2 объемом 1 Мбайт, что еще больше снижает энергопотребление и стоимость производства для младшего класса. Как и в предыдущих степпингах, A1 не используется с платформой Mobile Intel 965 Express.

Степпинги G0, M0 и A1 в основном заменили все старые степпинги в 2008 году. В 2009 году был представлен новый степпинг G2, который заменил исходный степпинг B2. [7]

Шаги с использованием процесса 45 нм[ редактировать ]

В модели 23 (cpuid 01067xh) Intel начала маркетинговое степпинг с полным (6 МБ) и уменьшенным (3 МБ) кешем второго уровня одновременно и присвоением им идентичных значений cpuid. Все степпинги имеют новые инструкции SSE4.1 . Степпинг C1 / M1 был версией C0 / M0 с исправлением ошибок специально для четырехъядерных процессоров и использовался только в них. Шаг E0 / R0 добавляет две новые инструкции (XSAVE / XRSTOR) и заменяет все предыдущие шаги.

В мобильных процессорах степпинг C0 / M0 используется только в платформе Intel Mobile 965 Express ( обновление Santa Rosa ), тогда как степпинг E0 / R0 поддерживает более позднюю платформу Intel Mobile 4 Express ( Montevina ).

Модель 30 степпинга A1 (cpuid 106d1h) добавляет кэш L3 и шесть вместо обычных двух ядер, что приводит к необычно большому размеру кристалла - 503 мм². [8] По состоянию на февраль 2008 года он нашел свое применение только в высокопроизводительной серии Xeon 7400 ( Dunnington ).

Системные требования [ править ]

Совместимость материнской платы [ править ]

Conroe, Conroe XE и Allendale используют Socket LGA 775 ; однако не все материнские платы совместимы с этими процессорами.

Поддерживаемые наборы микросхем :

  • Intel : 865G / PE / P, 945G / GZ / GC / P / PL, 965G / P, 975X, P / G / Q965, Q963, 946GZ / PL, P3x, G3x, Q3x, X38, X48, P4x, 5400 Express См. Также: Список наборов микросхем Intel
  • NVIDIA : nForce4 Ultra / SLI X16 для Intel, nForce 570/590 SLI для Intel, nForce 650i Ultra / 650i SLI / 680i LT SLI / 680i SLI и nForce 750i SLI / 780i SLI / 790i SLI / 790i Ultra SLI .
  • ЧЕРЕЗ : P4M800, P4M800PRO, P4M890, P4M900, PT880 Pro / Ultra, PT890. См. Также: Список чипсетов VIA.
  • SiS : 662, 671, 671fx, 672, 672fx
  • ATI : Radeon Xpress 200 и CrossFire Xpress 3200 для Intel

Модель Yorkfield XE QX9770 (45 нм с системной шиной 1600 МТ / с) имеет ограниченную совместимость с набором микросхем - совместимы только X38, P35 (с разгоном ) и некоторые высокопроизводительные материнские платы X48 и P45. Постепенно выпускались обновления BIOS для обеспечения поддержки технологии Penryn, а QX9775 совместим только с материнской платой Intel D5400XS. Модель Wolfdale-3M E7200 также имеет ограниченную совместимость (по крайней мере, набор микросхем Xpress 200 несовместим) [ необходима цитата ] .

Хотя материнская плата может иметь необходимый набор микросхем для поддержки Conroe, некоторые материнские платы на основе вышеупомянутых наборов микросхем не поддерживают Conroe. Это связано с тем, что для всех процессоров на базе Conroe требуется новый набор функций подачи питания, указанный в Voltage Regulator-Down (VRD) 11.0 . Это требование является результатом значительно более низкого энергопотребления Conroe по сравнению с процессорами Pentium 4 / D, которые он заменил. Материнская плата, имеющая как поддерживающий набор микросхем, так и VRD 11, поддерживает процессоры Conroe, но даже в этом случае некоторым платам потребуется обновленный BIOS, чтобы распознавать FID (идентификатор частоты) и VID (идентификатор напряжения) Conroe.

Модули синхронной памяти [ править ]

В отличие от предыдущей конструкции Pentium 4 и Pentium D , технология Core 2 видит большую выгоду в том, что память работает синхронно с внешней шиной (FSB). Это означает, что для процессоров Conroe с FSB 1066 МТ / с идеальной производительностью памяти для DDR2 является PC2-8500 . В некоторых конфигурациях использование PC2-5300 вместо PC2-4200 может фактически снизить производительность. Только при переходе на PC2-6400 наблюдается значительный прирост производительности. Хотя модели памяти DDR2 с более жесткими временными характеристиками действительно улучшают производительность, разница в реальных играх и приложениях часто незначительна. [9]

В оптимальном случае предоставляемая полоса пропускания памяти должна соответствовать пропускной способности системной шины, то есть ЦП с номинальной скоростью шины 533 МТ / с должен быть сопряжен с ОЗУ с такой же номинальной скоростью, например DDR2 533 или PC2-4200. . Распространенный миф [ необходима цитата ] заключается в том, что установка чередующейся ОЗУ увеличивает пропускную способность в два раза. Однако в лучшем случае увеличение пропускной способности за счет установки чередующейся ОЗУ составляет примерно 5–10%. AGTL + ПСБ используется все NetBurst процессоров и ток и среднесрочный (пред- QuickPath ) Core 2 процессоров обеспечивает канал передачи данных 64-битный. Текущие наборы микросхем обеспечивают пару каналов DDR2 или DDR3.

В задачах, требующих доступа к большим объемам памяти, четырехъядерные процессоры Core 2 могут получить значительную выгоду [10] от использования памяти PC2-8500 , которая работает с той же скоростью, что и системная шина ЦП; это официально не поддерживаемая конфигурация, но ее поддерживают несколько материнских плат.

Процессор Core 2 не требует использования DDR2. Хотя чипсетам Intel 975X и P965 требуется эта память, некоторые материнские платы и наборы микросхем поддерживают как процессоры Core 2, так и память DDR . При использовании памяти DDR производительность может снизиться из-за меньшей доступной пропускной способности памяти.

Исправления в микросхеме [ править ]

Блок управления памятью Core 2 (MMU) в процессорах X6800, E6000 и E4000 не работает в соответствии с предыдущими спецификациями, реализованными в предыдущих поколениях оборудования x86 . Это может вызвать проблемы, многие из которых являются серьезными проблемами безопасности и стабильности, с существующим программным обеспечением операционной системы . В документации Intel указано, что их руководства по программированию будут обновлены «в ближайшие месяцы» с информацией о рекомендуемых методах управления резервным буфером трансляции (TLB) для Core 2, чтобы избежать проблем, и признается, что «в редких случаях неправильная аннулирование TLB может привести к непредсказуемому поведению системы, например зависанию или неверным данным ». [11]

Среди заявленных вопросов:

  • Бит невыполнения распределяется между ядрами.
  • Несогласованность инструкций с плавающей запятой.
  • Допустимые повреждения памяти за пределами разрешенного диапазона записи для процесса путем выполнения общих последовательностей инструкций.

Intel Errata Ax39, Ax43, Ax65, Ax79, Ax90, Ax99 говорят, что особенно серьезно. [12] 39, 43, 79, которые могли вызвать непредсказуемое поведение или зависание системы, были исправлены в недавних степпингах .

Среди тех , кто заявил об исправлениях быть особенно серьезны OpenBSD «s Тео де Raadt [13] и DragonFly BSD » s Мэтью Диллон . [14] Противоположную точку зрения высказал Линус Торвальдс , назвавший проблему TLB «совершенно несущественной», добавив: «Самая большая проблема в том, что Intel просто следовало лучше задокументировать поведение TLB». [15]

Microsoft выпустила обновление KB936357 для устранения ошибок путем обновления микрокода [16] без потери производительности. Также доступны обновления BIOS для решения этой проблемы.

См. Также [ править ]

  • архитектура x86
  • Список микроархитектур ЦП Intel

Ссылки [ править ]

  1. ^ «Пенрин прибыл: Обзор Core 2 Extreme QX9650» . ExtremeTech. Архивировано из оригинального 31 октября 2007 года . Проверено 30 октября 2006 года .
  2. Кинг, Ян (9 апреля 2007 г.). «Как Израиль спас Intel» . Сиэтл Таймс . Проверено 15 апреля 2012 года .
  3. ^ a b Суинберн, Ричард (3 ноября 2008 г.). «Intel Core i7 - Погружение в архитектуру Nehalem: 5 - Улучшения архитектуры» . Проверено 21 августа 2011 года .
  4. ^ "Процессор Intel Xeon 5110" . Intel . Проверено 15 апреля 2012 года .
  5. ^ "Процессор Intel Xeon 5120" . Intel . Проверено 15 апреля 2012 года .
  6. ^ http://www.anandtech.com/show/2362
  7. ^ «Уведомление об изменении продукта» (PDF) . Архивировано из оригинального (PDF) 22 декабря 2010 года . Проверено 17 июня 2012 года .
  8. ^ "Запись ARK для процессора Intel Xeon X7460" . Intel . Проверено 14 июля 2009 года .
  9. ^ piotke (1 августа 2006 г.). «Intel Core 2: стоит ли высокая скорость памяти своей цены?» . Креветки . Проверено 1 августа 2006 года .
  10. Джейкоб (19 мая 2007 г.). «Тесты четырех процессов Prime95 на четырехъядерном процессоре» . Форум Мерсенна . Проверено 22 мая 2007 года .
  11. ^ «Двухъядерный процессор Intel Xeon серии 7200 и четырехъядерный процессор Intel Xeon серии 7300» (PDF) . п. 46 . Проверено 23 января 2010 года .
  12. ^ «Процессор Intel Core 2 Duo для обновления спецификации технологии процессора Intel Centrino Duo» (PDF) . С. 18–21.
  13. ^ marc.info
  14. ^ «Мэтью Диллон об ошибках Intel Core» . Журнал OpenBSD. 30 июня 2007 . Проверено 15 апреля 2012 года .
  15. Торвальдс, Линус (27 июня 2007 г.). «Исправления Core 2 - проблемные или преувеличенные?» . Технологии реального мира . Проверено 15 апреля 2012 года .
  16. ^ «Доступно обновление надежности микрокода, которое повышает надежность систем, использующих процессоры Intel» . Microsoft. 8 октября 2011 . Проверено 15 апреля 2012 года .

Внешние ссылки [ править ]

  • Веб-сайт Intel Core Microarchitecture
  • Пресс-релиз Intel с объявлением о планах по созданию новой микроархитектуры
  • Пресс-релиз Intel о базовой микроархитектуре
  • Дорожная карта процессоров Intel
  • Подробный взгляд на новую архитектуру ядра Intel
  • Intel назвала основную микроархитектуру
  • Фотографии процессоров, использующих, среди прочего, Core Microarchitecture (также первое упоминание о Clovertown-MP)
  • Основные доклады IDF, рекламирующие производительность новых процессоров
  • Ядро новых чипов Intel
  • Обзор базовой микроархитектуры от RealWorld Tech
  • Подробный обзор основной микроархитектуры в Ars Technica
  • Intel Core против архитектуры AMD K8 в Anandtech
  • Даты выпуска будущих процессоров Intel Core с микроархитектурой Intel Core
  • Тесты, сравнивающие вычислительную мощность архитектуры ядра с более старыми центральными процессорами Intel Netburst и AMD Athlon64