Из Википедии, бесплатной энциклопедии
  (Перенаправлено из дизайна ЦП )
Перейти к навигации Перейти к поиску

Проектирование процессора - это инженерная задача по созданию процессора , ключевого компонента компьютерного оборудования . Это подраздел компьютерной инженерии (проектирование, разработка и внедрение) и электронной техники (изготовление). Процесс проектирования включает выбор набора инструкций и определенной парадигмы выполнения (например, VLIW или RISC ) и приводит к микроархитектуре , которая может быть описана, например, в VHDL или Verilog . Для микропроцессораЭто описание затем составляется с использованием некоторых из различных процессов изготовления полупроводниковых устройств , в результате чего кристалл прикрепляется к держателю кристалла . Этот носитель микросхемы затем припаивается или вставляется в гнездо на печатной плате (PCB).

Режим работы любого процессора - это выполнение списков инструкций. Инструкции обычно включают в себя те, которые предназначены для вычисления или управления значениями данных с помощью регистров , изменения или извлечения значений в памяти для чтения / записи, выполнения реляционных тестов между значениями данных и для управления потоком программы.

Проекты процессоров часто тестируются и проверяются на ПЛИС перед отправкой проекта процессора на литейный завод для изготовления полупроводников . [1]

Подробности [ править ]

Основы [ править ]

Дизайн процессора делится на дизайн следующих компонентов:

  1. пути данных (например, ALU и конвейеры )
  2. блок управления : логика, которая управляет путями данных
  3. Компоненты памяти, такие как файлы регистров , кеши
  4. Часы схема , такие как часы водители, ФАП , распределительные сети часов
  5. Схема приемопередатчика пэда
  6. Библиотека ячеек логических вентилей, которая используется для реализации логики

ЦП, предназначенные для рынков с высокой производительностью, могут потребовать индивидуальной (оптимизированной или ориентированной на приложение (см. Ниже)) конструкции для каждого из этих элементов для достижения целей по частоте, рассеиваемой мощности и площади микросхемы, тогда как ЦП, предназначенные для рынков с более низкой производительностью, могут уменьшить реализацию. бремя приобретения некоторых из этих предметов путем покупки их в качестве интеллектуальной собственности . Методы реализации логики управления ( синтез логики с использованием инструментов САПР) могут использоваться для реализации каналов данных, файлов регистров и часов. Общие стили логики, используемые при проектировании ЦП, включают неструктурированную случайную логику, конечные автоматы , микропрограммирование (распространенное с 1965 по 1985 год) и массивы программируемой логики. (обычное дело в 1980-х годах, больше не распространено).

Логика реализации [ править ]

Типы устройств, используемых для реализации логики, включают:

  • Транзисторно-транзисторная логика Маломасштабные логические микросхемы интеграции - больше не используются для ЦП
  • Программируемая матричная логика и программируемые логические устройства - больше не используются для ЦП
  • Матрицы вентилей с эмиттерной логикой (ECL) - больше не распространены
  • Матрицы вентилей CMOS - больше не используются для процессоров
  • КМОП -микросхемы массового производства - подавляющее большинство процессоров по объему
  • CMOS ASIC - только для меньшинства специальных приложений из-за расходов
  • Программируемые пользователем вентильные матрицы (FPGA) - общие для программных микропроцессоров и более или менее требуемые для реконфигурируемых вычислений

Проект дизайна ЦП обычно имеет следующие основные задачи:

  • Архитектура набора команд, видимая программисту , которая может быть реализована с помощью различных микроархитектур.
  • Архитектурное исследование и моделирование производительности в ANSI C / C ++ или SystemC [ требуется пояснение ]
  • Реализация высокоуровневого синтеза (HLS) или уровня передачи регистров (RTL, например, логика)
  • RTL проверка
  • Схемотехника критических по быстродействию компонентов (кэшей, регистров, ALU)
  • Логический синтез или проектирование на уровне логических вентилей
  • Временной анализ для подтверждения того, что все логические схемы и схемы будут работать на указанной рабочей частоте.
  • Физический дизайн, включая план этажа , место и маршрут логических ворот
  • Проверка эквивалентности представлений RTL, уровня затвора, уровня транзистора и физического уровня
  • Проверяет целостность сигнала , возможность изготовления микросхемы

Перепроектирование ядра ЦП на меньшую площадь кристалла помогает сжать все (« усадка фотошаблона »), что приводит к тому же количеству транзисторов на кристалле меньшего размера. Это улучшает производительность (меньшие транзисторы переключаются быстрее), снижает мощность (меньшие провода имеют меньшую паразитную емкость ) и снижает стоимость (больше процессоров помещается на одну кремниевую пластину). Освобождение ЦП на кристалле того же размера, но с меньшим ядром ЦП сохраняет стоимость примерно такой же, но позволяет более высокий уровень интеграции в одном очень крупномасштабном интеграционном чипе (дополнительный кэш, несколько ЦП или другие компоненты), повышая производительность и снижение общей стоимости системы.

Как и в случае с большинством сложных электронных схем, проверка логики (доказывающая, что конструкция не содержит ошибок) теперь доминирует в графике проекта ЦП.

Ключевые архитектурные инновации ЦП включают индексный регистр , кеш , виртуальную память , конвейерную обработку команд , суперскаляр , CISC , RISC , виртуальную машину , эмуляторы , микропрограммы и стек .

Микроархитектурные концепции [ править ]

Темы исследований [ править ]

Было предложено множество новых идей дизайна ЦП , включая реконфигурируемую логику , ЦП без тактовой частоты , вычислительную ОЗУ и оптические вычисления .

Анализ производительности и сравнительный анализ [ править ]

Бенчмаркинг - это способ тестирования скорости процессора. Примеры включают SPECint и SPECfp , разработанные Standard Performance Evaluation Corporation , и ConsumerMark, разработанные консорциумом Embedded Microprocessor Benchmark Consortium EEMBC .

Некоторые из часто используемых показателей включают:

  • Инструкций в секунду. Большинство потребителей выбирают архитектуру компьютера (обычно архитектура Intel IA32 ), чтобы иметь возможность запускать большую базу уже существующего предварительно скомпилированного программного обеспечения. Поскольку некоторые из них относительно мало осведомлены о компьютерных тестах, некоторые из них выбирают конкретный процессор в зависимости от рабочей частоты (см. Миф о мегагерцах ).
  • FLOPS - количество операций с плавающей запятой в секунду часто важно при выборе компьютеров для научных вычислений.
  • Производительность на ватт. Системные разработчики, создающие параллельные компьютеры , такие как Google , выбирают процессоры в зависимости от их скорости на ватт мощности, потому что стоимость питания процессора превышает стоимость самого процессора. [2] [3]
  • Некоторые разработчики систем, создающие параллельные компьютеры, выбирают процессоры в зависимости от скорости на доллар.
  • Системные проектировщики, создающие вычислительные системы реального времени, хотят гарантировать наихудший ответ. Это легче сделать, когда ЦП имеет низкую задержку прерывания и детерминированный ответ. ( DSP )
  • Компьютерные программисты, которые программируют непосредственно на языке ассемблера, хотят, чтобы ЦП поддерживал полный набор инструкций .
  • Низкое энергопотребление - для систем с ограниченными источниками энергии (например, солнечная энергия, батареи, энергия человека).
  • Малые габариты или малый вес - для портативных встраиваемых систем, систем для космических аппаратов.
  • Воздействие на окружающую среду - минимизация воздействия компьютеров на окружающую среду во время производства и переработки, а также во время использования. Уменьшение количества отходов, уменьшение количества опасных материалов. (см. Зеленые вычисления ).

При оптимизации некоторых из этих показателей возможны компромиссы. В частности, многие методы проектирования, которые заставляют ЦП работать быстрее, значительно ухудшают «производительность на ватт», «производительность на доллар» и «детерминированный отклик», и наоборот.

Рынки [ править ]

Есть несколько разных рынков, на которых используются процессоры. Поскольку каждый из этих рынков отличается своими требованиями к процессорам, устройства, предназначенные для одного рынка, в большинстве случаев не подходят для других рынков.

Вычислительная техника общего назначения [ править ]

Подавляющее большинство доходов, получаемых от продажи ЦП, приходится на вычисления общего назначения [ необходима цитата ] , то есть настольные, портативные и серверные компьютеры, обычно используемые на предприятиях и дома. На этом рынке доминируют Intel IA-32 и 64-разрядная версия архитектуры x86-64 , а ее конкуренты PowerPC и SPARC имеют гораздо меньшую клиентскую базу. Ежегодно на этом рынке используются сотни миллионов процессоров с архитектурой IA-32. Растущий процент этих процессоров предназначен для мобильных устройств, таких как нетбуки и ноутбуки. [4]

Поскольку эти устройства используются для запуска бесчисленного количества различных типов программ, эти конструкции ЦП не предназначены специально для одного типа приложений или одной функции. Требования к возможности эффективно запускать широкий спектр программ сделали эти конструкции ЦП одними из наиболее продвинутых в техническом отношении, наряду с некоторыми недостатками, заключающимися в относительно высокой стоимости и высоком энергопотреблении.

Экономичность высокопроизводительных процессоров [ править ]

В 1984 году для разработки большинства высокопроизводительных процессоров потребовалось от четырех до пяти лет. [5]

Научные вычисления [ править ]

Научные вычисления - это гораздо меньшая ниша на рынке (по выручке и отгруженным единицам). Он используется в государственных исследовательских лабораториях и университетах. До 1990 года ЦП часто разрабатывались для этого рынка, но ЦП массового рынка, организованные в большие кластеры, оказались более доступными. Основная оставшаяся область активного проектирования аппаратного обеспечения и исследований для научных вычислений - это системы высокоскоростной передачи данных для подключения процессоров массового рынка.

Встроенный дизайн [ править ]

Если судить по количеству отгруженных единиц, большинство процессоров встроено в другое оборудование, такое как телефоны, часы, бытовые приборы, транспортные средства и инфраструктуру. Встраиваемые процессоры продаются в количестве многих миллиардов единиц в год, однако в основном по гораздо более низким ценам, чем процессоры общего назначения.

Эти однофункциональные устройства отличаются от более привычных процессоров общего назначения по нескольким параметрам:

  • Низкая стоимость имеет большое значение.
  • Важно поддерживать низкое рассеивание мощности, поскольку встроенные устройства часто имеют ограниченный срок службы батареи, и часто нецелесообразно включать охлаждающие вентиляторы. [6]
  • Чтобы снизить стоимость системы, периферийные устройства интегрированы с процессором на одном кремниевом кристалле.
  • Сохранение периферийных устройств на кристалле также снижает энергопотребление, поскольку внешние порты GPIO обычно требуют буферизации, чтобы они могли передавать или принимать относительно высокие токовые нагрузки, необходимые для поддержания сильного сигнала вне кристалла.
    • Многие встроенные приложения имеют ограниченное физическое пространство для схем; Сохранение периферийных устройств на кристалле уменьшит пространство, необходимое для монтажной платы.
    • Память программ и данных часто интегрируется в один и тот же чип. Когда единственной допустимой программной памятью является ПЗУ , устройство называется микроконтроллером .
  • Для многих встроенных приложений задержка прерывания будет более критичной, чем для некоторых универсальных процессоров.

Экономика встроенного процессора [ править ]

Семейство встраиваемых процессоров с наибольшим количеством отгруженных блоков - это 8051 , в среднем около миллиарда единиц в год. [7] 8051 широко используется, потому что он очень недорогой. Время разработки сейчас примерно равно нулю, потому что он широко доступен как коммерческая интеллектуальная собственность. Теперь он часто встраивается в микросхему как небольшую часть более крупной системы. Стоимость кремния 8051 сейчас составляет всего 0,001 доллара США, потому что в некоторых реализациях используется всего 2200 логических вентилей и 0,0127 квадратных миллиметра кремния. [8] [9]

По состоянию на 2009 год с использованием набора команд архитектуры ARM производится больше процессоров, чем с использованием любого другого 32-разрядного набора команд. [10] [11] Архитектура ARM и первый чип ARM были разработаны примерно за полтора года и 5 человеческих лет рабочего времени. [12]

Архитектура 32-битного микроконтроллера Parallax Propeller и первый чип были разработаны двумя людьми примерно за 10 человеческих лет работы. [13]

8-битная архитектура AVR и первый микроконтроллер AVR были задуманы и разработаны двумя студентами Норвежского технологического института.

8-битная архитектура 6502 и первый чип MOS Technology 6502 были разработаны за 13 месяцев группой из примерно 9 человек. [14]

Исследовательский и образовательный дизайн ЦП [ править ]

32-битная архитектура Berkeley RISC I и RISC II, а также первые микросхемы были в основном разработаны группой студентов в рамках четырех четвертных курсов для аспирантов. [15] Эта конструкция легла в основу конструкции коммерческого процессора SPARC .

В течение примерно десяти лет каждый студент, посещавший курс 6.004 в Массачусетском технологическом институте, был частью команды - у каждой команды был один семестр на разработку и создание простого 8-битного ЦП из интегральных схем серии 7400 . Одна команда из 4 студентов спроектировала и построила простой 32-битный процессор в течение этого семестра. [16]

Некоторые курсы бакалавриата требуют, чтобы команда из 2-5 студентов спроектировала, внедрила и протестировала простой ЦП на ПЛИС за один 15-недельный семестр. [17]

Процессор MultiTitan был разработан с затратами 2,5 человеко-лет, что в то время считалось «относительно небольшими затратами на проектирование». [18] 24 человека внесли свой вклад в 3,5-летний исследовательский проект MultiTitan, который включал проектирование и создание прототипа ЦП. [19]

Мягкие микропроцессорные ядра [ править ]

Для встроенных систем высочайшие уровни производительности часто не требуются или не желательны из-за требований к энергопотреблению. Это позволяет использовать процессоры, которые могут быть полностью реализованы методами логического синтеза . Эти синтезированные процессоры могут быть реализованы за гораздо более короткое время, что дает более быстрый выход на рынок .

См. Также [ править ]

  • Закон Амдала
  • Центральное процессорное устройство
  • Сравнение архитектур наборов инструкций
  • Компьютер со сложной системой команд
  • Автоматизация электронного проектирования
  • Синтез высокого уровня
  • История процессоров общего назначения
  • Микроархитектура
  • Микропроцессор
  • Компьютер с минимальным набором команд
  • Закон Мура
  • Компьютер с сокращенным набором команд
  • Система на кристалле
  • Комплект технологического проектирования - набор документов, созданных или накопленных для процесса производства полупроводникового прибора.

Ссылки [ править ]

  1. ^ Cutress, Ян (27 августа 2019). «Xilinx анонсирует крупнейшую в мире ПЛИС: Virtex Ultrascale + VU19P с 9-метровыми ячейками» . AnandTech .
  2. ^ "EEMBC ConsumerMark" . Архивировано из оригинального 27 марта 2005 года.
  3. ^ Стивен Шенкленд (9 декабря 2005). «Электроэнергия может стоить больше, чем серверы, - предупреждает Google» .
  4. ^ Керр, Джастин. «AMD впервые теряет долю рынка, поскольку продажи мобильных процессоров превосходят продажи настольных ПК». Максимум ПК. Опубликовано 26 октября 2010 г.
  5. ^ «Новая система управляет сотнями транзакций в секунду», статья Роберта Хорста и Сандры Мец из Tandem Computers Inc., журнал «Электроника», 19 апреля 1984 г .: «В то время как для разработки большинства высокопроизводительных процессоров требуется от четырех до пяти лет,Процессору NonStop TXP потребовалось всего 2 + 1/2 года - шесть месяцев на разработку полной письменной спецификации, один год на создание рабочего прототипа и еще один год на серийное производство ».
  6. ^ С. Миттал, " Обзор методов повышения энергоэффективности встраиваемых вычислительных систем ", IJCAET, 6 (4), 440–459, 2014.
  7. ^ Кертис А. Нельсон. «Обзор 8051» (PDF) . Архивировано из оригинального (PDF) 09.10.2011 . Проверено 10 июля 2011 .
  8. ^ Квадратные миллиметры на 8051, 0,013 дюйма при ширине линии 45 нм; видеть
  9. ^ Чтобы рассчитать количество долларов на квадратный миллиметр, см. [1] и обратите внимание, что компонент SOC не требует затрат на штырьки или упаковку.
  10. ^ "Ядра ARM поднимаются на территорию 3G" Марка Хачмана, 2002.
  11. ^ "Двухпроцентное решение" Джима Терли 2002.
  12. ^ "Путь ARM" 1998
  13. ^ «Почему Propeller завод» от Chip Gracey
  14. ^ "Интервью с Уильямом Меншем" . Архивировано из оригинала на 2016-03-04 . Проверено 1 февраля 2009 .
  15. ^ CH Séquin ; Д.А. Паттерсон . «Дизайн и реализация RISC I» (PDF) .
  16. ^ "VHS" . Архивировано из оригинала на 2010-02-27.
  17. ^ Ян Грей. «Обучение компьютерному проектированию с помощью ПЛИС» .
  18. ^ Норман П. Джуппи ; Джеффри Ю.Ф. Тан (1989). «Устойчивый 32-разрядный CMOS-микропроцессор на 20 MIPS с высоким соотношением стабильной и максимальной производительности»: i. CiteSeerX 10.1.1.85.988 .  Цитировать журнал требует |journal=( помощь )
  19. ^ "MultiTitan: Четыре документа по архитектуре" (PDF) . 1988. С. 4–5.

Общие ссылки [ править ]

  • Хван, Енох (2006). Цифровая логика и дизайн микропроцессора с VHDL . Томсон. ISBN 0-534-46593-5.
  • Дизайн процессора: введение