Из Википедии, бесплатной энциклопедии
  (Перенаправлено с 3D-ускорителя )
Перейти к навигации Перейти к поиску
Компоненты графического процессора

А графический процессор ( GPU ) является специализированной электронной схемой предназначена для быстрого манипулировать и альтер памяти для ускорения создания изображений в буфере кадра , предназначенных для вывода на устройство отображения . Графические процессоры используются во встроенных системах , мобильных телефонах , персональных компьютерах , рабочих станциях и игровых консолях . Современные графические процессоры очень эффективны при манипулировании компьютерной графикой и обработкой изображений . Их очень параллельная структураделает их более эффективными, чем центральные процессоры общего назначения (ЦП) для алгоритмов, которые обрабатывают большие блоки данных параллельно. В персональном компьютере графический процессор может присутствовать на видеокарте или встроен в материнскую плату . В некоторых ЦП они встроены в кристалл ЦП . [1]

В 1970-х годах термин «графический процессор» первоначально обозначал графический процессор и описывал программируемый процессор, независимо работающий от центрального процессора и отвечающий за обработку и вывод графики. [2] [3] Позднее, в 1994 году, Sony использовали термин (теперь стоя для графического процессора ) со ссылкой на PlayStation консоли Toshiba -разработана Sony GPU в 1994 году [4] Этот термин был популяризировал Nvidia в 1999 году, который позиционировал GeForce 256 как «первый в мире графический процессор». [5] Он был представлен как «однокристальный процессор.со встроенными механизмами преобразования, освещения, установки / отсечения треугольников и рендеринга ». [6] Rival ATI Technologies ввела термин« блок визуальной обработки »или VPU с выпуском Radeon 9700 в 2002 году [7].

История [ править ]

1970-е [ править ]

Системные платы Arcade используют специализированные графические схемы с 1970-х годов. В раннем оборудовании видеоигр оперативная память для буферов кадров была дорогостоящей, поэтому видеочипы объединяли данные вместе во время сканирования дисплея на мониторе. [8]

Для помощи процессору в анимации фреймбуфера в различных аркадных играх 1970-х от Midway и Taito , таких как Gun Fight (1975), Sea Wolf (1976) и Space Invaders (1978), использовалась специализированная схема переключения ствола . [9] [10] [11] В аркадной системе Namco Galaxian в 1979 году использовалось специализированное графическое оборудование, поддерживающее цвет RGB , разноцветные спрайты и фон тайловых карт . [12] Аппаратное обеспечение Galaxian широко использовалось во временазолотой век аркадных видеоигр от таких игровых компаний, как Namco , Centuri , Gremlin , Irem , Konami , Midway , Nichibutsu , Sega и Taito . [13] [14]

Микропроцессор Atari ANTIC на материнской плате Atari 130XE

На домашнем рынке Atari 2600 в 1977 году использовала видеопереключатель под названием Television Interface Adapter . [15] В 8-битных компьютерах Atari (1979 г.) был ANTIC , видеопроцессор, который интерпретировал инструкции, описывающие «список отображения» - способ, которым линии развертки соответствуют определенным битовым или символьным режимам и где хранится память (так что не обязательно должен быть непрерывным буфером кадров). [16] 6502 подпрограммы машинного кода могут запускаться в строках развертки путем установки бита в инструкции списка отображения. [17] ANTIC также поддерживает плавные вертикальные игоризонтальная прокрутка независимо от процессора. [18]

1980-е [ править ]

NEC μPD7220 A

NEC μPD7220 была первой реализацией процессора ПК графического дисплея в виде единый Крупномасштабная интеграция (БИС) интегральная схема чипа, позволяя конструкцию недорогого, видеографические высокопроизводительных карты , таких как те , от Number Nine визуальных технологий . Он стал самым известным графическим процессором вплоть до середины 1980-х годов. [19] Это был первый полностью интегрированный процессор графического дисплея металл-оксид-полупроводник ( NMOS ) с полностью интегрированной СБИС (очень крупномасштабной интеграцией) для ПК с поддержкой разрешения до 1024x1024., и заложил основы для развивающегося рынка графики для ПК. Он использовался в ряде видеокарт и был лицензирован для клонов, таких как Intel 82720, первый из графических процессоров Intel . [20] Аркадные игры Williams Electronics Robotron 2084 , Joust , Sinistar и Bubbles , выпущенные в 1982 году, содержат специальные микросхемы блиттера для работы с 16-цветными растровыми изображениями. [21] [22]

В 1984 году Hitachi выпустила ARTC HD63484, первый крупный графический процессор CMOS для ПК. ARTC был способен отображать разрешение до 4K в монохромном режиме и использовался в ряде графических карт и терминалов ПК в конце 1980-х годов. [23] В 1985 году в Commodore Amiga был реализован специальный графический чип с модулем блиттера, ускоряющим работу с растровыми изображениями, рисование линий и заполнение областей. Также включен сопроцессорсо своим собственным простым набором команд, способным управлять регистрами графического оборудования синхронно с видеолучевым лучом (например, для переключения палитры на каждую строку развертки, мультиплексирования спрайтов и аппаратного управления окнами) или управлять блиттером. В 1986 году компания Texas Instruments выпустила TMS34010 , первый полностью программируемый графический процессор. [24] Он мог запускать универсальный код, но имел набор инструкций, ориентированный на графику. В течение 1990–1992 годов этот чип стал основой ускорительных карт Windows с графической архитектурой Texas Instruments («TIGA») .

IBM 8514 Micro Channel адаптер с памятью дополнения.

В 1987 году была выпущена графическая система IBM 8514 как одна из [ неопределенных ] первых видеокарт для совместимых с IBM PC, в которых реализованы 2D-примитивы с фиксированными функциями в электронном оборудовании . Sharp «S X68000 , выпущенный в 1987 году, используется чипсет графикой [25] с палитрой и аппаратной поддержки в 65536 цвета для спрайтов, прокрутки и нескольких playfields, [26] в конечном счете , выступающей в качестве развития машины для Capcom » s CP System аркаде доска. Позже Fujitsu конкурировала с FM Towns.компьютер, выпущенный в 1989 году с поддержкой полной цветовой палитры 16 777 216. [27] В 1988 году первые специализированные полигональные платы для 3D- графики были представлены в игровых автоматах с Namco System 21 [28] и Taito Air System. [29]

Раздел VGA на материнской плате в IBM PS / 55

IBM «s патентованный Video Graphics Array стандартный дисплей (VGA) был введен в 1987 году, с максимальным разрешением 640 × 480 пикселей. В ноябре 1988 года компания NEC Home Electronics объявила о создании Ассоциации стандартов видеоэлектроники (VESA) для разработки и продвижения стандарта компьютерных дисплеев Super VGA (SVGA) в качестве преемника проприетарного стандарта дисплеев VGA от IBM. Разрешение графического дисплея с поддержкой Super VGA до 800 × 600 пикселей , увеличение на 36%. [30]

1990-е [ править ]

Tseng Labs ET4000 / W32p
S3 Графика ViRGE
Карта Voodoo3 2000 AGP

В 1991 году компания S3 Graphics представила модель S3 86C911 , которую дизайнеры назвали в честь Porsche 911 в знак обещанного повышения производительности. [31] 86C911 породил множество подражателей: к 1995 году все основные производители графических чипов для ПК добавили в свои чипы поддержку 2D- ускорения. [32] [33] К этому времени ускорители Windows с фиксированными функциями превзошли дорогие графические сопроцессоры общего назначения по производительности Windows, и эти сопроцессоры исчезли с рынка ПК.

На протяжении 1990-х годов ускорение 2D- графического интерфейса продолжало развиваться. По мере улучшения производственных возможностей повышался и уровень интеграции графических чипов. Дополнительные интерфейсы прикладного программирования (API) появились для множества задач, таких как графическая библиотека Microsoft WinG для Windows 3.x и их более поздний интерфейс DirectDraw для аппаратного ускорения 2D-игр в Windows 95 и более поздних версиях.

В начале и середине 1990-х годов 3D-графика в реальном времени становилась все более распространенной в аркадных, компьютерных и консольных играх, что привело к растущему общественному спросу на 3D-графику с аппаратным ускорением . Ранние образцы массового оборудования для 3D-графики можно найти в аркадных системных платах, таких как Sega Model 1 , Namco System 22 и Sega Model 2 , а также в консолях для видеоигр пятого поколения, таких как Saturn , PlayStation и Nintendo 64 . Аркадные системы, такие как Sega Model 2 и Namco Magic Edge Hornet Simulator в 1993 году, были способны аппаратно выполнять T&L ( преобразование, отсечение и освещение).) за годы до появления в потребительских видеокартах. [34] [35] Некоторые системы использовали DSP для ускорения преобразований. Fujitsu , которая работала над аркадной системой Sega Model 2 [36], начала работать над интеграцией T&L в единое решение LSI для использования на домашних компьютерах в 1995 году; [37] [38] Сканер Fujitsu Pinolite, первый 3D геометрического процессор для персональных компьютеров, выпущенный в 1997 году [39] Первый Hardware T & L GPU на домашнем видео игровых консолей был Nintendo 64 «сек реальности сопроцессор , выпущенный в 1996 году [ 40] В 1997 г.Mitsubishi выпустила 3Dpro / 2MP , полнофункциональный графический процессор, способный преобразовывать и освещать, для рабочих станций и настольных компьютеров Windows NT ; [41] ATi использовали его для их FireGL 4000 видеокарты , выпущенный в 1997 году [42]

Термин «графический процессор» был введен Sony в отношении 32-разрядного графического процессора Sony (разработанного Toshiba ) в игровой консоли PlayStation , выпущенной в 1994 году [4].

В мире ПК заметными первыми неудачными попытками создания недорогих чипов 3D-графики стали S3 ViRGE , ATI Rage и Matrox Mystique . Эти чипы были, по сути, 2D-ускорителями предыдущего поколения с привязанными к ним 3D-функциями. Многие из них даже были совместимы по выводам с чипами предыдущего поколения для простоты внедрения и минимальной стоимости. Первоначально производительная 3D-графика была возможна только с дискретными платами, предназначенными для ускорения 3D-функций (и полностью лишенными ускорения 2D-графического интерфейса), такими как PowerVR и 3dfx Voodoo.. Однако по мере того, как производственные технологии продолжали развиваться, видео, ускорение 2D-графического интерфейса и 3D-функции были интегрированы в один чип. Чипсеты Verite от Rendition были одними из первых, кто сделал это достаточно хорошо, чтобы заслужить упоминания. В 1997 году Rendition пошла еще дальше, сотрудничая с Hercules и Fujitsu над проектом Thriller Conspiracy, который объединил геометрический процессор Fujitsu FXG-1 Pinolite с ядром Vérité V2200 для создания видеокарты с полным движком T&L за годы до Nvidia GeForce 256 . Эта карта, предназначенная для снижения нагрузки на центральный процессор системы, так и не поступила на рынок. [ необходима цитата ]

OpenGL появился в начале 90-х как профессиональный графический API, но изначально страдал от проблем с производительностью, которые позволили Glide API вмешаться и стать доминирующей силой на ПК в конце 90-х. [43] Однако эти проблемы были быстро преодолены, и API Glide отошел на второй план. Программные реализации OpenGL были обычным явлением в то время, хотя влияние OpenGL в конечном итоге привело к широкой поддержке оборудования. Со временем возник паритет между функциями, предлагаемыми в аппаратном обеспечении, и функциями, предлагаемыми в OpenGL. DirectX стал популярным среди Windowsразработчики игр в конце 90-х. В отличие от OpenGL, Microsoft настаивала на обеспечении строгой индивидуальной поддержки оборудования. Первоначально такой подход сделал DirectX менее популярным в качестве автономного графического API, поскольку многие графические процессоры предоставляли свои собственные специфические функции, которые уже могли использовать существующие приложения OpenGL, оставляя DirectX часто позади на одно поколение. (См .: Сравнение OpenGL и Direct3D .)

Со временем Microsoft начала более тесно сотрудничать с разработчиками оборудования и нацелена на то, чтобы выпуски DirectX совпадали с выпусками поддерживаемого графического оборудования. Direct3D 5.0 был первой версией развивающегося API, получившей широкое распространение на игровом рынке, и он напрямую конкурировал со многими более аппаратно-ориентированными, часто проприетарными графическими библиотеками, в то время как OpenGL сохранил сильных сторонников. Direct3D 7.0 представил поддержку аппаратно-ускоренного преобразования и освещения (T&L) для Direct3D, тогда как в OpenGL эта возможность была реализована с самого начала. Карты 3D-ускорителей вышли за рамки простых растеризаторов и добавили еще один важный аппаратный этап в конвейер 3D-рендеринга. Nvidia GeForce 256 (также известная как NV10) была первой картой потребительского уровня, выпущенной на рынок с аппаратным ускорением T&L, в то время как профессиональные 3D-карты уже имели такую ​​возможность. Аппаратное преобразование и освещение, уже существующие функции OpenGL, появились в оборудовании потребительского уровня в 90-х годах и создали прецедент для более позднихблоков пиксельных шейдеров и вершинных шейдеров, которые были гораздо более гибкими и программируемыми.

С 2000 по 2010 год [ править ]

Nvidia была первой, кто произвел чип, способный программировать затенение ; GeForce 3 ( под кодовым названием NV20). Теперь каждый пиксель мог обрабатываться короткой «программой», которая могла включать в себя дополнительные текстуры изображения в качестве входных данных, и каждая геометрическая вершина могла аналогичным образом обрабатываться короткой программой перед ее проецированием на экран. Используемый в консоли Xbox , он конкурировал с PlayStation 2 , в которой использовался пользовательский векторный блок для аппаратно ускоренной обработки вершин; обычно обозначается как VU0 / VU1. Самые ранние воплощения механизмов выполнения шейдеров, используемых в Xboxне были универсальными и не могли выполнять произвольный пиксельный код. Вершины и пиксели обрабатывались разными модулями, у которых были свои собственные ресурсы с пиксельными шейдерами, имеющими гораздо более жесткие ограничения (поскольку они выполнялись с гораздо более высокими частотами, чем с вершинами). Механизмы пиксельного затенения на самом деле были больше похожи на настраиваемый функциональный блок и на самом деле не «запускали» программу. Многие из этих различий между вершинным и пиксельным затенением не были устранены до гораздо более позднего времени с помощью унифицированной шейдерной модели .

К октябрю 2002 года, с появлением ATI Radeon 9700 (также известной как R300), первого в мире ускорителя Direct3D 9.0, пиксельные и вершинные шейдеры могли реализовывать циклы и длинные вычисления с плавающей запятой , и быстро становились такими же гибкими, как процессоры, но заказы на порядок быстрее для операций с массивами изображений. Пиксельное затенение часто используется для отображения рельефа , которое добавляет текстуру, чтобы объект выглядел блестящим, тусклым, грубым или даже круглым или выдавленным. [44]

С появлением серии Nvidia GeForce 8 и новых универсальных процессоров потоковой обработки графические процессоры стали более универсальными вычислительными устройствами. Сегодня параллельные графические процессоры начали вторгаться в вычислительную среду против ЦП, и область исследований, получившая название GPU Computing или GPGPU for General Purpose Computing on GPU , нашла свой путь в такие разнообразные области, как машинное обучение , [45] разведка нефти , научные исследования. обработка изображений , линейная алгебра , [46] статистика , [47] 3D-реконструкция и даже стандартные вариантыопределение цены. GPGPU в то время был предшественником того, что сейчас называется вычислительным шейдером (например, CUDA, OpenCL, DirectCompute), и фактически злоупотреблял оборудованием, обрабатывая данные, передаваемые в алгоритмы, как карты текстур и выполняя алгоритмы, рисуя треугольник или четырехугольник с соответствующим пиксельным шейдером. Это, очевидно, влечет за собой некоторые накладные расходы, поскольку такие модули, как Scan Converter , задействованы там, где они на самом деле не нужны (и манипуляции с треугольниками даже не вызывают беспокойства - кроме вызова пиксельного шейдера). С годами энергопотребление графических процессоров увеличилось, и для управления этим было предложено несколько методов. [48]

Платформа CUDA от Nvidia , впервые представленная в 2007 году [49], была самой ранней широко принятой моделью программирования для вычислений на GPU. Совсем недавно OpenCL получил широкую поддержку. OpenCL - это открытый стандарт, разработанный Khronos Group, который позволяет разрабатывать код как для графических процессоров, так и для процессоров с упором на переносимость. [50] Решения OpenCL поддерживаются Intel, AMD, Nvidia и ARM, и, согласно недавнему отчету Evan's Data, OpenCL является платформой разработки GPGPU, наиболее широко используемой разработчиками как в США, так и в Азиатско-Тихоокеанском регионе. [ необходима цитата ]

2010 по настоящее время [ править ]

В 2010 году Nvidia начала сотрудничество с Audi в области создания приборных панелей своих автомобилей. Эти графические процессоры Tegra питали приборную панель автомобилей, предлагая расширенную функциональность автомобильным навигационным и развлекательным системам. [51] Достижения в технологии GPU в автомобилях помогли продвинуть технологию самоуправления . [52] Карты AMD Radeon HD 6000 Series были выпущены в 2010 году, а в 2011 AMD выпустила свои дискретные графические процессоры серии 6000M для использования в мобильных устройствах. [53]Линия видеокарт Kepler от Nvidia вышла в 2012 году и использовалась в картах Nvidia серий 600 и 700. Особенность этой новой микроархитектуры графического процессора включает ускорение графического процессора - технологию, которая регулирует тактовую частоту видеокарты для увеличения или уменьшения ее в зависимости от потребляемой мощности. [54] Кеплер микроархитектуры был изготовлен на процессе 28 нм.

PS4 и Xbox One были выпущены в 2013 году, они оба графических процессоров используют на основе AMD, Radeon HD 7850 и 7790 . [55] За линейкой графических процессоров Nvidia Kepler последовала линейка Maxwell , производимая по тому же процессу. 28-нм чипы Nvidia были произведены TSMC, Тайваньской производственной компанией полупроводников, которая в то время производила 28-нм техпроцесс. По сравнению с прошлой 40-нм технологией этот новый производственный процесс позволил повысить производительность на 20 процентов при меньшем потреблении энергии. [56] [57] виртуальная реальность гарнитураимеют очень высокие системные требования. Производители гарнитур VR рекомендовали GTX 970 и R9 290X или лучше на момент их выпуска. [58] [59] Pascal - это следующее поколение потребительских видеокарт от Nvidia, выпущенное в 2016 году. Карты серии GeForce 10 относятся к этому поколению видеокарт. Они производятся с использованием техпроцесса 16 нм, который улучшает предыдущие микроархитектуры. [60] Nvidia выпустила одну непотребительскую карту с новой архитектурой Volta , Titan V. Отличия от Titan XP, высокопроизводительной карты Pascal, включают увеличение количества ядер CUDA, добавление тензорных ядер и HBM2. Тензорные ядра - это ядра, специально разработанные для глубокого обучения, а память с высокой пропускной способностью - это встроенная, многослойная память с более низкой тактовой частотой, которая предлагает чрезвычайно широкую шину памяти, которая полезна для предполагаемой цели Titan V. Чтобы подчеркнуть, что Titan V не является игровой картой, Nvidia удалила суффикс «GeForce GTX», добавляемый к потребительским игровым картам.

20 августа 2018 года Nvidia выпустила графические процессоры серии RTX 20, которые добавляют ядра трассировки лучей к графическим процессорам, улучшая их производительность при создании световых эффектов. [61] Графические процессоры Polaris 11 и Polaris 10 от AMD производятся по 14-нанометровому процессу. Их выпуск приводит к существенному увеличению производительности на ватт видеокарт AMD. [62] AMD также выпустила серию графических процессоров Vega для высокопроизводительного рынка в качестве конкурента высокопроизводительным картам Pascal от Nvidia, также с HBM2, например Titan V.

В 2019 году AMD выпустила преемника своей микроархитектуры / набора команд Graphics Core Next (GCN). Первой линейкой продуктов, получившей название RDNA, была серия видеокарт Radeon RX 5000 , выпущенная позднее 7 июля 2019 года. [63] Позже компания объявила, что преемником микроархитектуры RDNA станет серия видеокарт Radeon RX 5000. обновление. Новая микроархитектура, получившая название RDNA 2, как сообщается, должна была быть выпущена в четвертом квартале 2020 года. [64]

AMD представила серию Radeon RX 6000 , графические карты следующего поколения RDNA 2 с поддержкой аппаратно-ускоренной трассировки лучей на онлайн-мероприятии 28 октября 2020 года. [65] [66] Первоначально линейка состоит из RX 6800, RX. 6800 XT и RX 6900 XT. [67] [68] RX 6800 и 6800 XT были выпущены 18 ноября 2020 года, а RX 6900 XT - 8 декабря 2020 года. [69] Варианты RX 6700 и RX 6700 XT, основанные на Navi 22 ожидается, что запуск в первой половине 2021 года. [70] [71] [72]

PlayStation 5 и Xbox серия X и серия S были выпущены в 2020 году, они оба графических процессоров используют основанные на RDNA 2 микроархитектуры с фирменными настройками и различными конфигурациями GPU в реализации каждой системы. [73] [74] [75]

Компании GPU [ править ]

Многие компании производят графические процессоры под разными торговыми марками. В 2009 году Intel , Nvidia и AMD / ATI были лидерами рынка с долей рынка 49,4%, 27,8% и 20,6% соответственно. Однако эти числа включают интегрированные графические решения Intel в качестве графических процессоров. Не считая этого, Nvidia и AMD контролируют почти 100% рынка по состоянию на 2018 год. Их рыночные доли составляют 66% и 33%. [76] Кроме того, графические процессоры производят S3 Graphics [77] и Matrox [78] . Современные смартфоны также используют в основном графические процессоры Adreno от Qualcomm ,Графические процессоры PowerVR от Imagination Technologies и графические процессоры Mali от ARM .

Вычислительные функции [ править ]

Современные графические процессоры используют большинство своих транзисторов для вычислений, связанных с компьютерной 3D-графикой . В дополнение к 3D-оборудованию современные графические процессоры включают в себя базовое 2D-ускорение и возможности фреймбуфера (обычно с режимом совместимости VGA). Более новые карты, такие как AMD / ATI HD5000-HD7000, даже не имеют 2D-ускорения; это должно быть имитировано оборудованием 3D. Графические процессоры первоначально использовались для ускорения памяти интенсивной работы текстурирования и рендеринга полигонов, а затем добавления единицы для ускорения геометрических вычислений , таких как вращение и перевод из вершин в различные системы координат. Последние разработки в области графических процессоров включают поддержку программируемых шейдеров, которые могут манипулировать вершинами и текстурами, используя многие из тех же операций, которые поддерживаются процессорами , методы передискретизации и интерполяции для уменьшения наложения спектров и очень высокоточные цветовые пространства . Поскольку большинство этих вычислений включает в себя матричные и векторные операции, инженеры и ученые все чаще изучают использование графических процессоров для неграфических вычислений; они особенно подходят для решения других неприятно параллельных задач.

С появлением глубокого обучения важность графических процессоров возросла. В исследовании, проведенном Indigo, было обнаружено, что при обучении нейронных сетей с глубоким обучением графические процессоры могут быть в 250 раз быстрее, чем процессоры. Стремительный рост глубокого обучения в последние годы связывают с появлением графических процессоров общего назначения. [79] В этой области наблюдается определенная конкуренция с ASIC , в первую очередь с Tensor Processing Unit (TPU), созданным Google. Однако ASIC требуют изменений в существующем коде, а графические процессоры по-прежнему очень популярны.

Декодирование и кодирование видео с ускорением на GPU [ править ]

Графический процессор ATI HD5470 (см. Выше) оснащен UVD 2.1, который позволяет ему декодировать видеоформаты AVC и VC-1.

Большинство графических процессоров, выпущенных с 1995 года, поддерживают цветовое пространство YUV и аппаратные наложения , важные для воспроизведения цифрового видео , а многие графические процессоры, выпущенные с 2000 года, также поддерживают примитивы MPEG, такие как компенсация движения и iDCT . Этот процесс аппаратного ускорения декодирования видео, в котором участки декодирования видео процесса и видео пост-обработки разгружаются к аппаратным средствам GPU, обычно называют как «ГПУ ускоренного декодирования видео», «ГПУ помощи декодирования видео», «GPU аппаратного ускорения декодирование видео »или« декодирование видео с аппаратной поддержкой GPU ».

Более современные видеокарты даже декодируют видео высокой четкости на карте, разгружая центральный процессор. Наиболее распространенными API-интерфейсами для декодирования видео с ускорением на GPU являются DxVA для операционной системы Microsoft Windows и VDPAU , VAAPI , XvMC и XvBA для операционных систем на базе Linux и UNIX. Все, кроме XvMC, способны декодировать видео, закодированные с помощью MPEG-1 , MPEG-2 , MPEG-4 ASP (MPEG-4 Part 2) , MPEG-4 AVC (H.264 / DivX 6), VC-1 , WMV3 / WMV9. ,Xvid / OpenDivX (DivX 4) и DivX 5 кодеки , в то время как XvMC способен только декодирование MPEG-1 и MPEG-2.

Существует несколько специализированных аппаратных решений для декодирования и кодирования видео .

Процессы декодирования видео, которые можно ускорить [ править ]

Процессы декодирования видео, которые могут быть ускорены современным оборудованием GPU:

  • Компенсация движения (mocomp)
  • Обратное дискретное косинусное преобразование (iDCT)
    • Обратный телесин 3: 2 и 2: 2 понижающая коррекция
  • Обратное модифицированное дискретное косинусное преобразование (iMDCT)
  • Петлевой фильтр деблокирования
  • Внутрикадровое предсказание
  • Обратное квантование (IQ)
  • Декодирование переменной длины (VLD) , более известное как ускорение на уровне среза
  • Пространственно-временной деинтерлейсинг и автоматическое обнаружение источника чересстрочной / прогрессивной развертки
  • Обработка битового потока ( контекстно-адаптивное кодирование с переменной длиной кода / контекстно-адаптивное двоичное арифметическое кодирование ) и идеальное позиционирование пикселей.

Вышеупомянутые операции также имеют приложения для редактирования, кодирования и перекодирования видео.

Формы GPU [ править ]

Терминология [ править ]

В персональных компьютерах есть две основные формы графических процессоров. У каждого много синонимов: [80]

  • Выделенная видеокарта, также называемая дискретной .
  • Интегрированная графика - также называемые решениями с общей графикой , интегрированными графическими процессорами (IGP) или объединенной архитектурой памяти (UMA).

Использование конкретного графического процессора [ править ]

Большинство графических процессоров предназначены для определенного использования, трехмерной графики в реальном времени или других массовых вычислений:

  1. Игры
    • GeForce GTX, RTX
    • Nvidia Titan
    • Radeon HD, R5, R7, R9, RX, Vega и серии Navi
    • Radeon VII
  2. Облачные игры
    • Nvidia GRID
    • Radeon Sky
  3. Рабочая станция
    • Nvidia Quadro
    • AMD FirePro
    • AMD Radeon Pro
  4. Облачная рабочая станция
    • Nvidia Tesla
    • AMD FireStream
  5. Обучение искусственному интеллекту и облако
    • Nvidia Tesla
    • AMD Radeon Instinct
  6. Автоматизированный / беспилотный автомобиль
    • Nvidia Drive PX

Выделенные видеокарты [ править ]

Графические процессоры самого мощного класса обычно взаимодействуют с материнской платой посредством слота расширения, такого как PCI Express (PCIe) или Accelerated Graphics Port (AGP), и обычно могут быть относительно легко заменены или обновлены, если материнская плата способна поддерживать обновление. Некоторые видеокарты по- прежнему используют слоты для подключения периферийных компонентов (PCI), но их пропускная способность настолько ограничена, что они обычно используются только тогда, когда слот PCIe или AGP недоступен.

Выделенный графический процессор не обязательно является съемным и не обязательно стандартным образом взаимодействует с материнской платой. Термин «выделенный» относится к тому факту, что выделенные графические карты имеют оперативную память , предназначенную для использования карты, а не к тому факту, что большинство выделенных графических процессоров являются съемными. Кроме того, эта оперативная память обычно специально выбирается для ожидаемой последовательной нагрузки графической карты (см. GDDR ). Иногда системы с выделенными дискретными графическими процессорами назывались системами DIS [81].в отличие от систем "UMA" (см. следующий раздел). Выделенные графические процессоры для портативных компьютеров обычно подключаются через нестандартный и часто проприетарный слот из-за ограничений по размеру и весу. Такие порты могут по-прежнему считаться PCIe или AGP с точки зрения их логического интерфейса хоста, даже если они физически не взаимозаменяемы со своими аналогами.

Такие технологии, как SLI и NVLink от Nvidia и CrossFire от AMD, позволяют нескольким графическим процессорам одновременно рисовать изображения для одного экрана, увеличивая вычислительную мощность, доступную для графики. Однако эти технологии становятся все более редкими, поскольку в большинстве игр не полностью используются несколько графических процессоров, поскольку большинство пользователей не могут себе их позволить. [82] [83] [84] Несколько графических процессоров все еще используются на суперкомпьютерах (например, в Summit ), на рабочих станциях для ускорения видео (одновременная обработка нескольких видео) [85] [86] [87] [88] и 3D-рендеринга, [89] [90] [91] [92] [93] для VFX[94] [95] и для моделирования, [96] и в искусственном интеллекте для ускорения обучения, как в случае с линейкой рабочих станций и серверов DGX от Nvidia, графическими процессорами Tesla и грядущими графическими процессорами Intel Ponte Vecchio.

Интегрированный графический процессор [ править ]

Расположение встроенного графического процессора в компоновке системы северный / южный мост
ASRock материнских плат с интегрированной графикой, которая имеет HDMI, VGA и DVI выходы.

Интегрированный графический процессор (IGPU), интегрированная графика , общие графические решения , интегрированные графические процессоры (IGP) или архитектура унифицированной памяти (UMA) используют часть системной оперативной памяти компьютера, а не выделенную графическую память. IGP могут быть интегрированы в материнскую плату как часть набора микросхем (северного моста) [97] или на одном кристалле (интегральная схема) с процессором (например, AMD APU или Intel HD Graphics ). На некоторых материнских платах [98] IGP AMD могут использовать выделенный боковой порт [ требуется пояснение ]объем памяти. Это отдельный фиксированный блок высокопроизводительной памяти, предназначенный для использования графическим процессором. В начале 2007 года на компьютеры со встроенной графикой приходилось около 90% всех поставок ПК. [99] [ требуется обновление ] Они менее затратны в реализации, чем специализированная обработка графики, но, как правило, менее эффективны. Исторически сложилось так, что интегрированная обработка данных считалась непригодной для воспроизведения трехмерных игр или запуска графически интенсивных программ, но могла запускать менее интенсивные программы, такие как Adobe Flash. Примерами таких IGP могут быть предложения SiS и VIA около 2004 года. [100] Однако современные интегрированные графические процессоры, такие как AMD Accelerated Processing Unit и Intel HD Graphics. более чем способны обрабатывать 2D-графику или 3D-графику с низким уровнем нагрузки.

Поскольку вычисления с помощью графического процессора чрезвычайно интенсивны в памяти, интегрированная обработка может конкурировать с ЦП за относительно медленную системную оперативную память, поскольку она имеет минимальную выделенную видеопамять или не имеет ее. IGP может иметь до 29,856 ГБ / с пропускной способности памяти из системной RAM, тогда как графическая карта может иметь до 264 ГБ / с пропускной способности между своей RAM и ядром GPU. Эта полоса пропускания шины памяти может ограничивать производительность графического процессора, хотя многоканальная память может смягчить этот недостаток. [101] В старых наборах микросхем с интегрированной графикой отсутствовали аппаратные преобразования и освещение , но в более новых они есть. [102] [103]

Гибридная обработка графики [ править ]

Этот новый класс графических процессоров конкурирует со встроенной графикой на рынке недорогих настольных ПК и ноутбуков. Наиболее распространенные реализации этого - HyperMemory от ATI и TurboCache от Nvidia .

Гибридные видеокарты несколько дороже, чем встроенная графика, но намного дешевле, чем выделенные видеокарты. Они совместно используют память с системой и имеют небольшой выделенный кэш памяти, чтобы компенсировать высокую задержку системной RAM. Это возможно благодаря технологиям PCI Express. Хотя эти решения иногда рекламируются как имеющие до 768 МБ ОЗУ, это относится к тому, сколько можно использовать совместно с системной памятью.

Потоковая обработка и графические процессоры общего назначения (GPGPU) [ править ]

Все более распространенным становится использование графического процессора общего назначения (GPGPU) в качестве модифицированной формы потокового процессора (или векторного процессора ), на котором выполняются вычислительные ядра . Эта концепция превращает огромную вычислительную мощность конвейера шейдеров современного графического ускорителя в вычислительную мощность общего назначения, в отличие от того, чтобы быть жестко запрограммированной исключительно для выполнения графических операций. В некоторых приложениях, требующих массивных векторных операций, это может дать на несколько порядков более высокую производительность, чем у обычного ЦП. Два крупнейших разработчика дискретных графических процессоров (см. « Выделенные видеокарты » выше), AMD и Nvidia., начинают применять этот подход во множестве приложений. И Nvidia, и AMD объединились со Стэнфордским университетом для создания клиента на базе графического процессора для проекта распределенных вычислений Folding @ home для вычислений сворачивания белков. В определенных обстоятельствах графический процессор вычисляет в сорок раз быстрее, чем процессоры, традиционно используемые такими приложениями. [104] [105]

GPGPU можно использовать для многих типов неприятно параллельных задач, включая трассировку лучей . Как правило, они подходят для вычислений с высокой пропускной способностью, которые демонстрируют параллелизм данных, чтобы использовать архитектуру SIMD с широкой векторной шириной графического процессора.

Более того, высокопроизводительные компьютеры на базе графических процессоров начинают играть важную роль в крупномасштабном моделировании. Три из 10 самых мощных суперкомпьютеров в мире используют ускорение графического процессора. [106]

Графический процессор поддерживает расширения API для языка программирования C, такие как OpenCL и OpenMP . Кроме того, каждый поставщик графических процессоров представил свой собственный API, который работает только с их картами, AMD APP SDK и CUDA от AMD и Nvidia соответственно. Эти технологии позволяют использовать указанные функции, называемые вычислительными ядрами.из обычной программы C для запуска на потоковых процессорах графического процессора. Это позволяет программам на C использовать преимущества графического процессора для параллельной работы с большими буферами, при этом при необходимости используя ЦП. CUDA также является первым API, позволяющим приложениям на базе ЦП напрямую обращаться к ресурсам ГП для вычислений более общего назначения без ограничений использования графического API. [ необходима цитата ]

С 2005 года проявляется интерес к использованию производительности, предлагаемой графическими процессорами, для эволюционных вычислений в целом и для ускорения оценки пригодности в генетическом программировании в частности. Большинство подходов компилируют линейные или древовидные программы на главном ПК и передают исполняемый файл на графический процессор для запуска. Обычно преимущество в производительности достигается только при одновременном запуске одной активной программы на многих примерах задач параллельно с использованием архитектуры SIMD графического процессора . [107] [108] Однако существенное ускорение можно также получить, не компилируя программы, а вместо этого передавая их в графический процессор для интерпретации там.[109] [110] Ускорение может быть получено либо путем одновременной интерпретации нескольких программ, одновременного выполнения нескольких примеров задач или сочетания того и другого. Современный графический процессор может одновременно интерпретировать сотни тысяч очень маленьких программ.

Некоторые современные графические процессоры для рабочих станций, такие как карты для рабочих станций Nvidia Quadro, использующие архитектуры Volta и Turing, имеют выделенные вычислительные ядра для приложений глубокого обучения на основе тензорного анализа. В текущей серии графических процессоров Nvidia эти ядра называются тензорными ядрами. [111] Эти графические процессоры обычно имеют значительное увеличение производительности FLOPS, используя матричное умножение и деление 4x4, что приводит к производительности оборудования до 128 TFLOPS в некоторых приложениях. [112] Эти тензорные ядра также должны появиться в потребительских картах с архитектурой Тьюринга и, возможно, в серии потребительских карт Navi от AMD. [113]

Внешний графический процессор (eGPU) [ править ]

Внешний графический процессор - это графический процессор, расположенный за пределами корпуса компьютера, похожий на большой внешний жесткий диск. Внешние графические процессоры иногда используются с портативными компьютерами. Ноутбуки могут иметь значительный объем оперативной памяти и достаточно мощный центральный процессор (ЦП), но часто не имеют мощного графического процессора и вместо этого имеют менее мощный, но более энергоэффективный встроенный графический чип. Встроенные графические чипы часто недостаточно мощны для видеоигр или для других задач, требующих большого количества графики, таких как редактирование видео или 3D-анимация / рендеринг.

Поэтому желательно иметь возможность подключать графический процессор к какой-либо внешней шине ноутбука. PCI Express - единственная шина, используемая для этой цели. Порт может быть, например, портом ExpressCard или mPCIe (PCIe × 1, до 5 или 2,5 Гбит / с соответственно) или портом Thunderbolt 1, 2 или 3 (PCIe × 4, до 10, 20 или 40 Гбит / с соответственно). Эти порты доступны только на некоторых ноутбуках. [114] [115] Корпуса eGPU включают в себя собственный блок питания (PSU), поскольку мощные графические процессоры могут легко потреблять сотни ватт. [116]

Официальная поддержка поставщиков внешних графических процессоров в последнее время набирает обороты. Важной вехой стало решение Apple официально поддерживать внешние графические процессоры в MacOS High Sierra 10.13.4. [117]   Есть также несколько крупных поставщиков оборудования (HP, Alienware, Razer), выпускающих корпуса Thunderbolt 3 eGPU. [118] [119] [120] Эта поддержка продолжала стимулировать внедрение eGPU энтузиастами. [121]

Продажи [ править ]

В 2013 году по всему миру было поставлено 438,3 миллиона графических процессоров, а прогноз на 2014 год составлял 414,2 миллиона. [122]

См. Также [ править ]

  • Блок наложения текстуры (TMU)
  • Модуль вывода рендера (ROP)
  • Атака грубой силы
  • Компьютерное железо
  • Компьютерный монитор
  • Кэш графического процессора
  • Виртуализация графического процессора
  • Многоядерный процессор
  • Блок обработки физики (ППУ)
  • Блок тензорной обработки (ТПУ)
  • Оборудование для трассировки лучей
  • Программный рендеринг
  • Блок обработки зрения (VPU)
  • Векторный процессор
  • Видеокарта
  • Контроллер видеодисплея
  • Игровая приставка
  • AI-ускоритель

Оборудование [ править ]

  • Сравнение графических процессоров AMD
  • Сравнение графических процессоров Nvidia
  • Сравнение графических процессоров Intel
  • Intel GMA
  • Ларраби
  • Nvidia PureVideo - технология потока битов от Nvidia, используемая в их графических чипах для ускорения декодирования видео на аппаратном GPU с DXVA.
  • SoC
  • UVD (Unified Video Decoder) - технология битового потока декодирования видео от ATI для поддержки аппаратного (GPU) декодирования с помощью DXVA.

API [ править ]

  • OpenGL API
  • API DirectX Video Acceleration (DxVA) для операционной системы Microsoft Windows .
  • Мантия (API)
  • Вулкан (API)
  • Video Acceleration API (VA API)
  • VDPAU (API декодирования и представления видео для Unix)
  • X-Video Bitstream Acceleration (XvBA) , эквивалент X11 DXVA для MPEG-2, H.264 и VC-1
  • Компенсация движения X-Video - эквивалент X11 только для видеокодека MPEG-2

Приложения [ править ]

  • Кластер GPU
  • Mathematica - включает встроенную поддержку выполнения CUDA и OpenCL GPU
  • Молекулярное моделирование на графическом процессоре
  • Deeplearning4j - распределенное глубокое обучение с открытым исходным кодом для Java

Ссылки [ править ]

  1. ^ Денни Аткин. «Покупатель компьютеров: правильный графический процессор для вас» . Архивировано из оригинала на 2007-05-06 . Проверено 15 мая 2007 .
  2. ^ Barron, ET; Глориозо, РМ (сентябрь 1973 г.). «Микроуправляемый периферийный процессор» . MICRO 6: Протокол 6-го ежегодного семинара по микропрограммированию : 122–128. DOI : 10.1145 / 800203.806247 . S2CID 36942876 . 
  3. ^ Левин, Кен (август 1978). «Основной стандартный графический пакет для VGI 3400» . ACM SIGGRAPH Компьютерная графика . 12 (3): 298–300. DOI : 10.1145 / 965139.807405 .
  4. ^ a b «Пришло время переименовать GPU? | Компьютерное общество IEEE» .
  5. ^ «NVIDIA запускает первый в мире графический процессор: GeForce 256» . Nvidia. 31 августа 1999 года. Архивировано 12 апреля 2016 года . Проверено 28 марта 2016 .
  6. ^ «Графический процессор (GPU)» . Nvidia. 16 декабря 2009 года архивации с оригинала на 8 апреля 2016 года . Проверено 29 марта 2016 года .
  7. Пабст, Томас (18 июля 2002 г.). «ATi берет на себя лидерство в области 3D-технологий с Radeon 9700» . Оборудование Тома . Проверено 29 марта 2016 года .
  8. Гаага, Джеймс (10 сентября 2013 г.). «Почему существуют специальные игровые приставки?» . Программирование в 21 веке . Архивировано из оригинала на 4 мая 2015 года . Проверено 11 ноября 2015 года .
  9. ^ "mame / 8080bw.c на master mamedev / mame 路 GitHub" . GitHub . Архивировано из оригинала на 2014-11-21.
  10. ^ "mame / mw8080bw.c в главном 路 mamedev / mame 路 GitHub" . GitHub . Архивировано из оригинала на 2014-11-21.
  11. ^ "Аркады / SpaceInvaders - Компьютерная археология" . computerarcheology.com . Архивировано из оригинала на 2014-09-13.
  12. ^ "mame / galaxian.c на master 路 mamedev / mame 路 GitHub" . GitHub . Архивировано из оригинала на 2014-11-21.
  13. ^ "mame / galaxian.c на master 路 mamedev / mame 路 GitHub" . GitHub . Архивировано из оригинала на 2014-11-21.
  14. ^ "MAME - src / mame / drivers / galdrvr.c" . archive.org . Архивировано из оригинального 3 -го января 2014 года.
  15. ^ Спрингманн, Алессондра. «Разборка Atari 2600: что внутри вашей старой консоли?» . Вашингтон Пост . Архивировано 14 июля 2015 года . Проверено 14 июля 2015 года .
  16. ^ "Что такое чипы 6502, ANTIC, CTIA / GTIA, POKEY и FREDDIE?" . Atari8.com . Архивировано из оригинала на 2016-03-05.
  17. ^ Wiegers, Карл Ефимович (апрель 1984). «Прерывания списка отображения Atari» . Вычислить! (47): 161. Архивировано 4 марта 2016 года.
  18. ^ Wiegers, Карл Ефимович (декабрь 1985). «Тонкая прокрутка Atari» . Вычислить! (67): 110. Архивировано 16 февраля 2006 г.
  19. ^ Ф. Роберт А. Хопгуд; Роджер Дж. Хаббольд; Дэвид А. Дуче, ред. (1986). Достижения в компьютерной графике II . Springer. п. 169. ISBN. 9783540169109. Возможно, самый известный из них - NEC 7220.
  20. ^ Известные графические чипы: Контроллер графического дисплея NEC µPD7220 ( IEEE Computer Society )
  21. ^ Загадка, Шон. «Блиттерная информация» . Архивировано 22 декабря 2015 года.
  22. ^ Вольф, Марк JP (июнь 2012 г.). Перед аварией: ранняя история видеоигр . Издательство Государственного университета Уэйна. п. 185. ISBN 978-0814337226.
  23. ^ История графического процессора: Hitachi ARTC HD63484. Второй графический процессор. ( IEEE Computer Society )
  24. ^ "Известные графические чипы: TI TMS34010 и VRAM. Первый чип программируемого графического процессора | Компьютерное общество IEEE" .
  25. ^ "Архивная копия" . Архивировано 3 сентября 2014 года . Проверено 12 сентября 2014 .CS1 maint: archived copy as title (link)
  26. ^ "музей ~ Sharp X68000" . Old-computers.com. Архивировано из оригинала на 2015-02-19 . Проверено 28 января 2015 .
  27. Hardcore Gaming 101: Retro Japanese Computers: Final Frontier игр » . hardcoregaming101.net . Архивировано 13 января 2011 года.
  28. ^ «Система 16 - оборудование Namco System 21 (Namco)» . system16.com . Архивировано 18 мая 2015 года.
  29. ^ "Система 16 - Оборудование воздушной системы Taito (Taito)" . system16.com . Архивировано 16 марта 2015 года.
  30. ^ Браунштейн, Марк (14 ноября 1988). "NEC формирует группу видеостандартов" . InfoWorld . 10 (46). п. 3. ISSN 0199-6649 . Проверено 27 мая 2016 года . 
  31. ^ "Видеоплаты S3" . InfoWorld . 14 (20): 62. 18 мая 1992 года архивация от оригинала 22 ноября 2017 года . Проверено 13 июля 2015 года .
  32. ^ "Что означают цифры" . Журнал ПК . 12 : 128. 23 февраля 1993 года. Архивировано 11 апреля 2017 года . Проверено 29 марта 2016 года .
  33. ^ Певец, Грэм. «История современного графического процессора» . Техспот. Архивировано 29 марта 2016 года . Проверено 29 марта 2016 года .
  34. ^ «Система 16 - Namco Magic Edge Hornet Simulator Hardware (Namco)» . system16.com . Архивировано 12 сентября 2014 года.
  35. ^ "MAME - src/mame/video/model2.c". archive.org. Archived from the original on 4 January 2013.
  36. ^ "System 16 - Sega Model 2 Hardware (Sega)". system16.com. Archived from the original on 2010-12-21.
  37. ^ "Archived copy" (PDF). Archived (PDF) from the original on 2016-10-11. Retrieved 2016-08-08.CS1 maint: archived copy as title (link)
  38. ^ "Archived copy" (PDF). Archived from the original (PDF) on 2014-09-06. Retrieved 2016-08-08.CS1 maint: archived copy as title (link)
  39. ^ "Fujitsu Develops World's First Three Dimensional Geometry Processor". fujitsu.com. Archived from the original on 2014-09-12.
  40. ^ xenol. "The Nintendo 64 is one of the greatest gaming devices of all time". xenol. Archived from the original on 2015-11-18.
  41. ^ "Mitsubishi's 3DPro/2mp Chipset Sets New Records for Fastest 3D Graphics Accelerator for Windows NT Systems; 3DPro/2mp grabs Viewperf performance lead; other high-end benchmark tests clearly show that 3DPro's performance outdistances all Windows NT competitors".
  42. ^ Vlask. "VGA Legacy MKIII - Diamond Fire GL 4000 (Mitsubishi 3DPro/2mp)". Archived from the original on 2015-11-18.
  43. ^ 3dfx Glide API
  44. ^ Søren Dreijer. "Bump Mapping Using CG (3rd Edition)". Archived from the original on 2010-01-18. Retrieved 2007-05-30.
  45. ^ Raina, Rajat; Madhavan, Anand; Ng, Andrew Y. (2009-06-14). "Large-scale deep unsupervised learning using graphics processors". Proceedings of the 26th Annual International Conference on Machine Learning - ICML '09. Dl.acm.org. pp. 1–8. doi:10.1145/1553374.1553486. ISBN 9781605585161. S2CID 392458.
  46. ^ "Linear algebra operators for GPU implementation of numerical algorithms", Kruger and Westermann, International Conf. on Computer Graphics and Interactive Techniques, 2005
  47. ^ "ABC-SysBio—approximate Bayesian computation in Python with GPU support", Liepe et al., Bioinformatics, (2010), 26:1797-1799 "Archived copy". Archived from the original on 2015-11-05. Retrieved 2010-10-15.CS1 maint: archived copy as title (link)
  48. ^ "A Survey of Methods for Analyzing and Improving GPU Energy Efficiency Archived 2015-09-04 at the Wayback Machine", Mittal et al., ACM Computing Surveys, 2014.
  49. ^ Sanders, Jason; Kandrot, Edward (2010-07-19). CUDA by Example: An Introduction to General-Purpose GPU Programming, Portable Documents. Addison-Wesley Professional. ISBN 9780132180139. Archived from the original on 2017-04-12.
  50. ^ "OpenCL - The open standard for parallel programming of heterogeneous systems". khronos.org. Archived from the original on 2011-08-09.
  51. ^ Teglet, Traian. "NVIDIA Tegra Inside Every Audi 2010 Vehicle". Archived from the original on 2016-10-04. Retrieved 2016-08-03.
  52. ^ "School's in session — Nvidia's driverless system learns by watching". 2016-04-30. Archived from the original on 2016-05-01. Retrieved 2016-08-03.
  53. ^ "AMD Radeon HD 6000M series--don't call it ATI!". CNET. Archived from the original on 2016-10-11. Retrieved 2016-08-03.
  54. ^ "Nvidia GeForce GTX 680 2GB Review". Archived from the original on 2016-09-11. Retrieved 2016-08-03.
  55. ^ "Xbox One vs. PlayStation 4: Which game console is best? - ExtremeTech". www.extremetech.com. Retrieved 2019-05-13.
  56. ^ "Kepler TM GK110" (PDF). NVIDIA Corporation. 2012. Archived (PDF) from the original on October 11, 2016. Retrieved August 3, 2016.
  57. ^ "Taiwan Semiconductor Manufacturing Company Limited". www.tsmc.com. Archived from the original on 2016-08-10. Retrieved 2016-08-03.
  58. ^ "Building a PC for the HTC Vive". 2016-06-16. Archived from the original on 2016-07-29. Retrieved 2016-08-03.
  59. ^ "Vive | Vive Optimized PCs". www.htcvive.com. Archived from the original on 2016-02-24. Retrieved 2016-08-03.
  60. ^ "Nvidia's monstrous Pascal GPU is packed with cutting-edge tech and 15 billion transistors". 5 April 2016. Archived from the original on 2016-07-31. Retrieved 2016-08-03.
  61. ^ Sarkar, Samit (20 August 2018). "Nvidia RTX 2070, RTX 2080, RTX 2080 Ti GPUs revealed: specs, price, release date". Polygon. Retrieved 11 September 2019.
  62. ^ "AMD RX 480, 470 & 460 Polaris GPUs To Deliver The "Most Revolutionary Jump In Performance" Yet". 2016-01-16. Archived from the original on 2016-08-01. Retrieved 2016-08-03.
  63. ^ AMD press release: "AMD Announces Next-Generation Leadership Products at Computex 2019 Keynote". AMD.com. Retrieved October 5th, 2019
  64. ^ "AMD to Introduce New Next-Gen RDNA GPUs in 2020, Not a Typical 'Refresh' of Navi". tomshardware.com. Tom's Hardware. 2020-01-29. Retrieved 2020-02-08.
  65. ^ Garreffa, Anthony (September 9, 2020). "AMD to reveal next-gen Big Navi RDNA 2 graphics cards on October 28". TweakTown. Retrieved September 9, 2020.
  66. ^ Lyles, Taylor (September 9, 2020). "AMD's next-generation Zen 3 CPUs and Radeon RX 6000 'Big Navi' GPU will be revealed next month". The Verge. Retrieved September 10, 2020.
  67. ^ "AMD Teases Radeon RX 6000 Card Performance Numbers: Aiming For 3080?". anandtech.com. AnandTech. 2020-10-08. Retrieved 2020-10-25.
  68. ^ "AMD Announces Ryzen "Zen 3" and Radeon "RDNA2" Presentations for October: A New Journey Begins". anandtech.com. AnandTech. 2020-09-09. Retrieved 2020-10-25.
  69. ^ Judd, Will (October 28, 2020). "AMD unveils three Radeon 6000 graphics cards with ray tracing and RTX-beating performance". Eurogamer. Retrieved October 28, 2020.
  70. ^ Mujtaba, Hassan (2020-11-30). "AMD Radeon RX 6700 XT 'Navi 22 GPU' Custom Models Reportedly Boost Up To 2.95 GHz". Wccftech. Retrieved 2020-12-03.
  71. ^ Tyson, Mark (December 3, 2020). "AMD CEO keynote scheduled for CES 2020 on 12th January". HEXUS. Retrieved 2020-12-03.
  72. ^ Cutress, Ian (January 12, 2021). "AMD to Launch Mid-Range RDNA 2 Desktop Graphics in First Half 2021". AnandTech. Retrieved January 4, 2021.
  73. ^ Funk, Ben (December 12, 2020). "Sony PS5 Gets A Full Teardown Detailing Its RDNA 2 Guts And Glory". Hot Hardware. Retrieved January 3, 2021.
  74. ^ Gartenberg, Chaim (March 18, 2020). "Sony reveals full PS5 hardware specifications". The Verge. Retrieved January 3, 2021.
  75. ^ Smith, Ryan. "Microsoft Drops More Xbox Series X Tech Specs: Zen 2 + RDNA 2, 12 TFLOPs GPU, HDMI 2.1, & a Custom SSD". www.anandtech.com. Retrieved 2020-03-19.
  76. ^ February 2018, Paul Alcorn 28. "AMD Rising: CPU And GPU Market Share Growing Rapidly". Tom's Hardware.
  77. ^ "Products". S3 Graphics. Archived from the original on 2014-01-11. Retrieved 2014-01-21.
  78. ^ "Matrox Graphics - Products - Graphics Cards". Matrox.com. Archived from the original on 2014-02-05. Retrieved 2014-01-21.
  79. ^ "A Survey of Techniques for Optimizing Deep Learning on GPUs", Mittal et al., J. of Systems Architecture, 2019
  80. ^ "Help Me Choose: Video Cards". Dell. Archived from the original on 2016-09-09. Retrieved 2016-09-17.
  81. ^ Documentation on a Linux device driver for Nvidia Optimus
  82. ^ https://www.fudzilla.com/news/graphics/38134-crossfire-and-sli-market-is-just-300-000-units
  83. ^ "Is Multi-GPU Dead?". 7 January 2018.
  84. ^ "Nvidia SLI and AMD CrossFire is dead – but should we mourn multi-GPU gaming? | TechRadar".
  85. ^ "NVIDIA FFmpeg Transcoding Guide". 24 July 2019.
  86. ^ https://documents.blackmagicdesign.com/ConfigGuides/DaVinci_Resolve_15_Mac_Configuration_Guide.pdf
  87. ^ "Recommended System: Recommended Systems for DaVinci Resolve". Puget Systems.
  88. ^ "GPU Accelerated Rendering and Hardware Encoding".
  89. ^ "V-Ray Next Multi-GPU Performance Scaling".
  90. ^ "FAQ | GPU-accelerated 3D rendering software | Redshift".
  91. ^ "OctaneRender 2020™ Preview is here!".
  92. ^ "Exploring Performance with Autodesk's Arnold Renderer GPU Beta". 8 April 2019.
  93. ^ "GPU Rendering — Blender Manual".
  94. ^ "V-Ray for Nuke – Ray Traced Rendering for Compositors | Chaos Group".
  95. ^ "System Requirements | Nuke | Foundry".
  96. ^ "What about multi-GPU support? – Folding@home".
  97. ^ https://www.tomshardware.com/amp/picturestory/693-intel-graphics-evolution.html
  98. ^ "GA-890GPA-UD3H overview". Archived from the original on 2015-04-15. Retrieved 2015-04-15.
  99. ^ Gary Key. "AnandTech - µATX Part 2: Intel G33 Performance Review". anandtech.com. Archived from the original on 2008-05-31.
  100. ^ Tim Tscheblockov. "Xbit Labs: Roundup of 7 Contemporary Integrated Graphics Chipsets for Socket 478 and Socket A Platforms". Archived from the original on 2007-05-26. Retrieved 2007-06-03.
  101. ^ Coelho, Rafael (18 January 2016). "Does dual-channel memory make difference on integrated video performance?". Hardware Secrets. Retrieved 4 January 2019.
  102. ^ Bradley Sanford. "Integrated Graphics Solutions for Graphics-Intensive Applications" (PDF). Archived (PDF) from the original on 2007-11-28. Retrieved 2007-09-02.
  103. ^ Bradley Sanford. "Integrated Graphics Solutions for Graphics-Intensive Applications". Archived from the original on 2012-01-07. Retrieved 2007-09-02.
  104. ^ Darren Murph. "Stanford University tailors Folding@home to GPUs". Archived from the original on 2007-10-12. Retrieved 2007-10-04.
  105. ^ Mike Houston. "Folding@Home - GPGPU". Archived from the original on 2007-10-27. Retrieved 2007-10-04.
  106. ^ "Top500 List - June 2012 | TOP500 Supercomputer Sites". Top500.org. Archived from the original on 2014-01-13. Retrieved 2014-01-21.
  107. ^ John Nickolls. "Stanford Lecture: Scalable Parallel Programming with CUDA on Manycore GPUs". Archived from the original on 2016-10-11.
  108. ^ S Harding and W Banzhaf. "Fast genetic programming on GPUs". Archived from the original on 2008-06-09. Retrieved 2008-05-01.
  109. ^ W Langdon and W Banzhaf. "A SIMD interpreter for Genetic Programming on GPU Graphics Cards". Archived from the original on 2008-06-09. Retrieved 2008-05-01.
  110. ^ V. Garcia and E. Debreuve and M. Barlaud. Fast k nearest neighbor search using GPU. In Proceedings of the CVPR Workshop on Computer Vision on GPU, Anchorage, Alaska, USA, June 2008.
  111. ^ "Tensor Cores in NVIDIA Volta". Nvidia. Nvidia. Retrieved 16 August 2018.
  112. ^ Smith, Ryan. "NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced". AnandTech. AnandTech. Retrieved 16 August 2018.
  113. ^ Hill, Brandon (11 August 2017). "AMD's Navi 7nm GPU Architecture to Reportedly Feature Dedicated AI Circuitry". HotHardware. HotHardware. Archived from the original on 17 August 2018. Retrieved 16 August 2018.
  114. ^ "eGPU candidate system list". Tech-Inferno Forums.
  115. ^ Neil Mohr. "How to make an external laptop graphics adaptor". TechRadar. Archived from the original on 2017-06-26.
  116. ^ "Best External Graphics Card 2020 (EGPU) [The Complete Guide]". 16 March 2020.
  117. ^ "Use an external graphics processor with your Mac". Apple Support. Retrieved 2018-12-11.
  118. ^ "OMEN Accelerator | HP® Official Site". www8.hp.com. Retrieved 2018-12-11.
  119. ^ "Alienware Graphics Amplifier | Dell United States". Dell. Retrieved 2018-12-11.
  120. ^ "Razer Core X - Thunderbolt™ 3 eGPU". Razer. Retrieved 2018-12-11.
  121. ^ Box, ► Suggestions (2016-11-25). "Build Guides by users". eGPU.io. Retrieved 2018-12-11.
  122. ^ "Graphics chips market is showing some life". TG Daily. August 20, 2014. Archived from the original on August 26, 2014. Retrieved August 22, 2014.

External links[edit]

  • NVIDIA - What is GPU computing?
  • The GPU Gems book series
  • - a Graphics Hardware History
  • [1]
  • How GPUs work
  • GPU Caps Viewer - Video card information utility
  • OpenGPU-GPU Architecture(In Chinese)
  • ARM Mali GPUs Overview
  • GPU Rendering Magazine
  • GPU Hierarchy List