Гетерогенная системная архитектура

Гетерогенная системная архитектура ( HSA ) - это набор спецификаций от разных производителей, который позволяет интегрировать центральные процессоры и графические процессоры на одной шине с общей памятью и задачами . ^[1] HSA разрабатывается фондом HSA Foundation , который включает (среди многих других) AMD и ARM . Заявленная цель платформы - уменьшить задержку связи между процессорами, графическими процессорами и другими вычислительными устройствами и сделать эти различные устройства более совместимыми с точки зрения программиста ^[2]^{: 3}^[3] освобождает программиста от задачи планирования перемещения данных между непересекающимися ячейками памяти устройств (что в настоящее время должно быть сделано с OpenCL или CUDA ). ^[4]

CUDA и OpenCL, а также большинство других довольно продвинутых языков программирования могут использовать HSA для повышения производительности выполнения. ^[5] Гетерогенные вычисления широко используются в устройствах типа система на кристалле, таких как планшеты , смартфоны , другие мобильные устройства и игровые приставки . ^[6] HSA позволяет программам использовать графический процессор для вычислений с плавающей запятой без отдельной памяти или планирования. ^[7]

Обоснование [ править ]

Обоснование HSA состоит в том, чтобы облегчить нагрузку на программистов при переносе вычислений на GPU. Первоначально разработанная исключительно AMD и называвшаяся FSA, идея была расширена и теперь включает в себя не только графические процессоры, но и другие процессоры, такие как DSP других производителей .

Действия, выполняемые при выгрузке вычислений на графический процессор в системе без HSA
Действия, выполняемые при выгрузке вычислений на графический процессор в системе HSA с использованием функциональности HSA

Современные графические процессоры очень хорошо подходят для выполнения одной инструкции, нескольких данных (SIMD) и одной инструкции, нескольких потоков (SIMT), в то время как современные процессоры все еще оптимизируются для ветвления. и Т. Д.

Обзор [ править ]

Этот раздел требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален. ( Май 2014 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Первоначально представленный встроенными системами, такими как Cell Broadband Engine , совместное использование системной памяти напрямую между несколькими участниками системы делает гетерогенные вычисления более распространенными. Сами по себе гетерогенные вычисления относятся к системам, которые содержат несколько блоков обработки - центральные процессоры (ЦП), блоки обработки графики (ГП), процессоры цифровых сигналов (ЦСП) или любые типы интегральных схем (ASIC) для конкретных приложений . Архитектура системы позволяет любому ускорителю, например графическому процессору , работать на том же уровне обработки, что и центральный процессор системы.

Среди своих основных функций HSA определяет единое виртуальное адресное пространство для вычислительных устройств: там, где графические процессоры традиционно имеют свою собственную память, отдельную от основной (ЦП) памяти, HSA требует, чтобы эти устройства совместно использовали таблицы страниц, чтобы устройства могли обмениваться данными путем совместного использования указателей. . Это должно поддерживаться пользовательскими модулями управления памятью . ^[2]^{: 6–7} Для обеспечения возможности взаимодействия, а также для облегчения различных аспектов программирования, HSA предназначен для ISA- диагностики как для процессоров, так и для ускорителей, а также для поддержки языков программирования высокого уровня.

Пока что спецификации HSA охватывают:

Промежуточный уровень HSA [ править ]

HSA Intermediate Layer (HSAIL), виртуальный набор инструкций для параллельных программ.

аналогичные ^{[ согласно кому? ]} в промежуточное представление LLVM и SPIR (используется OpenCL и Vulkan )
завершено до определенного набора инструкций JIT-компилятором
поздно принимать решения, на каком ядре (ах) следует запустить задачу
явно параллельный
поддерживает исключения, виртуальные функции и другие высокоуровневые функции
поддержка отладки

Модель памяти HSA [ править ]

совместим с моделями памяти C ++ 11 , OpenCL, Java и .NET
расслабленная последовательность
разработан для поддержки как управляемых языков (например, Java), так и неуправляемых языков (например, C )
значительно упростит разработку сторонних компиляторов для широкого спектра разнородных продуктов, запрограммированных на Fortran , C ++, C ++ AMP , Java и др.

Диспетчер HSA и среда выполнения [ править ]

предназначен для обеспечения гетерогенной организации очереди задач: рабочая очередь на ядро, распределение работы по очередям, балансировка нагрузки путем кражи работы
любое ядро может планировать работу для любого другого, включая себя
значительное сокращение накладных расходов на планирование работы ядра

Мобильные устройства являются одной из областей применения HSA, в которой он обеспечивает повышенную энергоэффективность. ^[6]

Блок-схемы [ править ]

На рисунках ниже сравнивается координация CPU-GPU в HSA и в традиционных архитектурах.

Стандартная архитектура с дискретным графическим процессором, подключенным к шине PCI Express . Нулевое копирование между графическим процессором и процессором невозможно из-за разной физической памяти.
HSA обеспечивает единую виртуальную память и упрощает передачу указателей через PCI Express вместо копирования всех данных.
В разделенной основной памяти одна часть системной памяти выделяется исключительно графическому процессору. В результате операция нулевого копирования невозможна.
Единая основная память, в которой GPU и CPU поддерживают HSA. Это делает возможной операцию нулевого копирования. ^[8]
MMU CPU и IOMMU графического процессора должны соответствовать техническим характеристикам оборудования HSA.

Поддержка программного обеспечения[ редактировать ]

Графические процессоры AMD содержат определенные дополнительные функциональные блоки, предназначенные для использования в рамках HSA. В Linux драйвер ядра amdkfd обеспечивает необходимую поддержку. ^[9]^[10]

Некоторые из специфичных для HSA функций, реализованных в оборудовании, должны поддерживаться ядром операционной системы и конкретными драйверами устройств. Например, поддержка видеокарт AMD Radeon и AMD FirePro , а также APU на базе Graphics Core Next (GCN) была объединена с версией 3.19 основной линии ядра Linux , выпущенной 8 февраля 2015 года. ^[10] Программы не взаимодействуют напрямую с amdkfd , но ставят свои задания в очередь, используя среду выполнения HSA. ^[11] Эта самая первая реализация, известная как amdkfd , ориентирована на "Kaveri" или "Berlin" APU и работает вместе с существующим графическим драйвером ядра Radeon.

Кроме того, amdkfd поддерживает гетерогенную организацию очередей (HQ), которая направлена на упрощение распределения вычислительных заданий между несколькими процессорами и графическими процессорами с точки зрения программиста. Поддержка управления гетерогенной памятью ( HMM ), подходящая только для графического оборудования с версией 2 IOMMU AMD , была принята в основную версию ядра Linux 4.14. ^[12]

Интегрированная поддержка платформ HSA была объявлена для «Sumatra» выпуска OpenJDK , который должен выйти в 2015 году ^[13].

AMD APP SDK - это проприетарный комплект разработки программного обеспечения AMD, предназначенный для параллельных вычислений, доступный для Microsoft Windows и Linux. Bolt - это библиотека шаблонов C ++, оптимизированная для гетерогенных вычислений. ^[14]

GPUOpen включает в себя несколько других программных инструментов, связанных с HSA. CodeXL версии 2.0 включает профилировщик HSA. ^[15]

Поддержка оборудования [ править ]

AMD [ править ]

По состоянию на февраль 2015 года ^{[Обновить]}, только AMD, «Кавери» A-серию APUs (ср «Кавери» настольные процессоры и «Кавери» мобильные процессоры ) и от Sony PlayStation 4 позволила интегрированному GPU к памяти доступа через версию 2 IOMMU в AMD. Ранние APU (Trinity и Richland) включали функциональность IOMMU версии 2, но только для использования внешним графическим процессором, подключенным через PCI Express. ^{[ необходима цитата ]}

APU Carrizo и Bristol Ridge после 2015 года также включают функциональность IOMMU версии 2 для встроенного графического процессора. ^{[ необходима цитата ]}

В следующей таблице представлены черты AMD «s APUs (смотри также: Список AMD Accelerated Processing единиц ).

Кодовое название	Сервер	Базовый						Торонто
	Сервер	Микро														Киото
	Рабочий стол	Спектакль										Ренуар
		Основной поток	Llano	Троица	Richland	Кавери	Kaveri Refresh (Годавари)	Карризо	Бристольский хребет	Рэйвен Ридж	Пикассо	Ренуар
		Вход	Llano	Троица	Richland	Кавери	Kaveri Refresh (Годавари)	Карризо	Бристольский хребет	Рэйвен Ридж	Пикассо
		Базовый														Кабини
	Мобильный	Спектакль										Ренуар	Сезанн
		Основной поток	Llano	Троица	Richland	Кавери		Карризо	Бристольский хребет	Рэйвен Ридж	Пикассо	Ренуар	Сезанн
		Вход	Llano	Троица	Richland	Кавери		Карризо	Бристольский хребет	Рэйвен Ридж										Дали
		Базовый													Десна, Онтарио, Сакате	Кабини, Темаш	Бима, Маллинз	Карризо-Л	Stoney Ridge	Дали
	Встроенный			Троица		Белоголовый орлан		Мерлин Сокол , Бурый Сокол		Большая Рогатая Сова		Серый ястреб			Онтарио, Закате	Кабини	Степной орел , Венценосный орел , LX-Family		Калифорнийский сокол	Полосатая пустельга
Платформа			Высокая, стандартная и низкая мощность												Низкая и сверхнизкая мощность
Вышел			Август 2011 г.	Октябрь 2012 г.	Июн 2013	Январь 2014 г.	2015 г.	Июн 2015	Июн 2016	Октябрь 2017	Янв 2019	Март 2020 г.	Янв.2021 г.		Январь 2011 г.	Май 2013	Апрель 2014 г.	Май 2015 г.	Февраль 2016 г.	Апрель 2019
Микроархитектура процессора			K10	Копер		Каток		Экскаватор	« Экскаватор + » ^[16]	Дзен	Дзен +	Дзен 2	Дзен 3		Рысь	Ягуар	Пума	Пума + ^[17]	« Экскаватор + »	Дзен
ЭТО			x86-64												x86-64
Разъем	Рабочий стол	Высокого класса	Нет данных
		Основной поток	Нет данных				FM2 + ^[а]		AM4
		Вход	FM1	FM2		FM2 + ^[b]	FM2 + ^[а]		AM4							AM1
		Базовый	Нет данных												Нет данных
	Другой		FS1	FS1 + , FP2		FP3		FP4		FP5		FP6			FT1	FT3	FT3b		FP4	FP5
Версия PCI Express			2.0			3.0						4.0			2.0				3.0
Fab. ( нм )			Г. Ф. 32SHP ( HKMG КНИ )			ГФ 28ШП ( HKMG навалом)				GF 14LPP ( FinFET оптом)	GF 12LP (FinFET оптом)	TSMC N7 (FinFET оптом)			TSMC N40 (навалом)	TSMC N28 (HKMG навалом)	ГФ 28ШП ( HKMG навалом)			GF 14LPP ( FinFET оптом)
Площадь штампа (мм ² )			228	246		245		245	250	210 ^[18]		156	?		75 (+ 28 FCH )	107		?	125	149
Мин. TDP (Вт)			35 год	17				12				10			4.5	4	3,95	10	6
Макс APU TDP (W)			100			95		65							18	25
Максимальная базовая частота APU (ГГц)			3	3.8	4.1	4.1		3,7	3.8	3,6	3,7	3.8	?		1,75	2.2	2	2.2	3.2	3.3
Максимальное количество APU на узел ^[c]			1												1
Максимальное количество ядер ЦП ^[d] на APU			4									8			2	4			2
Максимальное количество потоков на ядро ЦП			1							2					1					2
Целочисленная структура			3 + 3	2 + 2						4 + 2		4 + 2 + 1	?		1 + 1 + 1 + 1				2 + 2	4 + 2
i386, i486, i586, CMOV, NOPL, i686, PAE , бит NX , CMPXCHG16B, AMD-V , RVI , ABM и 64-битный LAHF / SAHF
IOMMU ^[e]			Нет данных
BMI1 , AES-NI , CLMUL и F16C			Нет данных											Нет данных
MOVBE			Нет данных											Нет данных
AVIC , BMI2 и RDRAND			Нет данных												Нет данных
ADX , SHA , RDSEED , SMAP , SMEP , XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT и CLZERO			Нет данных										Нет данных
WBNOINVD, CLWB, RDPID, RDPRU и MCOMMIT			Нет данных										Нет данных					Нет данных
FPU на ядро			1	0,5						1				1				0,5	1
Трубы на FPU			2											2
Ширина трубы FPU			128 бит									256 бит		80-битный	128 бит
CPU набор инструкций SIMD уровень			SSE4a ^[f]	AVX				AVX2						SSSE3	AVX			AVX2
3DNow!			3DNow! +	Нет данных										Нет данных
PREFETCH / PREFETCHW
FMA4 , LWP, TBM и XOP			Нет данных						Нет данных				Нет данных					Нет данных
FMA3			Нет данных										Нет данных
Кэш данных L1 на ядро (КиБ)			64	16				32						32
Ассоциативность кэша данных L1 (способы)			2	4				8						8
Кешей инструкций L1 на ядро			1	0,5						1				1				0,5	1
Максимальный общий кэш инструкций L1 APU (КиБ)			256	128		192				256		512		64	128			96	128
Ассоциативность кэша инструкций L1 (способы)			2			3				4		8		2				3	4
Кешей L2 на ядро			1	0,5						1				1				0,5	1
Макс.общий кеш L2 APU (МиБ)			4					2				4		1	2			1
Ассоциативность кэша L2 (способы)			16							8				16					8
Общий кэш L3 APU (МиБ)			Нет данных						4		8		Нет данных					4
Ассоциативность кэша APU L3 (способы)			Нет данных						16									16
Схема кеш-памяти L3			Жертва			Нет данных			Жертва									Жертва
Поддержка максимального запаса DRAM			DDR3-1866		DDR3-2133			DDR3-2133 , DDR4-2400	DDR4-2400	DDR4-2933		DDR4-3200 , LPDDR4-4266	LPDDR4-4266	DDR3L-1333	DDR3L-1600	DDR3L-1866		DDR3-1866 , DDR4-2400	DDR4-2400
Максимальное количество каналов DRAM на APU			2											1					2
Максимальная пропускная способность DRAM (ГБ / с) на APU			29 866		34,132			38 400		46,932		68,256	?	10,666	12,800	14,933		19.200	38 400
Микроархитектура GPU			TeraScale 2 (VLIW5)	TeraScale 3 (VLIW4)		GCN 2-го поколения		GCN 3-го поколения		GCN 5-го поколения ^[19]				TeraScale 2 (VLIW5)	GCN 2-го поколения			GCN 3-го поколения ^[19]	GCN 5-го поколения
Набор инструкций графического процессора			Набор инструкций TeraScale			Набор инструкций GCN								Набор инструкций TeraScale	Набор инструкций GCN
Максимальная базовая частота графического процессора (МГц)			600	800	844	866		1108		1250	1400	2100	?	538	600	?	847	900	1200
Максимальный базовый базовый графический процессор GFLOPS ^[г]			480	614,4	648,1	886,7		1134,5		1760	1971,2	2150,4	?	86	?	?	?	345,6	460,8
3D-движок ^[ч]			До 400: 20: 8	До 384: 24: 6		До 512: 32: 8				До 704: 44: 16 ^[20]		До 512: 32: 8	?	80: 8: 4	128: 8: 4			До 192:?:?	До 192:?:?
3D-движок ^[ч]			IOMMUv1			IOMMUv2								IOMMUv1			?		IOMMUv2
Видео декодер			УВД 3.0			УВД 4.2		УВД 6.0		VCN 1.0 ^[21]		VCN 2.0 ^[22]		УВД 3.0	УВД 4.0	УВД 4.2	УВД 6.0	УВД 6.3	VCN 1.0
Кодировщик видео			Нет данных	VCE 1.0		VCE 2.0		VCE 3.1		VCN 1.0 ^[21]		VCN 2.0 ^[22]		Нет данных	VCE 2.0		VCE 3.1		VCN 1.0
AMD Fluid Motion
Энергосбережение GPU			PowerPlay	PowerTune										PowerPlay	PowerTune ^[23]
TrueAudio			Нет данных			^[24]							Нет данных
FreeSync			Нет данных			1 2							Нет данных		1 2
HDCP ^[i]			?			1.4				1,4 2,2				?	1.4				1,4 2,2
PlayReady ^[i]			Нет данных						3.0 еще нет				Нет данных					3.0 еще нет
Поддерживаемые дисплеи ^[j]			2–3	2–4				3		3 (настольный) 4 (мобильный, встроенный)		4		2				3	4
`/drm/radeon`^[k]^[26]^[27]								Нет данных									Нет данных
`/drm/amdgpu`^[k]^[28]			Нет данных			^[29]								Нет данных	^[29]

^ Для моделей экскаваторов FM2 +: A8-7680, A6-7480 и Athlon X4 845.
^ Для моделей экскаваторов FM2 +: A8-7680, A6-7480 и Athlon X4 845.
^ ПК будет одним узлом.
^ APU объединяет CPU и GPU. У обоих есть ядра.
^ Требуется поддержка прошивки.
^ Нет SSE4. Нет SSSE3.
^ Производительность с одинарной точностью рассчитывается на основе базовой (или ускоренной) тактовой частоты ядра на основеоперации FMA .
^ Унифицированные шейдеры : блоки наложения текстуры : блоки вывода рендеринга
^ a b Для воспроизведения защищенного видеоконтента также требуется поддержка карты, операционной системы, драйверов и приложений. Для этого также необходим совместимый дисплей HDCP. HDCP является обязательным для вывода определенных аудиоформатов, что накладывает дополнительные ограничения на настройку мультимедиа.
^ Чтобы питать более двух дисплеев, дополнительные панели должны иметь встроеннуюподдержку DisplayPort . ^{[25] В} качестве альтернативы можно использовать активные адаптеры DisplayPort-to-DVI / HDMI / VGA.
^ a b DRM ( Direct Rendering Manager ) - это компонент ядра Linux. Поддержка в этой таблице относится к самой последней версии.

ARM [ править ]

Микроархитектура ARM Bifrost , реализованная в Mali-G71, ^[30] полностью соответствует аппаратным спецификациям HSA 1.1. По состоянию на июнь 2016 ^{[Обновить]}года ARM не объявила о поддержке программного обеспечения, которое будет использовать эту аппаратную функцию.

См. Также [ править ]

Универсальные вычисления на графических процессорах (GPGPU)
Неравномерный доступ к памяти (NUMA)
OpenMP
Общая память
Нулевая копия

Ссылки [ править ]

^ Tarun Айер (30 апреля 2013). «AMD представляет свою технологию гетерогенного унифицированного доступа к памяти (hUMA)» . Оборудование Тома .
^ a b Джордж Кириазис (30 августа 2012 г.). Архитектура гетерогенных систем: технический обзор (PDF) (отчет). AMD. Архивировано из оригинального (PDF) 28 марта 2014 года . Проверено 26 мая 2014 .
^ "Что такое архитектура гетерогенной системы (HSA)?" . AMD. Архивировано из оригинального 21 июня 2014 года . Дата обращения 23 мая 2014 .
↑ Joel Hruska (26 августа 2013 г.). «Установка HSAIL: AMD объясняет будущее сотрудничества CPU / GPU» . ExtremeTech . Зифф Дэвис .
^ Линаро. «LCE13: Архитектура гетерогенных систем (HSA) на ARM» . slideshare.net .
^ Б «Гетерогенные системы Архитектура: Назначение и перспективы» . gpuscience.com . 9 ноября 2012 года Архивировано из оригинала на 1 февраля 2014 года . Дата обращения 24 мая 2014 .
^ «Гетерогенная системная архитектура: многоядерная обработка изображений с использованием сочетания элементов ЦП и ГП» . Встраиваемый компьютерный дизайн . Дата обращения 23 мая 2014 .
^ "Микроархитектура Кавери" . SemiAccurate . 15 января 2014 г.
^ Майкл Ларабель (21 июля 2014 г.). «Драйвер AMDKFD все еще развивается для HSA с открытым исходным кодом в Linux» . Фороникс . Проверено 21 января 2015 года .
^ a b «Ядро Linux 3.19, раздел 1.3. Драйвер HSA для устройств AMD GPU» . kernelnewbies.org . 8 февраля 2015 . Проверено 12 февраля 2015 года .
^ «HSA-Runtime-Reference-Source / README.md на главном» . github.com . 14 ноября 2014 . Проверено 12 февраля 2015 года .
^ «Анонсировано ядро Linux 4.14 с безопасным шифрованием памяти и др.» . 13 ноября 2017.
↑ Алекс Вуди (26 августа 2013 г.). «Фонд HSA стремится повысить производительность графических процессоров Java» . HPCwire .
^ "Болт на гитхабе" .
^ AMD GPUOpen (19 апреля 2016 г.). «CodeXL 2.0 включает профилировщик HSA» .
^ «AMD объявляет о выпуске APU 7-го поколения: Excavator mk2 в Бристоль-Ридж и Стони-Ридж для ноутбуков» . 31 мая 2016 . Дата обращения 3 января 2020 .
^ "AMD Mobile" Carrizo "Семейство APU, разработанных для достижения значительного скачка производительности и энергоэффективности в 2015 году" (пресс-релиз). 20 ноября 2014 . Проверено 16 февраля 2015 года .
^ «Руководство по сравнению мобильных процессоров, версия 13.0, стр. 5: Полный список мобильных процессоров AMD» . TechARP.com . Проверено 13 декабря 2017 года .
^ a b «Графические процессоры AMD VEGA10 и VEGA11 обнаружены в драйвере OpenCL» . VideoCardz.com . Проверено 6 июня +2017 .
^ Катресс, Ян (1 февраля 2018 г.). «Ядра Zen и Vega: APU Ryzen для AM4 - AMD Tech Day на CES: Обнародована дорожная карта 2018, с APU Ryzen, Zen + на 12-нм, Vega на 7-нм» . Anandtech . Проверено 7 февраля 2018 .
^ Larabel, Майкл (17 ноября 2017). «Поддержка кодирования Radeon VCN появляется в Mesa 17.4 Git» . Фороникс . Проверено 20 ноября 2017 года .
↑ Лю, Лев (4 сентября 2020 г.). «Добавить поддержку декодирования Renoir VCN» . Дата обращения 11 сентября 2020 . Имеет тот же блок VCN2.x, что и Navi1x
^ Тони Чен; Джейсон Гривз, «Архитектура AMD Graphics Core Next (GCN)» (PDF) , AMD , получено 13 августа 2016 г.
^ "Технический взгляд на архитектуру AMD Kaveri" . Полуточная . Проверено 6 июля 2014 года .
^ «Как подключить три или более монитора к графической карте AMD Radeon ™ HD 5000, HD 6000 и HD 7000?» . AMD . Проверено 8 декабря 2014 .
↑ Эйрли, Дэвид (26 ноября 2009 г.). «DisplayPort поддерживается драйвером KMS, встроенным в ядро Linux 2.6.33» . Проверено 16 января +2016 .
^ "Матрица характеристик Radeon" . freedesktop.org . Проверено 10 января +2016 .
^ Deucher Александр (16 сентября 2015). «XDC2015: AMDGPU» (PDF) . Проверено 16 января +2016 .
^ a b Мишель Дэнзер (17 ноября 2016 г.). «[ОБЪЯВЛЕНИЕ] xf86-video-amdgpu 1.2.0» . lists.x.org .
^ "Архитектура GPU ARM Bifrost" . 30 мая 2016 г.

Внешние ссылки [ править ]

Викискладе есть медиафайлы, связанные с архитектурой гетерогенных систем .

Обзор архитектуры гетерогенной системы HSA на YouTube, автор Винод Типпараджу на SC13 в ноябре 2013 г.
HSA и программная экосистема
2012 - HSA Майкла Хьюстона

[18] Для моделей экскаваторов FM2 +: A8-7680, A6-7480 и Athlon X4 845.

[19] Для моделей экскаваторов FM2 +: A8-7680, A6-7480 и Athlon X4 845.

[nodedef-21] ПК будет одним узлом.

[apudef-22] APU объединяет CPU и GPU. У обоих есть ядра.

[iommubios-23] Требуется поддержка прошивки.

[sse4a-24] Нет SSE4. Нет SSSE3.

[SFLOPS-26] Производительность с одинарной точностью рассчитывается на основе базовой (или ускоренной) тактовой частоты ядра на основеоперации FMA .

[27] Унифицированные шейдеры : блоки наложения текстуры : блоки вывода рендеринга

[DRM-33] Для воспроизведения защищенного видеоконтента также требуется поддержка карты, операционной системы, драйверов и приложений. Для этого также необходим совместимый дисплей HDCP. HDCP является обязательным для вывода определенных аудиоформатов, что накладывает дополнительные ограничения на настройку мультимедиа.

[35] Чтобы питать более двух дисплеев, дополнительные панели должны иметь встроеннуюподдержку DisplayPort . ^{[25] В} качестве альтернативы можно использовать активные адаптеры DisplayPort-to-DVI / HDMI / VGA.

[drm-36] DRM ( Direct Rendering Manager ) - это компонент ядра Linux. Поддержка в этой таблице относится к самой последней версии.

[1] Tarun Айер (30 апреля 2013). «AMD представляет свою технологию гетерогенного унифицированного доступа к памяти (hUMA)» . Оборудование Тома .

[whitepaper-2] Джордж Кириазис (30 августа 2012 г.). Архитектура гетерогенных систем: технический обзор (PDF) (отчет). AMD. Архивировано из оригинального (PDF) 28 марта 2014 года . Проверено 26 мая 2014 .

[whatis-3] "Что такое архитектура гетерогенной системы (HSA)?" . AMD. Архивировано из оригинального 21 июня 2014 года . Дата обращения 23 мая 2014 .

[4] Joel Hruska (26 августа 2013 г.). «Установка HSAIL: AMD объясняет будущее сотрудничества CPU / GPU» . ExtremeTech . Зифф Дэвис .

[5] Линаро. «LCE13: Архитектура гетерогенных систем (HSA) на ARM» . slideshare.net .

[gpuscience-6] Б «Гетерогенные системы Архитектура: Назначение и перспективы» . gpuscience.com . 9 ноября 2012 года Архивировано из оригинала на 1 февраля 2014 года . Дата обращения 24 мая 2014 .

[7] «Гетерогенная системная архитектура: многоядерная обработка изображений с использованием сочетания элементов ЦП и ГП» . Встраиваемый компьютерный дизайн . Дата обращения 23 мая 2014 .

[8] "Микроархитектура Кавери" . SemiAccurate . 15 января 2014 г.

[9] Майкл Ларабель (21 июля 2014 г.). «Драйвер AMDKFD все еще развивается для HSA с открытым исходным кодом в Linux» . Фороникс . Проверено 21 января 2015 года .

[kernelnewbies-3.19-10] «Ядро Linux 3.19, раздел 1.3. Драйвер HSA для устройств AMD GPU» . kernelnewbies.org . 8 февраля 2015 . Проверено 12 февраля 2015 года .

[11] «HSA-Runtime-Reference-Source / README.md на главном» . github.com . 14 ноября 2014 . Проверено 12 февраля 2015 года .

[12] «Анонсировано ядро Linux 4.14 с безопасным шифрованием памяти и др.» . 13 ноября 2017.

[13] Алекс Вуди (26 августа 2013 г.). «Фонд HSA стремится повысить производительность графических процессоров Java» . HPCwire .

[14] "Болт на гитхабе" .

[15] AMD GPUOpen (19 апреля 2016 г.). «CodeXL 2.0 включает профилировщик HSA» .

[16] «AMD объявляет о выпуске APU 7-го поколения: Excavator mk2 в Бристоль-Ридж и Стони-Ридж для ноутбуков» . 31 мая 2016 . Дата обращения 3 января 2020 .

[17] "AMD Mobile" Carrizo "Семейство APU, разработанных для достижения значительного скачка производительности и энергоэффективности в 2015 году" (пресс-релиз). 20 ноября 2014 . Проверено 16 февраля 2015 года .

[20] «Руководство по сравнению мобильных процессоров, версия 13.0, стр. 5: Полный список мобильных процессоров AMD» . TechARP.com . Проверено 13 декабря 2017 года .

[Vega_codenames-25] «Графические процессоры AMD VEGA10 и VEGA11 обнаружены в драйвере OpenCL» . VideoCardz.com . Проверено 6 июня +2017 .

[28] Катресс, Ян (1 февраля 2018 г.). «Ядра Zen и Vega: APU Ryzen для AM4 - AMD Tech Day на CES: Обнародована дорожная карта 2018, с APU Ryzen, Zen + на 12-нм, Vega на 7-нм» . Anandtech . Проверено 7 февраля 2018 .

[29] Larabel, Майкл (17 ноября 2017). «Поддержка кодирования Radeon VCN появляется в Mesa 17.4 Git» . Фороникс . Проверено 20 ноября 2017 года .

[30] Лю, Лев (4 сентября 2020 г.). «Добавить поддержку декодирования Renoir VCN» . Дата обращения 11 сентября 2020 . Имеет тот же блок VCN2.x, что и Navi1x

[31] Тони Чен; Джейсон Гривз, «Архитектура AMD Graphics Core Next (GCN)» (PDF) , AMD , получено 13 августа 2016 г.

[32] "Технический взгляд на архитектуру AMD Kaveri" . Полуточная . Проверено 6 июля 2014 года .

[34] «Как подключить три или более монитора к графической карте AMD Radeon ™ HD 5000, HD 6000 и HD 7000?» . AMD . Проверено 8 декабря 2014 .

[37] Эйрли, Дэвид (26 ноября 2009 г.). «DisplayPort поддерживается драйвером KMS, встроенным в ядро Linux 2.6.33» . Проверено 16 января +2016 .

[Radeon_Feature_Matrix-38] "Матрица характеристик Radeon" . freedesktop.org . Проверено 10 января +2016 .

[39] Deucher Александр (16 сентября 2015). «XDC2015: AMDGPU» (PDF) . Проверено 16 января +2016 .

[amdgpu_1.2-40] Мишель Дэнзер (17 ноября 2016 г.). «[ОБЪЯВЛЕНИЕ] xf86-video-amdgpu 1.2.0» . lists.x.org .

[41] "Архитектура GPU ARM Bifrost" . 30 мая 2016 г.

[1]