Nvidia DGX

Nvidia DGX - это линейка серверов и рабочих станций Nvidia, которые специализируются на использовании GPGPU для ускорения приложений глубокого обучения .

DGX-1 [ править ]

Серверы DGX-1 имеют 8 графических процессоров на основе дочерних карт Pascal или Volta ^[1] с памятью HBM 2 , соединенных ячеистой сетью NVLink . ^[2]

Линия продуктов предназначена для преодоления разрыва между графическими процессорами и ускорителями искусственного интеллекта, поскольку устройство имеет особые функции, специализирующиеся на рабочих нагрузках глубокого обучения. ^[3] Первоначальный DGX-1 на базе Pascal выдавал 170 терафлопс при обработке половинной точности , ^{[4] в} то время как обновление на основе Volta увеличило его до 960 терафлопс . ^[5]

DGX-2 [ править ]

Преемником Nvidia DGX-1 является Nvidia DGX-2, который использует 16 карт 32 ГБ V100 (второго поколения) в одном устройстве. Это увеличивает производительность до 2 Петафлопс с 512 ГБ общей памяти для решения более серьезных проблем и использует NVSwitch для ускорения внутренней связи.

Кроме того, есть более производительная версия DGX-2, DGX-2H, с заметным отличием, заключающимся в замене Dual Intel Xeon Platinum 8168 с частотой 2,7 ГГц на Dual Intel Xeon Platinum 8174 с частотой 3,1 ГГц ^[6]

DGX A100 [ править ]

14 мая 2020 года было анонсировано и выпущено третье поколение серверов DGX, включая ускорители A100 на базе 8 ампер . ^[7] Также включены 15 ТБ хранилища PCIe Gen 4 NVMe , ^[8] два 64-ядерных процессора AMD Rome 7742, 1 ТБ оперативной памяти и межсоединение HDR InfiniBand с питанием от Mellanox . Первоначальная цена DGX A100 составляла 199 000 долларов. ^[7]

Ускорители [ править ]

Сравнение ускорителей, используемых в DGX: ^[7]

Ускоритель
A100
V100
P100

Архитектура	Ядра CUDA FP32	Boost Clock	Часы памяти	Ширина шины памяти	Пропускная способность памяти	VRAM	Одинарная точность	Двойная точность	INT8 Тензор	FP16 Тензор	FP32 Тензор	Соединить	GPU	Размер кристалла графического процессора	Количество транзисторов	TDP	Производственный процесс
Ампер	6912	~ 1410 МГц	2,4 Гбит / с HBM2	5120-бит	1,6 ТБ / сек	40 ГБ	19,5 терафлопс	9.7 терафлопс	624 терафлопс	312 терафлопс	156 терафлопс	600 ГБ / сек	A100	826 мм2	54,2B	400 Вт	TSMC 7N
Вольта	5120	1530 МГц	1,75 Гбит / с HBM2	4096 бит	900 ГБ / сек	16 ГБ / 32 ГБ	15.7 терафлопс	7,8 терафлопс	N / A	125 терафлопс	N / A	300 ГБ / сек	GV100	815 мм2	21,1B	300 Вт / 350 Вт	TSMC 12 нм FFN
Паскаль	3584	1480 МГц	1,4 Гбит / с HBM2	4096 бит	720 ГБ / сек	16 ГБ	10.6 терафлопс	5.3 TFLOP	N / A	N / A	N / A	160 ГБ / сек	GP100	610 мм2	15.3B	300 Вт	TSMC 16 нм FinFET

См. Также [ править ]

Суперсэмплинг глубокого обучения

Ссылки [ править ]

^ "nvidia dgx-1" (PDF) .
^ "внутри паскаль" . Архитектура гибридной кубической сетки с восемью графическими процессорами и NVLink
^ "суперкомпьютер глубокого обучения" .
^ "Система глубокого обучения DGX-1" (PDF) . NVIDIA DGX-1 обеспечивает в 75 раз более быстрое обучение ... Примечание: тест Caffe с AlexNet, обучение 1,28 млн изображений с 90 эпохами
^ "Сервер DGX" . Сервер DGX . Nvidia . Проверено 7 сентября 2017 года .
^ https://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf
^ a b c Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель» . AnandTech.
^ Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК» . Грань.

Эта статья о компьютерах - незавершенная . Вы можете помочь Википедии, расширив ее .

[1] "nvidia dgx-1" (PDF) .

[2] "внутри паскаль" . Архитектура гибридной кубической сетки с восемью графическими процессорами и NVLink

[3] "суперкомпьютер глубокого обучения" .

[4] "Система глубокого обучения DGX-1" (PDF) . NVIDIA DGX-1 обеспечивает в 75 раз более быстрое обучение ... Примечание: тест Caffe с AlexNet, обучение 1,28 млн изображений с 90 эпохами

[5] "Сервер DGX" . Сервер DGX . Nvidia . Проверено 7 сентября 2017 года .

[6] ttps://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf

[anand-A100-7] Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель» . AnandTech.

[verge-A100-8] Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК» . Грань.

[1]