Nvidia DGX - это линейка серверов и рабочих станций Nvidia, которые специализируются на использовании GPGPU для ускорения приложений глубокого обучения .
DGX-1 [ править ]
Серверы DGX-1 имеют 8 графических процессоров на основе дочерних карт Pascal или Volta [1] с памятью HBM 2 , соединенных ячеистой сетью NVLink . [2]
Линия продуктов предназначена для преодоления разрыва между графическими процессорами и ускорителями искусственного интеллекта, поскольку устройство имеет особые функции, специализирующиеся на рабочих нагрузках глубокого обучения. [3] Первоначальный DGX-1 на базе Pascal выдавал 170 терафлопс при обработке половинной точности , [4] в то время как обновление на основе Volta увеличило его до 960 терафлопс . [5]
DGX-2 [ править ]
Преемником Nvidia DGX-1 является Nvidia DGX-2, который использует 16 карт 32 ГБ V100 (второго поколения) в одном устройстве. Это увеличивает производительность до 2 Петафлопс с 512 ГБ общей памяти для решения более серьезных проблем и использует NVSwitch для ускорения внутренней связи.
Кроме того, есть более производительная версия DGX-2, DGX-2H, с заметным отличием, заключающимся в замене Dual Intel Xeon Platinum 8168 с частотой 2,7 ГГц на Dual Intel Xeon Platinum 8174 с частотой 3,1 ГГц [6]
DGX A100 [ править ]
14 мая 2020 года было анонсировано и выпущено третье поколение серверов DGX, включая ускорители A100 на базе 8 ампер . [7] Также включены 15 ТБ хранилища PCIe Gen 4 NVMe , [8] два 64-ядерных процессора AMD Rome 7742, 1 ТБ оперативной памяти и межсоединение HDR InfiniBand с питанием от Mellanox . Первоначальная цена DGX A100 составляла 199 000 долларов. [7]
Ускорители [ править ]
Сравнение ускорителей, используемых в DGX: [7]
Ускоритель |
---|
A100 |
V100 |
P100 |
Архитектура | Ядра CUDA FP32 | Boost Clock | Часы памяти | Ширина шины памяти | Пропускная способность памяти | VRAM | Одинарная точность | Двойная точность | INT8 Тензор | FP16 Тензор | FP32 Тензор | Соединить | GPU | Размер кристалла графического процессора | Количество транзисторов | TDP | Производственный процесс |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ампер | 6912 | ~ 1410 МГц | 2,4 Гбит / с HBM2 | 5120-бит | 1,6 ТБ / сек | 40 ГБ | 19,5 терафлопс | 9.7 терафлопс | 624 терафлопс | 312 терафлопс | 156 терафлопс | 600 ГБ / сек | A100 | 826 мм2 | 54,2B | 400 Вт | TSMC 7N |
Вольта | 5120 | 1530 МГц | 1,75 Гбит / с HBM2 | 4096 бит | 900 ГБ / сек | 16 ГБ / 32 ГБ | 15.7 терафлопс | 7,8 терафлопс | N / A | 125 терафлопс | N / A | 300 ГБ / сек | GV100 | 815 мм2 | 21,1B | 300 Вт / 350 Вт | TSMC 12 нм FFN |
Паскаль | 3584 | 1480 МГц | 1,4 Гбит / с HBM2 | 4096 бит | 720 ГБ / сек | 16 ГБ | 10.6 терафлопс | 5.3 TFLOP | N / A | N / A | N / A | 160 ГБ / сек | GP100 | 610 мм2 | 15.3B | 300 Вт | TSMC 16 нм FinFET |
См. Также [ править ]
Ссылки [ править ]
- ^ "nvidia dgx-1" (PDF) .
- ^ "внутри паскаль" .
Архитектура гибридной кубической сетки с восемью графическими процессорами и NVLink
- ^ "суперкомпьютер глубокого обучения" .
- ^ "Система глубокого обучения DGX-1" (PDF) .
NVIDIA DGX-1 обеспечивает в 75 раз более быстрое обучение ... Примечание: тест Caffe с AlexNet, обучение 1,28 млн изображений с 90 эпохами
- ^ "Сервер DGX" . Сервер DGX . Nvidia . Проверено 7 сентября 2017 года .
- ^ https://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf
- ^ a b c Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель» . AnandTech.
- ^ Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК» . Грань.