Volta - это кодовое название микроархитектуры графического процессора, разработанной Nvidia , пришедшей на смену Pascal . Впервые об этом было объявлено в дорожной карте в марте 2013 года [1], хотя о первом продукте не было объявлено до мая 2017 года. [2] Архитектура названа в честь итальянского химика и физика 18-19 веков Алессандро Вольта . Это был первый чип NVIDIA с тензорными ядрами, специально разработанными ядрами, которые обладают превосходной производительностью глубокого обучения по сравнению с обычными ядрами CUDA. [3] Архитектура производится с TSMC «с 12 нм FinFET процесса. Ампер микроархитектура является преемницей Volta.
Дата выпуска | 7 декабря 2017 г. |
---|---|
Кодовое имя | Вольта |
Процесс изготовления | TSMC 12 нм ( FinFET ) |
Открытки | |
Энтузиаст |
|
История | |
Предшественник | Паскаль |
Преемник | Тьюринг (потребительский) Ампер (потребительский, профессиональный) |
Первой видеокартой, которая использовала это, был центр обработки данных Tesla V100, например, как часть системы Nvidia DGX-1 . [2] Он также использовался в Quadro GV100 и Titan V. Не было массовых видеокарт GeForce, основанных на Volta.
Подробности
Архитектурные улучшения архитектуры Volta включают следующее:
- Возможности вычислений CUDA 7.0
- одновременное выполнение целочисленных операций и операций с плавающей запятой
- TSMC «с 12 нм FinFET процесс, [4] , позволяющие 21,1 миллиарда транзисторов . [5]
- Память с высокой пропускной способностью 2 (HBM2), [4] [6]
- NVLink 2.0 : шина с высокой пропускной способностью между процессором и графическим процессором, а также между несколькими графическими процессорами. Обеспечивает гораздо более высокие скорости передачи, чем те, которые достигаются при использовании PCI Express ; Предполагается, что обеспечит 25 Гбит / с на полосу. [7] (отключено для Titan V)
- Тензорные ядра: тензорное ядро - это блок, который умножает две матрицы FP16 4 × 4 , а затем добавляет к результату третью матрицу FP16 или FP32 , используя объединенные операции умножения-сложения , и получает результат FP32, который при желании может быть понижен до Результат FP16. [8] Тензорные ядра предназначены для ускорения обучения нейронных сетей. [8] Тензорные ядра Volta - это первое поколение, а у Ampere - тензорные ядра третьего поколения. [9] [10]
- Аппаратное декодирование видео PureVideo Feature Set I
Продукты
Вольта была объявлена GPU микроархитектуры внутри Xavier поколения Tegra SoC сосредоточиться на самостоятельном вождении автомобилей . [11] [12]
На ежегодной конференции Nvidia по технологиям графических процессоров 10 мая 2017 года Nvidia официально анонсировала микроархитектуру Volta вместе с Tesla V100. [2] Графический процессор Volta GV100 построен на основе процесса размером 12 нм с использованием памяти HBM2 с пропускной способностью 900 ГБ / с. [13]
Nvidia официально анонсировала NVIDIA TITAN V 7 декабря 2017 года. [14] [15]
Nvidia официально анонсировала Quadro GV100 27 марта 2018 г. [16]
Модель | Запуск | Кодовое имя (а) | Fab ( нм ) | Транзисторы (млрд) | Размер матрицы (мм 2 ) | Интерфейс шины | Основная конфигурация | SM Count [a] | Кластеры обработки графики [b] | Размер кэша L2 ( МиБ ) | Тактовые частоты | Скорость заполнения | объем памяти | Вычислительная мощность ( GFLOPS ) | TDP (Вт) | Поддержка NVLink | Стартовая цена ( долл. США ) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ядро CUDA [c] | Тензорное ядро [d] | Базовая частота ядра ( МГц ) | Частота разгона ( МГц ) | Память ( МТ / с ) | Пиксель ( GP / s) | Текстура ( GT / s) | Размер ( ГиБ ) | Пропускная способность ( ГБ / с) | Тип автобуса | Ширина шины ( бит ) | Одинарная точность (усиление) | Двойная точность (усиление) | Половинная точность (усиление) | |||||||||||||
MSRP | ||||||||||||||||||||||||||
Nvidia Titan V [17] | 7 декабря 2017 г. | GV100-400-A1 | TSMC 12 нм | 21,1 | 815 | PCIe 3.0 × 16 | 5120: 320: 96 | 640 | 80 | 6 | 4.5 | 1200 | 1455 | 1700 | 139,7 | 465,6 | 12 | 652,8 | HBM2 | 3072 | 12288 (14899) | 6144 (7450) | 24576 (29798) | 250 | Нет | 2 999 долл. США |
Nvidia Quadro GV100 [18] | 27 марта 2018 г. | GV100 | 5120: 320: 128 | 6 | 1132 | 1628 | 1696 | 208,4 | 521 | 32 | 868,4 | 4096 | 11592 (16671) | 5796 (8335) | 23183 (33341) | да | 8 999 долл. США | |||||||||
Nvidia Titan V CEO Edition [19] [20] | 21 июня 2018 г. | 1200 | 1455 | 1700 | 186,2 | 465,6 | 870,4 | 12288 (14899) | 6144 (7450) | 24576 (29798) | N / A |
- ^ Один потоковый мультипроцессор включает 64 ядра CUDA и 4 TMU.
- ^ Один кластер обработки графики включает четырнадцать потоковых мультипроцессоров.
- ^ Ядра CUDA : Блоки наложения текстур : Блоки вывода рендеринга
- ^ Ядро Tensor - это FPU смешанной точности,специально разработанный для матричной арифметики.
Заявление
Сообщается также, что Volta входит в состав суперкомпьютеров Summit и Sierra , используемых для вычислений GPGPU. [21] [22] Графические процессоры Volta будут подключаться к процессорам POWER9 через NVLink 2.0 , который, как ожидается, будет поддерживать согласованность кэша и, следовательно, улучшать производительность GPGPU. [23] [7] [24]
Смотрите также
- Список графических процессоров Nvidia
Рекомендации
- ^ Gasior, Geoff (19 марта 2013). «Графический процессор Nvidia Volta получит встроенную память DRAM» . Технический отчет . Проверено 14 марта 2017 года .
- ^ а б в Смит, Райан (2017-05-10). «Основной блог конференции NVIDIA GPU Tech Conference 2017 в реальном времени» . Проверено 3 ноября 2018 .
- ^ «Архитектура NVIDIA Volta AI | NVIDIA» . NVIDIA . Проверено 11 апреля 2018 .
- ^ а б Киллиан, Зак (14 марта 2017 г.). «Отчет: TSMC приступила к производству Volta и Centriq по 12-нм техпроцессу» . Технический отчет . Проверено 14 марта 2017 года .
- ^ Дюрант, Люк; Жиру, Оливье; Харрис, Марк; Стэм, Ник (10 мая 2017 г.). «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . Блог разработчиков Nvidia .
- ^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор Nvidia Volta получит встроенную память DRAM» . Технический отчет .
- ^ а б Шах, Агам (22 августа 2016 г.). «NVLink 2.0 от Nvidia впервые появится на серверах Power9 в следующем году» . Мир ПК . Проверено 14 марта 2017 года .
- ^ а б Харрис, Марк (11 мая 2017 г.). «Раскрытые возможности CUDA 9: Volta, кооперативные группы и многое другое» . Проверено 12 августа 2017 года .
- ^ https://devblogs.nvidia.com/nvidia-ampere-architecture-in-depth/
- ^ https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf
- ^ Катресс, Ян; Таллис, Билли (4 января 2016 г.). «CES 2017: Liveblog Nvidia Keynote» . AnandTech . Проверено 9 января 2017 года .
- ^ «NVIDIA DRIVE Xavier, самая мощная в мире система на кристалле, приносит потрясающие новые возможности искусственного интеллекта | Блог NVIDIA» . Официальный блог NVIDIA . 2018-01-07 . Проверено 3 ноября 2018 .
- ^ Смит, Райан (10 мая 2017 г.). «Представленная Nvidia Volta» . AnandTech . Дата обращения 2 июня 2017 .
- ^ https://nvidianews.nvidia.com/news/nvidia-titan-v-transforms-the-pc-into-ai-supercomputer
- ^ https://www.nvidia.com/en-us/titan/titan-v/
- ^ https://nvidianews.nvidia.com/news/nvidia-reinvents-the-workstation-with-real-time-ray-tracing
- ^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» . NVIDIA . Проверено 8 декабря 2017 .
- ^ «NVIDIA Quadro GV100» . Проверено 27 марта 2018 .
- ^ Смит, Райан. «NVIDIA представляет и раздает новую ограниченную серию 32 ГБ Titan V« CEO Edition » » . Проверено 6 июля 2018 .
- ^ "NVIDIA TITAN V CEO Edition" . TechPowerUp . Проверено 7 июля 2018 .
- ^ Шенкленд, Стивен (14 сентября 2015 г.). «IBM и Nvidia заключили сделку по суперкомпьютеру на 325 миллионов долларов» . CNET . Проверено 29 декабря 2015 года .
- ^ Нойес, Кэтрин (16 марта 2015 г.). «Двигатели HPC IBM, Nvidia rev в суперкомпьютерах нового поколения» . Мир ПК . Проверено 29 декабря 2015 года .
- ^ Смит, Райан (17 ноября 2014 г.). «Nvidia Volta, земельные контракты IBM Power9 для новых суперкомпьютеров правительства США» . Anandtech . Проверено 14 марта 2017 года .
- ^ Лилли, Пол (25 января 2017 г.). «Архитектура графического процессора NVIDIA 12nm FinFET Volta, как сообщается, заменила Паскаль в 2017 году» . HotHardware .