Дата выпуска | 2 мая 2007 г. |
---|
Nvidia Tesla - это линейка продуктов Nvidia, предназначенных для потоковой обработки или универсальных графических процессоров (GPGPU), названных в честь новаторского инженера-электрика Николы Тесла . Ее продукты начали использовать графические процессоры серии G80 и продолжали сопровождать выпуск новых чипов. Их можно программировать с помощью API CUDA или OpenCL .
Линия продуктов Nvidia Tesla конкурировала с линейками AMD Radeon Instinct и Intel Xeon Phi для глубокого обучения и видеокарт.
Nvidia отказалась от бренда Tesla в мае 2020 года, как сообщается, из-за возможной путаницы с маркой автомобилей . [1] Его новые графические процессоры - это графические процессоры Nvidia Data Center , [2] как в графическом процессоре Ampere A100. [3]
Обзор [ править ]
Этот раздел содержит контент, который написан как реклама . ( Июнь 2020 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Предлагая вычислительную мощность, намного превышающую традиционные микропроцессоры , продукты Tesla нацелены на рынок высокопроизводительных вычислений . [4] По состоянию на 2012 год [update], Nvidia Teslas используется на некоторых из самых быстрых суперкомпьютеров в мире , в том числе Summit в Национальной лаборатории Ок-Ридж и Tianhe-1A в Тяньцзине , Китай .
Карты Tesla обладают в четыре раза большей производительностью с двойной точностью, чем карты Nvidia GeForce на базе Fermi, с аналогичной производительностью с одинарной точностью. [ необходима цитата ] В отличие от потребительских карт Nvidia GeForce и профессиональных карт Nvidia Quadro, карты Tesla изначально не могли выводить изображения на дисплей . Однако последние продукты Tesla C-класса включали один порт Dual-Link DVI. [5]
В рамках проекта Denver Nvidia намерена встраивать процессорные ядра ARMv8 в свои графические процессоры. [6] Это будет 64-битное продолжение 32-битных чипов Tegra .
Тесла Р100 использует TSMC «с 16 нанометрового FinFET процесс изготовления полупроводниковых , который является более продвинутой , чем 28-нанометрового процесса , ранее используемого AMD и Nvidia GPU , между 2012 и 2016 Р100 также использует Samsung » ы HBM2 памяти. [7]
Приложения [ править ]
Продукты Tesla в основном используются для моделирования и крупномасштабных вычислений (особенно вычислений с плавающей запятой), а также для создания высококачественных изображений в профессиональных и научных областях. [8]
В 2013 году на оборонную промышленность приходилось менее одной шестой продаж Tesla, но Сумит Гупта прогнозировал увеличение продаж на рынке геопространственной разведки . [9]
Технические характеристики [ править ]
Модель | Микро- архитектура | Запуск | Чипсы | Частота ядра ( МГц ) | Шейдеры | объем памяти | Вычислительная мощность ( GFLOPS ) [a] | Вычислительные возможности CUDA [b] | TDP (Вт) | Примечания, form_factor | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ядра Cuda (всего) | Базовая частота ( МГц ) | Макс. Частота разгона ( МГц ) [c] | Тип автобуса | Ширина шины ( бит ) | Размер ( ГБ ) | Часы ( МТ / с ) | Пропускная способность ( ГБ / с) | Одинарная точность (MAD + MUL) | Одинарная точность (MAD или FMA ) | Двойная точность ( FMA ) | ||||||||
Единицы измерения | МГц | МГц | W | |||||||||||||||
Вычислительный модуль C870 GPU [d] | Тесла | 2 мая 2007 г. | 1 × G80 | 600 | 128 | 1350 | N / A | GDDR3 | 384 | 1.5 | 1600 | 76,8 | 518,4 | 345,6 | Нет | 1.0 | 170,9 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) |
Настольный компьютер D870 [d] | 2 мая 2007 г. | 2 × G80 | 600 | 256 | 1350 | N / A | GDDR3 | 2 × 384 | 2 × 1,5 | 1600 | 2 × 76,8 | 1036,8 | 691,2 | Нет | 1.0 | 520 | Внешние графические процессоры для настольного монтажа или монтажа в стойку 3U | |
Вычислительный сервер S870 GPU [d] | 2 мая 2007 г. | 4 × G80 | 600 | 512 | 1350 | N / A | GDDR3 | 4 × 384 | 4 × 1,5 | 1600 | 4 × 76,8 | 2073,6 | 1382,4 | Нет | 1.0 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 16) | ||
Вычислительный модуль C1060 GPU [e] | 9 апреля 2009 г. | 1 × GT200 | 602 | 240 | 1296 [11] | N / A | GDDR3 | 512 | 4 | 1600 | 102,4 | 933,12 | 622,08 | 77,76 | 1.3 | 187,8 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Вычислительный сервер S1070 GPU "400 конфигурация" [e] | 1 июня 2008 г. | 4 × GT200 | 602 | 960 | 1296 | N / A | GDDR3 | 4 × 512 | 4 × 4 | 1538,4 | 4 × 98,5 | 3732,5 | 2488,3 | 311,0 | 1.3 | 800 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 8 или × 16) | |
Вычислительный сервер S1070 GPU "конфигурация 500" [e] | 1440 | N / A | 4147,2 | 2764,8 | 345,6 | |||||||||||||
Вычислительный сервер S1075 GPU [e] [12] | 1 июня 2008 г. | 4 × GT200 | 602 | 960 | 1440 | N / A | GDDR3 | 4 × 512 | 4 × 4 | 1538,4 | 4 × 98,5 | 4147,2 | 2764,8 | 345,6 | 1.3 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 1 × PCIe (× 8 или × 16) | ||
Система визуальных вычислений Quadro Plex 2200 D2 [f] | 2 × GT200GL | 648 | 480 | 1296 | N / A | GDDR3 | 2 × 512 | 2 × 4 | 1600 | 2 × 102,4 | 1866,2 | 1244,2 | 155,5 | 1.3 | Внешние графические процессоры для настольного монтажа или монтажа в стойку высотой 3U с 4 двухканальными выходами DVI | |||
Система визуальных вычислений Quadro Plex 2200 S4 [f] | 4 × GT200GL | 648 | 960 | 1296 | N / A | GDDR3 | 4 × 512 | 4 × 4 | 1600 | 4 × 102,4 | 3732,5 | 2488,3 | 311,0 | 1.3 | 1200 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 8 или × 16) | ||
Вычислительный модуль C2050 GPU [13] | Ферми | 25 июля 2011 г. | 1 × GF100 | 575 | 448 | 1150 | N / A | GDDR5 | 384 | 3 [г] | 3000 | 144 | Нет | 1030,4 | 515,2 | 2.0 | 247 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) |
Вычислительный модуль M2050 GPU [14] | 25 июля 2011 г. | N / A | 3092 | 148,4 | Нет | 225 | ||||||||||||
Вычислительный модуль C2070 GPU [13] | 25 июля 2011 г. | 1 × GF100 | 575 | 448 | 1150 | N / A | GDDR5 | 384 | 6 [г] | 3000 | 144 | Нет | 1030,4 | 515,2 | 2.0 | 247 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Вычислительный модуль C2075 GPU [15] | 25 июля 2011 г. | N / A | 3000 | 144 | Нет | 225 | ||||||||||||
Вычислительный модуль графического процессора M2070 / M2070Q [16] | 25 июля 2011 г. | N / A | 3132 | 150,336 | Нет | 225 | ||||||||||||
Вычислительный модуль M2090 GPU [17] | 25 июля 2011 г. | 1 × GF110 | 650 | 512 | 1300 | N / A | GDDR5 | 384 | 6 [г] | 3700 | 177,6 | Нет | 1331,2 | 665,6 | 2.0 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Вычислительный сервер S2050 GPU | 25 июля 2011 г. | 4 × GF100 | 575 | 1792 | 1150 | N / A | GDDR5 | 4 × 384 | 4 × 3 [г] | 3 | 4 × 148,4 | Нет | 4121,6 | 2060,8 | 2.0 | 900 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 8 или × 16) | |
Вычислительный сервер S2070 GPU | N / A | 4 × 6 [г] | Нет | |||||||||||||||
Ускоритель графического процессора K10 [18] | Кеплер | 1 мая 2012 г. | 2 × ГК104 | N / A | 3072 | 745 | ? | GDDR5 | 2 × 256 | 2 × 4 | 5000 | 2 × 160 | Нет | 4577 | 190,7 | 3.0 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) |
Ускоритель графического процессора K20 [19] [20] | 12 ноября 2012 г. | 1 × GK110 | N / A | 2496 | 706 | 758 | GDDR5 | 320 | 5 | 5200 | 208 | Нет | 3524 | 1175 | 3.5 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Ускоритель графического процессора K20X [21] | 12 ноября 2012 г. | 1 × GK110 | N / A | 2688 | 732 | ? | GDDR5 | 384 | 6 | 5200 | 250 | Нет | 3935 | 1312 | 3.5 | 235 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Ускоритель графического процессора K40 [22] | 8 октября 2013 г. | 1 × ГК110Б | N / A | 2880 | 745 | 875 | GDDR5 | 384 | 12 [г] | 6000 | 288 | Нет | 4291–5040 | 1430–1680 | 3.5 | 235 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Ускоритель графического процессора K80 [23] | 17 ноября 2014 г. | 2 × ГК210 | N / A | 4992 | 560 | 875 | GDDR5 | 2 × 384 | 2 × 12 | 5000 | 2 × 240 | Нет | 5591–8736 | 1864–2912 | 3,7 | 300 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Ускоритель графического процессора M4 [24] [25] | Максвелл | 10 ноября 2015 г. | 1 × GM206 | N / A | 1024 | 872 | 1072 | GDDR5 | 128 | 4 | 5500 | 88 | Нет | 1786–2195 | 55,81–68,61 | 5.2 | 50–75 | Внутренний графический процессор PCIe (половинной высоты, один слот) |
Графический ускоритель M6 [26] | 30 августа 2015 г. | 1 × GM204-995-A1 | N / A | 1536 | 722 | 1051 | GDDR5 | 256 | 8 | 4600 | 147,2 | Нет | 2218–3229 | 69,3–100,9 | 5.2 | 75–100 | Внутренний графический процессор MXM | |
Ускоритель графического процессора M10 [27] | 4 × GM107 | N / A | 2560 | 1033 | ? | GDDR5 | 4 × 128 | 4 × 8 | 5188 | 4 × 83 | Нет | 5289 | 165,3 | 5.2 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | ||
Графический ускоритель M40 [25] [28] | 10 ноября 2015 г. | 1 × GM200 | N / A | 3072 | 948 | 1114 | GDDR5 | 384 | 12 | 6000 | 288 | Нет | 5825–6844 | 182,0–213,9 | 5.2 | 250 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Ускоритель графического процессора M60 [29] | 30 августа 2015 г. | 2 × GM204-895-A1 | N / A | 4096 | 899 | 1178 | GDDR5 | 2 × 256 | 2 × 8 | 5000 | 2 × 160 | Нет | 7365–9650 | 230,1–301,6 | 5.2 | 225–300 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Ускоритель графического процессора P4 [30] | Паскаль | 13 сентября 2016 г. | 1 × GP104 | N / A | 2560 | 810 | 1063 | GDDR5 | 256 | 8 | 6000 | 192,0 | Нет | 4147–5443 | 129,6–170,1 | 6.1 | 50-75 | Карта PCIe |
Графический ускоритель P6 [31] [32] | 24 марта 2017 г. | 1 × GP104-995-A1 | N / A | 2048 | 1012 | 1506 | GDDR5 | 256 | 16 | 3003 | 192,2 | Нет | 6169 | 192,8 | 6.1 | 90 | Карта MXM | |
Графический ускоритель P40 [30] | 13 сентября 2016 г. | 1 × GP102 | N / A | 3840 | 1303 | 1531 | GDDR5 | 384 | 24 | 7200 | 345,6 | Нет | 10007–11758 | 312,7–367,4 | 6.1 | 250 | Карта PCIe | |
Графический ускоритель P100 (мезонин) [33] [34] | 5 апреля 2016 г. | 1 × GP100-890-A1 | N / A | 3584 | 1328 | 1480 | HBM2 | 4096 | 16 | 1430 | 732 | Нет | 9519–10609 | 4760–5304 | 6.0 | 300 | Карта NVLink | |
Графический ускоритель P100 (карта 16 ГБ) [35] | 20 июня 2016 г. | 1 × GP100 | N / A | 1126 | 1303 | Нет | 8071‒9340 | 4036‒4670 | 250 | Карта PCIe | ||||||||
Графический ускоритель P100 (карта 12 ГБ) [35] | 20 июня 2016 г. | N / A | 3072 | 12 | 549 | Нет | 8071‒9340 | 4036‒4670 | ||||||||||
Ускоритель V100 GPU (мезонин) [36] [37] [38] | Вольта | 1 × GV100-895-A1 | N / A | 5120 | Неизвестный | 1455 | HBM2 | 4096 | 16 или 32 | 1750 | 900 | Нет | 14899 | 7450 | 7.0 | 300 | Карта NVlink | |
Ускоритель графического процессора V100 (карта PCIe) [36] [37] [38] | 21 июня 2017 г. | 1 × GV100 | N / A | Неизвестный | 1370 | Нет | 14028 | 7014 | 250 | Карта PCIe | ||||||||
Ускоритель графического процессора T4 (карта PCIe) [39] [40] | Тьюринг | 12 сентября 2018 г. | 1 × ТУ104-895-А1 | N / A | 2560 | 585 | 1590 | GDDR6 | 256 | 16 | Неизвестный | 320 | Нет | 8100 | Неизвестный | 7,5 | 70 | Карта PCIe |
Ускоритель графического процессора A100 (карта PCIe) [41] [42] | Ампер | , 2020 | 1 × GA100-883AA-A1 | N / A | 6912 | 765 | 1410 | HBM2 | 5120 | 40 | Неизвестный | 1555 | Нет | 19500 | 9700 | 8,6 | 250 | Карта PCIe |
Модель | Микро- архитектура | Запуск | Чипсы | Частота ядра ( МГц ) | Шейдеры | объем памяти | Вычислительная мощность ( GFLOPS ) [a] | Вычислительная способность CUDA | TDP (Вт) | Примечания, форм-фактор | ||||||||
Ядра Cuda (всего) | Базовая частота ( МГц ) | Макс. Частота разгона ( МГц ) [c] | Тип автобуса | Ширина шины ( бит ) | Размер ( ГБ ) | Часы ( МТ / с ) | Пропускная способность (общая) ( ГБ / с) | Одинарная точность (MAD + MUL) | Одинарная точность (MAD или FMA ) | Двойная точность ( FMA ) |
Ноты
- ^ a b Для расчета вычислительной мощности см. Tesla (микроархитектура) # Производительность , Fermi (микроархитектура) # Производительность , Кеплер (микроархитектура) # Производительность , Максвелл (микроархитектура) # Производительность или Паскаль (микроархитектура) # Производительность . Диапазон чисел определяет минимальную и максимальную вычислительную мощность при базовой и максимальной тактовой частоте соответственно.
- ^ Версия основной архитектуры согласноруководству по программированию CUDA .
- ^ a b Ускорение графического процессора - это функция по умолчанию, которая увеличивает тактовую частоту ядра, оставаясь в рамках предопределенного бюджета мощности карты. Доступны несколько тактовых импульсов, но в этой таблице перечислены самые высокие тактовые частоты, поддерживаемые каждой картой. [10]
- ^ a b c Спецификации, не указанные Nvidia, предположительно основаны на GeForce 8800 GTX.
- ^ a b c d Спецификации, не указанные Nvidia, предположительно основаны на GeForce GTX 280
- ^ a b Спецификации, не указанные Nvidia, предполагают, что они основаны на Quadro FX 5800
- ^ a b c d e f При включенном ECC часть выделенной памяти используется для битов ECC, поэтому доступная пользовательская память уменьшается на 12,5%. (например, общий объем памяти 4 ГБ дает 3,5 ГБ доступной пользователю памяти.)
См. Также [ править ]
- Fastra II
- Список графических процессоров Nvidia
- Персональный суперкомпьютер Nvidia Tesla
- Ампер (микроархитектура)
Ссылки [ править ]
- ↑ Касас, Алекс (19 мая 2020 г.). «NVIDIA отказывается от бренда Tesla, чтобы не путать с Tesla» . Wccftech . Проверено 8 июля 2020 .
- ^ https://www.nvidia.com/en-us/data-center/data-center-gpus/
- ^ «Графические процессоры NVIDIA A100 питают современный центр обработки данных» . NVIDIA . Проверено 8 июля 2020 .
- ^ «Высокопроизводительные вычисления - суперкомпьютеры с графическими процессорами Tesla» .
- ^ "Профессиональные решения для рабочих станций" .
- ^ «Nvidia для интеграции процессоров ARM в Tesla» . 1 ноября 2012 г.
- Рианна Уолтон, Марк (6 апреля 2016 г.). «Nvidia представляет первую видеокарту Pascal - чудовищную Tesla P100» . Ars Technica . Проверено 19 июня 2019 .
- ^ Техническое описание Tesla (PDF)
- ^ «Nvidia гонится за защитой, независимыми разработчиками разведки с графическими процессорами» . www.theregister.com . Проверено 8 июля 2020 .
- ^ "Nvidia GPU Boost для Tesla" (PDF) . Январь 2014 . Проверено 7 декабря 2015 .
- ^ "Плата вычислительного процессора Tesla C1060" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ «Разница между Tesla S1070 и S1075» . 31 октября 2008 . Проверено 29 января 2017 года .
S1075 имеет одну интерфейсную карту
- ^ a b «Вычислительный процессор Tesla C2050 и Tesla C2070» (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Двухслотовые вычислительные процессорные модули Tesla M2050 и Tesla M2070 / M2070Q" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Плата вычислительного процессора Tesla C2075" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ↑ Рука, Рэндалл (23 августа 2010 г.). "Технические характеристики NVidia Tesla M2050 и M2070 / M2070Q OnlineVizWorld.com" . VizWorld.com . Проверено 11 декабря 2015 .
- ^ "Модуль двухслотового вычислительного процессора Tesla M2090" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Ускоритель Tesla K10 GPU" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Активный ускоритель Tesla K20 GPU" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Ускоритель Tesla K20 GPU" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Ускоритель Tesla K20X GPU" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Ускоритель Tesla K40 GPU" (PDF) . Nvidia.com . Проверено 11 декабря 2015 .
- ^ "Ускоритель Tesla K80 GPU" (PDF) . Images.nvidia.com . Проверено 11 декабря 2015 .
- ^ «Nvidia объявляет о выпуске серверных карт Tesla M40 и M4 - машинное обучение в центре обработки данных» . Anandtech.com . Проверено 11 декабря 2015 .
- ^ a b «Ускорение приложений гипермасштабируемых центров обработки данных с помощью графических процессоров Tesla | Parallel Forall» . Devblogs.nvidia.com . 10 ноября 2015 . Проверено 11 декабря 2015 .
- ^ "Тесла М6" (PDF) . Images.nvidia.com . Проверено 28 мая 2016 .
- ^ "Тесла М10" (PDF) . Images.nvidia.com . Проверено 29 октября +2016 .
- ^ "Тесла М40" (PDF) . Images.nvidia.com . Проверено 11 декабря 2015 .
- ^ "Тесла М60" (PDF) . Images.nvidia.com . Проверено 27 мая +2016 .
- ^ a b Смит, Райан (13 сентября 2016 г.). «Nvidia анонсирует Tesla P40 и Tesla P4 - Network Inference, Big & Small» . Anandtech . Проверено 13 сентября 2016 года .
- ^ "Тесла P6" (PDF) . www.nvidia.com . Проверено 7 марта 2019 .
- ^ "Технические характеристики Tesla P6" . www.techpowerup.com . Проверено 7 марта 2019 .
- ^ Смит, Райан (5 апреля 2016 г.). «Nvidia анонсирует ускоритель Tesla P100 - Pascal GP100 для высокопроизводительных вычислений» . Anandtech.com. Anandtech.com . Проверено 5 апреля 2016 года .
- ^ Харрис, Марк. «Внутри Паскаля: новейшая вычислительная платформа Nvidia» . Проверено 13 сентября 2016 года .
- ^ a b Смит, Райан (20 июня 2016 г.). «NVidia анонсирует PCI Express Tesla P100» . Anandtech.com . Проверено 21 июня +2016 .
- ^ a b Смит, Райан (10 мая 2017 г.). «Основной живой блог конференции по технологиям графических процессоров Nvidia 2017» . Anandtech . Дата обращения 10 мая 2017 .
- ^ a b Смит, Райан (10 мая 2017 г.). «Представлена NVIDIA Volta: анонсированы графический процессор GV100 и ускоритель Tesla V100» . Anandtech . Дата обращения 10 мая 2017 .
- ^ a b О, Нейт (20 июня 2017 г.). «NVIDIA официально объявляет о выпуске V100, который будет доступен позже в этом году» . Anandtech.com . Проверено 20 июня 2017 года .
- ^ "NVIDIA TESLA T4 TENSOR CORE GPU" . NVIDIA . Проверено 17 октября 2018 года .
- ^ «Краткое описание продукта NVIDIA Tesla T4 Tensor Core» (PDF) . www.nvidia.com . Проверено 10 июля 2019 .
- ^ "NVIDIA TESLA A100 TENSOR CORE GPU" . NVIDIA . Проверено 14 января 2021 года .
- ^ «Краткое описание продукта тензорного ядра NVIDIA Tesla A100» (PDF) . www.nvidia.com . Проверено 22 сентября 2020 .
Внешние ссылки [ править ]
Викискладе есть медиафайлы, связанные с серией Nvidia Tesla . |
- Графические процессоры NVIDIA для центров обработки данных
- Обзор продукта NVIDIA и краткое техническое описание
- Домашняя страница NVIDIA Tesla
- Nvidia Nsight