Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

NVLink - это проводная последовательная многополосная линия связи ближнего действия, разработанная Nvidia . В отличие от PCI Express , устройство может состоять из нескольких каналов NVLink, и устройства используют ячеистую сеть для связи вместо центрального концентратора . Протокол был впервые анонсирован в марте 2014 года и использует запатентованное высокоскоростное межсоединение сигнализации (NVHS). [1]

Принцип [ править ]

NVLink - это протокол проводной связи для полупроводниковой связи ближнего действия, разработанный Nvidia, который можно использовать для передачи данных и управляющего кода в процессорных системах между CPU и GPU и только между GPU. NVLink определяет соединение точка-точка со скоростью передачи данных 20, 25 и 50 Гбит / с (v1.0 / v2.0 / v3.0 соответственно) на дифференциальную пару. Восемь дифференциальных пар образуют «подсвязь», а две «подсвязи», по одной для каждого направления, образуют «связь». Общая скорость передачи данных для канала составляет 25 Гбит / с, а общая скорость передачи данных для канала составляет 50 Гбит / с. Каждый графический процессор V100 поддерживает до шести ссылок. Таким образом, каждый графический процессор способен поддерживать общую двунаправленную полосу пропускания до 300 Гбит / с. [2] [3]Представленные на сегодняшний день продукты NVLink ориентированы на высокопроизводительные приложения. Анонсированный 14 мая 2020 г., NVLink 3.0 увеличивает скорость передачи данных на дифференциальную пару с 25 Гбит / с до 50 Гбит / с, в то же время уменьшая вдвое количество пар на NVLink с 8 до 4. Благодаря 12 каналам для графического процессора A100 на базе Ampere это дает общая пропускная способность до 600 ГБ / сек. [4]

Производительность [ править ]

В следующей таблице показано сравнение основных показателей на основе стандартных спецификаций:

В следующей таблице показано сравнение соответствующих параметров шины для реальных полупроводников, которые все предлагают NVLink в качестве одной из своих опций:

Примечание . Столбцы скорости передачи данных были округлены, приближенные к скорости передачи, см. Параграф о реальных характеристиках.

: значение выборки; Возможно объединение подканалов NVLink
: значение выборки; другие доли для использования полосы PCIe должны быть возможны
: одна (нет! 16) дорожка PCIe передает данные по дифференциальной паре
: могут применяться различные ограничения окончательно возможных комбинаций из-за мультиплексирования выводов микросхемы и конструкции платы
dual : интерфейсный блок может быть настроен как корневой концентратор или как конечная точка
общий : неизолированный полупроводник без каких-либо ограничений, связанных с конструкцией платы

Реальная производительность может быть определена путем применения различных налогов на инкапсуляцию, а также скорости использования. Они поступают из разных источников:

  • Линейный код 128b / 130b (см., Например, передача данных PCI Express для версий 3.0 и выше)
  • Связать управляющие символы
  • Заголовок транзакции
  • Возможности буферизации (зависит от устройства)
  • Использование DMA на стороне компьютера (зависит от другого программного обеспечения, обычно незначительно в тестах)

Эти физические ограничения обычно снижают скорость передачи данных до 90–95% от скорости передачи. Тесты NVLink показывают достижимую скорость передачи около 35,3 Гбит / с (от хоста к устройству) для подключения NVLink 40 Гбит / с (2 дополнительных канала восходящей линии связи) к графическому процессору P100 в системе, управляемой набором процессоров IBM Power8. . [29]

Использование с дополнительными платами [ править ]

Для различных версий сменных плат (пока существует небольшое количество высокопроизводительных игровых и профессиональных графических графических плат с этой функцией), которые предоставляют дополнительные разъемы для объединения их в группу NVLink, такое же количество слегка различающихся, относительно компактных , Соединительные штекеры на основе печатных плат существуют. Обычно из-за их физической и логической конструкции сопрягаться вместе могут только платы одного типа. Для некоторых установок необходимо использовать два идентичных разъема для достижения полной скорости передачи данных. На данный момент типичный штекер имеет U-образную форму с соединителем на краю тонкой решетки на каждом из крайних штрихов формы, обращенным в сторону от зрителя.Ширина разъема определяет, на каком расстоянии от основной платы хостинговой компьютерной системы должны быть установлены сменные карты - расстояние для размещения карты обычно определяется подходящим разъемом (известная доступная ширина разъема составляет 3 до 5 слотов и также зависят от типа платы).[30] [31] Межсоединение с 2004 годачасто называют SLI (Scalable Link Interface) из-за его структурной конструкции и внешнего вида, даже если современный дизайн на основе NVLink имеет совершенно иную техническую природу с другими функциями на базовых уровнях по сравнению с прежний дизайн. Сообщается о реальных устройствах: [32]

  • Quadro GP100 (пара карт будет использовать до 2 мостов; [33] установка реализует 2 или 4 соединения NVLink со скоростью до 160 ГБ / с [34] - это может напоминать NVLink 1.0 с 20 ГТ / с)
  • Quadro GV100 (для пары карт потребуется до 2 мостов и скорость до 200 ГБ / с [30] - это может напоминать NVLink 2.0 с 25 ГТ / с и 4 связями)
  • GeForce RTX 2080 на базе TU104 (с одинарным мостом «GeForce RTX NVLink-Bridge» [35] )
  • GeForce RTX 2080 Ti на базе TU102 (с одинарным мостом «GeForce RTX NVLink-Bridge» [31] )
  • Quadro RTX 5000 [36] на базе TU104 [37] (с одним мостом "NVLink" до 50 ГБ / с [38] - это может напоминать NVLink 2.0 с 25 ГТ / с и 1 линком)
  • Quadro RTX 6000 [36] на базе TU102 [37] (с одним мостом «NVLink HB» до 100 ГБ / с [38] - это может напоминать NVLink 2.0 с 25 ГТ / с и 2 связями)
  • Quadro RTX 8000 [36] на базе TU102 [39] (с одним мостом «NVLink HB» до 100 ГБ / с [38] - это может напоминать NVLink 2.0 с 25 ГТ / с и 2 связями)

Сервисное ПО и программирование [ править ]

Для продуктовых линеек Tesla, Quadro и Grid NVML-API (API библиотеки управления Nvidia) предлагает набор функций для программного управления некоторыми аспектами межсоединений NVLink в системах Windows и Linux, таких как оценка компонентов и их версии, а также статус / ошибка. запросы и мониторинг производительности. [40] Кроме того, с предоставлением библиотеки NCCL (Nvidia Collective Communications Library) разработчики в публичном пространстве должны иметь возможность реализовать, например, мощные реализации для искусственного интеллекта и аналогичные требовательные к вычислениям темы поверх NVLink. [41] Страница «Настройки 3D» »« Настроить SLI, Surround, PhysX »в панели управления Nvidia и CUDAпример приложения "simpleP2P" использует такие API-интерфейсы для реализации своих услуг в отношении их функций NVLink. На платформе Linux приложение командной строки с подкомандой «nvidia-smi nvlink» предоставляет аналогичный набор расширенной информации и управления. [32]

История [ править ]

5 апреля 2016 года Nvidia объявила, что NVLink будет реализован в графическом процессоре GP100 на основе микроархитектуры Pascal, который используется, например, в продуктах Nvidia Tesla P100. [42] С появлением высокопроизводительной компьютерной базы DGX-1 стало возможным иметь до восьми модулей P100 в одной стоечной системе, подключенной максимум к двум центральным процессорам. Несущая плата (...) позволяет использовать специальную плату для маршрутизации соединений NVLink - каждому P100 требуется 800 контактов, 400 для питания PCIe + и еще 400 для NVLink, что в сумме дает почти 1600 трассировок платы только для NVLink (. ..). [43]Каждый ЦП имеет прямое соединение с 4 модулями P100 через PCIe, и каждый P100 имеет по одному каналу NVLink к 3 другим P100 в той же группе ЦП плюс еще один канал NVLink к одному P100 в другой группе ЦП. Каждый NVLink (интерфейс связи) предлагает двунаправленную скорость 20 ГБ / сек вверх, 20 ГБ / сек вниз, с 4 связями на каждый графический процессор GP100, для совокупной пропускной способности 80 ГБ / сек вверх и еще 80 ГБ / сек вниз. [44]NVLink поддерживает маршрутизацию, так что в проекте DGX-1 для каждого P100 в общей сложности 4 из 7 других P100 доступны напрямую, а остальные 3 доступны только с одним прыжком. Согласно описаниям в блогах Nvidia, с 2014 года NVLink позволяет объединять отдельные ссылки для повышения производительности точка-точка, так что, например, дизайн с двумя P100 и всеми связями, установленными между двумя устройствами, обеспечит полную пропускную способность NVLink в 80 ГБ. / с между ними. [45]

На GTC2017 Nvidia представила свое поколение графических процессоров Volta и указала на интеграцию пересмотренной версии 2.0 NVLink, которая обеспечит общую скорость ввода-вывода 300 ГБ / с для одного чипа для этой конструкции, а также объявила о возможности предварительной - заказы с обещанием поставки на 3 квартал 2017 года высокопроизводительных компьютеров DGX-1 и DGX-Station, которые будут оснащены модулями графического процессора типа V100 и NVLink 2.0, реализованными либо в сети (две группы по четыре модуля V100 с внутренними -групповое соединение) или полностью взаимосвязанный вариант одной группы из четырех модулей V100.

В 2017–2018 годах IBM и Nvidia поставили суперкомпьютеры Summit и Sierra для Министерства энергетики США [46], которые объединяют в себе семейство процессоров IBM POWER9 и архитектуру Volta от Nvidia , используя NVLink 2.0 для межкомпонентных соединений CPU-GPU и GPU-GPU и InfiniBand. EDR для системных межсоединений. [47]

См. Также [ править ]

  • Intel QuickPath Interconnect
  • Гипертранспорт
  • Интерфейс передачи сообщений
  • INK (операционная система)
  • Вычислительный узел Linux

Ссылки [ править ]

  1. ^ Nvidia NVLINK 2.0 появится на серверах IBM в следующем году , Джон Уоррел на fudzilla.com, 24 августа 2016 г.
  2. ^ «NVIDIA DGX-1 с системной архитектурой Tesla V100» (PDF) .
  3. ^ "Что такое NVLink?" . Nvidia. 2014-11-14.
  4. Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель» . AnandTech.
  5. ^ a b «PCIe - PCI Express (1.1 / 2.0 / 3.0 / 4.0 / 5.0)» . www.elektronik-kompendium.de .
  6. Январь 2019, Пол Алкорн 17. «PCIe 5.0 готов к работе» . Оборудование Тома .
  7. ^ онлайн, heise. «NVIDIA Tesla P100 [SXM2], 16 ГБ HBM2 (NVTP100-SXM) | heise online Preisvergleich / Deutschland» . geizhals.de .
  8. ^ онлайн, heise. «PNY Tesla P100 [PCIe], 16 ГБ HBM2 (TCSP100M-16GB-PB / NVTP100-16) ab 4990,00 евро (2020) | heise online Preisvergleich / Deutschland» . geizhals.de .
  9. ^ NVLink выводит ускорение графического процессора на новый уровень , Тимоти Прикетт Морган, nextplatform.com, 4 мая 2016 г.
  10. ^ "Технические характеристики NVIDIA Tesla V100 SXM2 16 ГБ" . TechPowerUp .
  11. ^ онлайн, heise. «PNY Quadro GV100, 32 ГБ HBM2, 4x DP (VCQGV100-PB) ab 10199,00 евро (2020) | heise online Preisvergleich / Deutschland» . geizhals.de .
  12. ^ a b c Tegra Xavier - Nvidia на wikichip.org
  13. ^ РУКОВОДСТВО ПО АДАПТАЦИИ И ОБНОВЛЕНИЮ ПЛАТФОРМЫ JETSON AGX XAVIER «Функции контроллера Tegra194 PCIe» на стр. 14; хранится на arrow.com
  14. ^ Как включить слот PCIe x2 с помощью Xavier? на devtalk.nvidia.com
  15. ^ Презентация вебинара POWER9 от IBM для Power Systems VUG , Джефф Стучели, 26 января 2017 г.
  16. ^ a b Морган, Тимоти Прикетт (14 мая 2020 г.). «Nvidia объединяет вычисления на основе искусственного интеллекта с графическим процессором Ampere» . Следующая платформа .
  17. ^ a b "Технические данные" (PDF) . www.nvidia.com . Проверено 15 сентября 2020 .
  18. ^ https://www.nvidia.com/content/dam/en-zz/Solutions/geforce/ampere/pdf/NVIDIA-ampere-GA102-GPU-Architecture-Whitepaper-V1.pdf
  19. Все на шине PCIe для суперкомпьютера Tesla P100 от Nvidia, ворчание Криса Уильямса на сайте theregister.co.uk 20 июня 2016 г.
  20. ^ Hicok, Гэри (13 ноября 2018). «NVIDIA Xavier достигает вехи в безопасном вождении автомобиля | Блог NVIDIA» . Официальный блог NVIDIA .
  21. ^ онлайн, heise. «Nvidia Tesla V100: PCIe-Steckkarte mit Volta-Grafikchip и 16 GByte Speicher angekündigt» . heise онлайн .
  22. ^ Блок-схема GV100 в "GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2" Андреаса Шиллинга на hardwareluxx.de 10 мая 2017 г.
  23. ^ Чип NVIDIA Volta GV100 GPU для суперкомпьютера Summit в два раза быстрее, чем Pascal P100 - Хасан Муджтаба на wccftech.com, 20 декабря 2016 г., предположил, что он достигнет производительности 9,5 терафлопс в режиме FP64.
  24. ^ «Технический обзор» (PDF) . images.nvidia.com . Проверено 15 сентября 2020 .
  25. ^ a b Анджелини, Крис (14 сентября 2018 г.). «Изучение архитектуры Тьюринга от Nvidia: внутри GeForce RTX 2080» . Оборудование Тома . п. 7 . Проверено 28 февраля 2019 . TU102 и TU104 - первые графические процессоры Nvidia для настольных ПК, использующие межсоединение NVLink, а не интерфейс множественного ввода / вывода (MIO) для поддержки SLI. Первый делает доступными две ссылки x8, а второй ограничен одной. Каждый канал обеспечивает двунаправленную пропускную способность до 50 ГБ / с. Итак, GeForce RTX 2080 Ti может передавать до 100 ГБ / с между картами, а RTX 2080 может делать половину этого.
  26. ^ https://www.hardwareluxx.de/index.php/news/hardware/grafikkarten/53450-a100-pcie-nvidia-ga100-gpu-kommt-auch-als-pci-express-variante.html
  27. ^ https://www.nvidia.com/content/dam/en-zz/Solutions/geforce/ampere/pdf/NVIDIA-ampere-GA102-GPU-Architecture-Whitepaper-V1.pdf
  28. ^ "NVLINK И NVSWITCH" . www.nvidia.com . Проверено 7 февраля 2021 .
  29. ^ Сравнение NVLink и PCI-E с графическими процессорами NVIDIA Tesla P100 на серверах OpenPOWER Элиот Эшельман на microway.com 26 января 2017 г.
  30. ^ a b "NVIDIA Quadro NVLink Grafikprozessor-Zusammenschaltung в Hochgeschwindigkeit" . NVIDIA .
  31. ^ a b «График новой карты: NVIDIA GeForce RTX 2080 Ti-Grafikkarte» . NVIDIA .
  32. ^ a b «NVLink на NVIDIA GeForce RTX 2080 и 2080 Ti в Windows 10» . Пьюджет Системс .
  33. ^ [1] [ неработающая ссылка ]
  34. ^ Шиллинг, Андреас. «NVIDIA предлагает Quadro GP100 с GP100-GPU и 16 ГБ HBM2» . Hardwareluxx .
  35. ^ «Графическая карта NVIDIA GeForce RTX 2080 Founders Edition» . NVIDIA .
  36. ^ a b c «Графические карты NVIDIA Quadro для профессиональных дизайнерских рабочих станций» . NVIDIA .
  37. ^ a b «NVIDIA Quadro RTX 6000 и RTX 5000 готовы для предварительного заказа» . 1 октября 2018 г.
  38. ^ a b c "NVLink | pny.com" . www.pny.com .
  39. ^ «Технические характеристики NVIDIA Quadro RTX 8000» . TechPowerUp .
  40. ^ «Методы NvLink» . docs.nvidia.com .
  41. ^ "Библиотека коллективных коммуникаций NVIDIA (NCCL)" . Разработчик NVIDIA . 10 мая 2017 года.
  42. ^ «Внутри Паскаля: новейшая вычислительная платформа NVIDIA» . 2016-04-05.
  43. ^ Anandtech.com
  44. ^ NVIDIA представляет сервер HPC DGX-1: 8 Teslas, 3U, второй квартал 2016 г., сайт anandtech.com, апрель 2016 г.
  45. ^ Как NVLink обеспечит более быстрые и простые вычисления на нескольких GPU , Марк Харрис, 14 ноября 2014 г.
  46. ^ «Белая книга: суперкомпьютеры Summit и Sierra» (PDF) . 2014-11-01.
  47. ^ "Nvidia Volta, Земельные контракты IBM POWER9 для новых суперкомпьютеров правительства США" . AnandTech . 2014-11-17.