Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Apache MXNet - это программная среда с открытым исходным кодом для глубокого обучения , используемая для обучения и развертывания глубоких нейронных сетей . Он масштабируемый, что позволяет быстро обучать модели и поддерживает гибкую модель программирования и несколько языков программирования (включая C ++ , Python , Java , Julia , Matlab , JavaScript , Go , R , Scala , Perl и Wolfram Language ).

MXNet библиотека является портативным и может масштабироваться до нескольких графических процессоров [2] и несколько машин. MXNet поддерживается поставщиками общедоступного облака , включая Amazon Web Services (AWS) [3] и Microsoft Azure . [4] Amazon выбрала MXNet в качестве предпочитаемой платформы глубокого обучения в AWS. [5] [6] В настоящее время MXNet поддерживается Intel , Baidu , Microsoft , Wolfram Research и исследовательскими институтами, такими как Carnegie Mellon , MIT., Вашингтонский университет и Гонконгский университет науки и технологий . [7] Он был разработан Карлосом Гестрином из Вашингтонского университета (вместе с GraphLab). [8]

Особенности [ править ]

Apache MXNet - это компактная, гибкая и ультра-масштабируемая среда глубокого обучения, которая поддерживает самые современные модели глубокого обучения, включая сверточные нейронные сети (CNN) и сети с долговременной краткосрочной памятью (LSTM).

Масштабируемый [ править ]

MXNet разработан для распределения в динамической облачной инфраструктуре с использованием сервера распределенных параметров (на основе исследований в Университете Карнеги-Меллона , Baidu и Google [9] ) и может достигать почти линейного масштабирования с использованием нескольких графических процессоров или процессоров .

Гибкий [ править ]

MXNet поддерживает как императивное, так и символьное программирование, что упрощает разработчикам, привыкшим к императивному программированию, начало работы с глубоким обучением. Это также упрощает отслеживание, отладку, сохранение контрольных точек, изменение гиперпараметров , таких как скорость обучения, или выполнение ранней остановки .

Несколько языков [ править ]

Поддерживает C ++ для оптимизированного внутреннего интерфейса, чтобы максимально использовать доступный графический процессор или процессор, а также Python, R, Scala, Clojure, Julia, Perl, MATLAB и JavaScript для простого внешнего интерфейса для разработчиков.

Портативный [ править ]

Поддерживает эффективное развертывание обученной модели на низкоуровневых устройствах для вывода, таких как мобильные устройства (с использованием Amalgamation [10] ), устройства Интернета вещей (с использованием AWS Greengrass), бессерверные вычисления (с использованием AWS Lambda ) или контейнеры . Эти низкоуровневые среды могут иметь только более слабый ЦП или ограниченную память (ОЗУ) и должны иметь возможность использовать модели, которые были обучены в среде более высокого уровня (например, кластер на основе графического процессора).

См. Также [ править ]

  • Сравнение программного обеспечения для глубокого обучения
  • Дифференцируемое программирование

Ссылки [ править ]

  1. ^ "Выпуск 1.7.0" . 25 августа 2020 . Дата обращения 6 сентября 2020 .
  2. ^ «Построение глубоких нейронных сетей в облаке с помощью виртуальных машин Azure GPU, MXNet и Microsoft R Server» . Дата обращения 13 мая 2017 .
  3. ^ «Apache MXNet на AWS - глубокое обучение в облаке» . Amazon Web Services, Inc . Дата обращения 13 мая 2017 .
  4. ^ «Построение глубоких нейронных сетей в облаке с помощью виртуальных машин Azure GPU, MXNet и Microsoft R Server» . Блоги Microsoft TechNet . Проверено 6 сентября 2017 года .
  5. ^ «MXNet - предпочтительная структура глубокого обучения в AWS - Распределение всех вещей» . www.allthingsdistributed.com . Дата обращения 13 мая 2017 .
  6. ^ «Amazon выбрала эту структуру для руководства стратегией глубокого обучения» . Удача . Дата обращения 13 мая 2017 .
  7. ^ «MXNet, платформа глубокого обучения Amazon, будет принята в Apache Incubator» . Проверено 8 марта 2017 .
  8. ^ https://homes.cs.washington.edu/~guestrin/open-source.html
  9. ^ «Масштабирование распределенного машинного обучения с помощью сервера параметров» (PDF) . Проверено 8 октября 2014 .
  10. ^ «Объединение» . Архивировано из оригинала на 2018-08-08 . Проверено 8 мая 2018 .