Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Автоматизированное машинное обучение ( AutoML ) - это процесс автоматизации процесса применения машинного обучения к реальным проблемам. AutoML охватывает весь конвейер от необработанного набора данных до развертываемой модели машинного обучения. AutoML был предложен как основанное на искусственном интеллекте решение постоянно растущей проблемы применения машинного обучения. [1] [2] Высокая степень автоматизации в AutoML позволяет неспециалистам использовать модели и методы машинного обучения, не требуя сначала стать экспертом в этой области.

Автоматизация процесса применения сквозного машинного обучения дополнительно предлагает преимущества создания более простых решений, более быстрого создания этих решений и моделей, которые часто превосходят модели, созданные вручную.

Сравнение со стандартным подходом [ править ]

В типичном приложении машинного обучения у практикующих есть набор входных данных для обучения. Необработанные данные могут быть не в той форме, в которой к ним можно применить все алгоритмы. Для того, чтобы данные Аменабельный для машинного обучения, специалисту , возможно , придется использовать соответствующую предварительную обработку данных , функцию инженерию , выделение признаков и выбору особенность методы. После этих шагов практикующие должны затем выполнить выбор алгоритма и оптимизацию гиперпараметров, чтобы максимизировать прогностическую эффективность своей модели. Все эти шаги создают проблемы, которые становятся серьезным препятствием для начала работы с машинным обучением.

AutoML значительно упрощает эти шаги для неспециалистов.

Цели автоматизации [ править ]

Автоматизированное машинное обучение может быть нацелено на различные этапы процесса машинного обучения. [2] Шаги по автоматизации:

  • Подготовка и прием данных (из необработанных данных и разных форматов)
    • Определение типа столбца ; например, логическое, дискретное числовое, непрерывное числовое или текстовое
    • Обнаружение цели столбца; например, цель / метка, поле стратификации , числовой признак, категориальный текстовый объект или объект произвольного текста.
    • Обнаружение задачи; например, двоичная классификация , регрессия , кластеризация или ранжирование
  • Функциональная инженерия
    • Выбор функции
    • Извлечение признаков
    • Мета-обучение и трансферное обучение
    • Обнаружение и обработка искаженных данных и / или отсутствующих значений
  • Выбор модели
  • Гиперпараметрическая оптимизация алгоритма обучения и характеристика
  • Выбор конвейера с учетом ограничений по времени, памяти и сложности
  • Выбор показателей оценки и процедур валидации
  • Проверка проблем
    • Обнаружение утечки
    • Обнаружение неправильной конфигурации
  • Анализ полученных результатов
  • Пользовательские интерфейсы и визуализации для автоматизированного машинного обучения

См. Также [ править ]

  • Поиск нейронной архитектуры
  • Нейроэволюция
  • Самонастройка
  • Интеллект нейронной сети
  • AutoAI
  • ModelOps

Ссылки [ править ]

  1. ^ Thornton C, Хуттер F, Hoos HH, Лейтон-Brown K (2013). Auto-WEKA: комбинированный выбор и гиперпараметрическая оптимизация алгоритмов классификации . KDD '13 Материалы 19-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. С. 847–855.
  2. ^ а б Хаттер Ф., Каруана Р., Барденет Р., Биленко М., Гайон И., Кегль Б. и Ларошель Х. «AutoML 2014 @ ICML» . Семинар AutoML 2014 @ ICML . Проверено 28 марта 2018 .

Дальнейшее чтение [ править ]

  • «Инструменты AutoML с открытым исходным кодом: AutoGluon, TransmogrifAI, Auto-sklearn и NNI» . Бизеты . 2020-06-16.

Внешние ссылки [ править ]

  • Документация по Azure ML - что такое AutoML? - Документация по облачному сервису Microsoft Azure
  • Google Cloud AutoML , решение AutoML на Google Cloud Platform
  • AutoAI с IBM Watson Studio : автоматизация подготовки данных, разработки моделей, проектирования функций и оптимизации гиперпараметров в IBM Watson Studio
  • Oracle AutoML Pipeline , документация Oracle Ускоренное Science Data (ADS) SDK, библиотека Python включены как часть Oracle Cloud Infrastructure Science Data службы