Эта статья поднимает множество проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалить эти сообщения-шаблоны ) ( Узнайте, как и когда удалить этот шаблон сообщения )
|
Часть серии по |
Машинное обучение и интеллектуальный анализ данных |
---|
Автоматизированное машинное обучение ( AutoML ) - это процесс автоматизации процесса применения машинного обучения к реальным проблемам. AutoML охватывает весь конвейер от необработанного набора данных до развертываемой модели машинного обучения. AutoML был предложен как основанное на искусственном интеллекте решение постоянно растущей проблемы применения машинного обучения. [1] [2] Высокая степень автоматизации в AutoML позволяет неспециалистам использовать модели и методы машинного обучения, не требуя сначала стать экспертом в этой области.
Автоматизация процесса применения сквозного машинного обучения дополнительно предлагает преимущества создания более простых решений, более быстрого создания этих решений и моделей, которые часто превосходят модели, созданные вручную.
Сравнение со стандартным подходом [ править ]
В типичном приложении машинного обучения у практикующих есть набор входных данных для обучения. Необработанные данные могут быть не в той форме, в которой к ним можно применить все алгоритмы. Для того, чтобы данные Аменабельный для машинного обучения, специалисту , возможно , придется использовать соответствующую предварительную обработку данных , функцию инженерию , выделение признаков и выбору особенность методы. После этих шагов практикующие должны затем выполнить выбор алгоритма и оптимизацию гиперпараметров, чтобы максимизировать прогностическую эффективность своей модели. Все эти шаги создают проблемы, которые становятся серьезным препятствием для начала работы с машинным обучением.
AutoML значительно упрощает эти шаги для неспециалистов.
Цели автоматизации [ править ]
Автоматизированное машинное обучение может быть нацелено на различные этапы процесса машинного обучения. [2] Шаги по автоматизации:
- Подготовка и прием данных (из необработанных данных и разных форматов)
- Определение типа столбца ; например, логическое, дискретное числовое, непрерывное числовое или текстовое
- Обнаружение цели столбца; например, цель / метка, поле стратификации , числовой признак, категориальный текстовый объект или объект произвольного текста.
- Обнаружение задачи; например, двоичная классификация , регрессия , кластеризация или ранжирование
- Функциональная инженерия
- Выбор функции
- Извлечение признаков
- Мета-обучение и трансферное обучение
- Обнаружение и обработка искаженных данных и / или отсутствующих значений
- Выбор модели
- Гиперпараметрическая оптимизация алгоритма обучения и характеристика
- Выбор конвейера с учетом ограничений по времени, памяти и сложности
- Выбор показателей оценки и процедур валидации
- Проверка проблем
- Обнаружение утечки
- Обнаружение неправильной конфигурации
- Анализ полученных результатов
- Пользовательские интерфейсы и визуализации для автоматизированного машинного обучения
См. Также [ править ]
- Поиск нейронной архитектуры
- Нейроэволюция
- Самонастройка
- Интеллект нейронной сети
- AutoAI
- ModelOps
Ссылки [ править ]
- ^ Thornton C, Хуттер F, Hoos HH, Лейтон-Brown K (2013). Auto-WEKA: комбинированный выбор и гиперпараметрическая оптимизация алгоритмов классификации . KDD '13 Материалы 19-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. С. 847–855.
- ^ а б Хаттер Ф., Каруана Р., Барденет Р., Биленко М., Гайон И., Кегль Б. и Ларошель Х. «AutoML 2014 @ ICML» . Семинар AutoML 2014 @ ICML . Проверено 28 марта 2018 .
Дальнейшее чтение [ править ]
- «Инструменты AutoML с открытым исходным кодом: AutoGluon, TransmogrifAI, Auto-sklearn и NNI» . Бизеты . 2020-06-16.
Внешние ссылки [ править ]
- Документация по Azure ML - что такое AutoML? - Документация по облачному сервису Microsoft Azure
- Google Cloud AutoML , решение AutoML на Google Cloud Platform
- AutoAI с IBM Watson Studio : автоматизация подготовки данных, разработки моделей, проектирования функций и оптимизации гиперпараметров в IBM Watson Studio
- Oracle AutoML Pipeline , документация Oracle Ускоренное Science Data (ADS) SDK, библиотека Python включены как часть Oracle Cloud Infrastructure Science Data службы