Извлечение признаков

В машинном обучении , распознавание образов и обработка изображений , извлечение признаков начинаются с начальным набором измеренных данных и строит полученные значения ( функцию ) предназначено , чтобы быть информативными и без резервирования, что облегчает последующие обучения и обобщение шагов, а в некоторых случаях ведущего к лучшим человеческим интерпретациям. Извлечение признаков связано с уменьшением размерности . ^[1]

Когда входные данные для алгоритма слишком велики для обработки и предполагается, что они избыточны (например, одно и то же измерение в футах и метрах или повторяемость изображений, представленных в виде пикселей ), тогда они могут быть преобразованы в сокращенный набор. из особенностей (также назван вектор признаков ). Определение подмножества исходных функций называется выбором функций . ^[2] Ожидается, что выбранные функции будут содержать релевантную информацию из входных данных, так что желаемая задача может быть выполнена с использованием этого сокращенного представления вместо полных исходных данных.

Общие [ править ]

Извлечение признаков предполагает сокращение количества ресурсов, необходимых для описания большого набора данных. При выполнении анализа сложных данных одна из основных проблем связана с количеством задействованных переменных. Анализ с большим количеством переменных обычно требует большого количества памяти и вычислительной мощности, а также может привести к тому, что алгоритм классификации переоценивается для обучающих выборок и плохо обобщается для новых выборок. Извлечение признаков - это общий термин для методов построения комбинаций переменных, позволяющих обойти эти проблемы, но при этом описывать данные с достаточной точностью. Многие практики машинного обучения считают, что правильно оптимизированное извлечение признаков является ключом к эффективному построению модели. ^[3]

Результаты могут быть улучшены с помощью сконструированных наборов зависимых от приложения функций, обычно создаваемых экспертом. Один из таких процессов называется функциональной инженерией . В качестве альтернативы используются общие методы уменьшения размерности, такие как:

Обработка изображений [ править ]

Одной из очень важных областей применения является обработка изображений , в которой используются алгоритмы для обнаружения и выделения различных желаемых частей или форм (характеристик) оцифрованного изображения или видеопотока . Это особенно важно в области оптического распознавания символов .

Реализации [ править ]

Многие программные пакеты для анализа данных обеспечивают извлечение признаков и уменьшение размеров. Распространенные среды численного программирования, такие как MATLAB , SciLab , NumPy , Sklearn и язык R, предоставляют некоторые из более простых методов извлечения признаков (например, анализ главных компонентов ) с помощью встроенных команд. Более конкретные алгоритмы часто доступны в виде общедоступных скриптов или сторонних надстроек. Существуют также программные пакеты, предназначенные для конкретных приложений машинного обучения, которые специализируются на извлечении функций. ^[4]

См. Также [ править ]

Кластерный анализ
Снижение размерности
Обнаружение функции
Выбор функции
Сбор данных
Маркировка подключенных компонентов
Сегментация (обработка изображений)
Картографирование космоса
Динамическая текстура
Радиомика

Ссылки [ править ]

^ Саранги, Сусанта; Сахидулла, штат Мэриленд; Саха, Гоутам (сентябрь 2020 г.). «Оптимизация набора фильтров на основе данных для автоматической проверки говорящего». Цифровая обработка сигналов . 104 : 102795. arXiv : 2007.10729 . DOI : 10.1016 / j.dsp.2020.102795 . S2CID 220665533 .
^ Alpaydin, Ethem (2010). Введение в машинное обучение . Лондон: MIT Press. п. 110. ISBN 978-0-262-01243-0. Проверено 4 февраля 2017 года .
^ «Все дело в особенностях» . Блог Reality AI . Сентябрь 2017 г.
^ См., Например, https://reality.ai/

Эта статья требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален.
Поиск источников: «Извлечение функций» - новости · газеты · книги · ученый · JSTOR ( январь 2016 г. ) ( Узнайте, как и когда удалить это сообщение-шаблон )

[1] Саранги, Сусанта; Сахидулла, штат Мэриленд; Саха, Гоутам (сентябрь 2020 г.). «Оптимизация набора фильтров на основе данных для автоматической проверки говорящего». Цифровая обработка сигналов . 104 : 102795. arXiv : 2007.10729 . DOI : 10.1016 / j.dsp.2020.102795 . S2CID 220665533 .

[alpaydin-2] Alpaydin, Ethem (2010). Введение в машинное обучение . Лондон: MIT Press. п. 110. ISBN 978-0-262-01243-0. Проверено 4 февраля 2017 года .

[3] «Все дело в особенностях» . Блог Reality AI . Сентябрь 2017 г.

[4] См., Например, https://reality.ai/

[1]