Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В машинном обучении , распознавание образов и обработка изображений , извлечение признаков начинаются с начальным набором измеренных данных и строит полученные значения ( функцию ) предназначено , чтобы быть информативными и без резервирования, что облегчает последующие обучения и обобщение шагов, а в некоторых случаях ведущего к лучшим человеческим интерпретациям. Извлечение признаков связано с уменьшением размерности . [1]

Когда входные данные для алгоритма слишком велики для обработки и предполагается, что они избыточны (например, одно и то же измерение в футах и ​​метрах или повторяемость изображений, представленных в виде пикселей ), тогда они могут быть преобразованы в сокращенный набор. из особенностей (также назван вектор признаков ). Определение подмножества исходных функций называется выбором функций . [2] Ожидается, что выбранные функции будут содержать релевантную информацию из входных данных, так что желаемая задача может быть выполнена с использованием этого сокращенного представления вместо полных исходных данных.

Общие [ править ]

Извлечение признаков предполагает сокращение количества ресурсов, необходимых для описания большого набора данных. При выполнении анализа сложных данных одна из основных проблем связана с количеством задействованных переменных. Анализ с большим количеством переменных обычно требует большого количества памяти и вычислительной мощности, а также может привести к тому, что алгоритм классификации переоценивается для обучающих выборок и плохо обобщается для новых выборок. Извлечение признаков - это общий термин для методов построения комбинаций переменных, позволяющих обойти эти проблемы, но при этом описывать данные с достаточной точностью. Многие практики машинного обучения считают, что правильно оптимизированное извлечение признаков является ключом к эффективному построению модели. [3]

Результаты могут быть улучшены с помощью сконструированных наборов зависимых от приложения функций, обычно создаваемых экспертом. Один из таких процессов называется функциональной инженерией . В качестве альтернативы используются общие методы уменьшения размерности, такие как:

Обработка изображений [ править ]

Одной из очень важных областей применения является обработка изображений , в которой используются алгоритмы для обнаружения и выделения различных желаемых частей или форм (характеристик) оцифрованного изображения или видеопотока . Это особенно важно в области оптического распознавания символов .

Реализации [ править ]

Многие программные пакеты для анализа данных обеспечивают извлечение признаков и уменьшение размеров. Распространенные среды численного программирования, такие как MATLAB , SciLab , NumPy , Sklearn и язык R, предоставляют некоторые из более простых методов извлечения признаков (например, анализ главных компонентов ) с помощью встроенных команд. Более конкретные алгоритмы часто доступны в виде общедоступных скриптов или сторонних надстроек. Существуют также программные пакеты, предназначенные для конкретных приложений машинного обучения, которые специализируются на извлечении функций. [4]

См. Также [ править ]

  • Кластерный анализ
  • Снижение размерности
  • Обнаружение функции
  • Выбор функции
  • Сбор данных
  • Маркировка подключенных компонентов
  • Сегментация (обработка изображений)
  • Картографирование космоса
  • Динамическая текстура
  • Радиомика

Ссылки [ править ]

  1. ^ Саранги, Сусанта; Сахидулла, штат Мэриленд; Саха, Гоутам (сентябрь 2020 г.). «Оптимизация набора фильтров на основе данных для автоматической проверки говорящего». Цифровая обработка сигналов . 104 : 102795. arXiv : 2007.10729 . DOI : 10.1016 / j.dsp.2020.102795 . S2CID  220665533 .
  2. ^ Alpaydin, Ethem (2010). Введение в машинное обучение . Лондон: MIT Press. п. 110. ISBN 978-0-262-01243-0. Проверено 4 февраля 2017 года .
  3. ^ «Все дело в особенностях» . Блог Reality AI . Сентябрь 2017 г.
  4. ^ См., Например, https://reality.ai/