Функция (машинное обучение)

В машинного обучения и распознавания образов , А функция является индивидуальным измеримое свойство или характеристика феномена наблюдается. ^[1] Выбор информативных, различающих и независимых признаков является решающим шагом для эффективных алгоритмов распознавания , классификации и регрессии . Функции обычно числовые, но при распознавании синтаксических образов используются такие структурные элементы, как строки и графики . Понятие «признак» связано с понятием объясняющей переменной, используемой в статистических такие методы, как линейная регрессия .

Классификация [ править ]

Набор числовых признаков можно удобно описать вектором признаков. Одним из способов достижения двоичной классификации является использование функции линейного предиктора (связанной с перцептроном ) с вектором признаков в качестве входных данных. Метод состоит из вычисления скалярного произведения между вектором признаков и вектором весов, сравнения результата с порогом и определения класса на основе сравнения.

Алгоритмы классификации на основе вектора признаков включают классификацию ближайшего соседа , нейронные сети и статистические методы, такие как байесовские подходы .

Примеры [ править ]

При распознавании символов функции могут включать гистограммы, подсчитывающие количество черных пикселей по горизонтали и вертикали, количество внутренних отверстий, обнаружение штрихов и многие другие.

В распознавании речи функции распознавания фонем могут включать в себя коэффициенты шума, длину звуков, относительную мощность, соответствие фильтрам и многие другие.

В алгоритмах обнаружения спама функции могут включать наличие или отсутствие определенных заголовков электронной почты, структуру электронной почты, язык, частоту использования определенных терминов, грамматическую правильность текста.

В компьютерном зрении существует большое количество возможных функций , таких как края и объекты.

Расширения [ править ]

В распознавании и машинного обучения , вектор признаков является п-мерный вектор числовых функций , которые представляют какой - либо объект. Многие алгоритмы машинного обучения требуют числового представления объектов, поскольку такие представления облегчают обработку и статистический анализ. При представлении изображений значения признаков могут соответствовать пикселям изображения, тогда как при представлении текстов признаками могут быть частоты встречаемости текстовых терминов. Векторы признаков эквивалентны векторам независимых переменных, используемых в статистических процедурах, таких как линейная регрессия.. Векторы признаков часто комбинируются с весами с использованием скалярного произведения , чтобы построить функцию линейного предсказания, которая используется для определения оценки для составления прогноза.

Векторное пространство , связанное с этими векторами часто называют особенность пространством . Чтобы уменьшить размерность пространства признаков, можно использовать ряд методов уменьшения размерности .

Возможности более высокого уровня могут быть получены из уже имеющихся функций и добавлены в вектор признаков; например, для изучения болезней полезна функция «Возраст», которая определяется как Возраст = «Год смерти» минус «Год рождения» . Этот процесс называется конструированием признаков . ^[2]^[3] Построение признаков - это применение набора конструктивных операторов к набору существующих функций, в результате чего создаются новые функции. Примеры таких конструктивных операторов включают проверку условий равенства {=, ≠}, арифметических операторов {+, -, ×, /}, операторов массива {max (S), min (S), среднего (S)} как а также другие более сложные операторы, например count (S, C) ^[4]который подсчитывает количество признаков в векторе признаков S, удовлетворяющих некоторому условию C, или, например, расстояния до других классов распознавания, обобщенные некоторым принимающим устройством. Построение признаков долгое время считалось мощным инструментом для повышения точности и понимания структуры, особенно в задачах большой размерности. ^[5] Приложения включают исследования распознавания болезней и эмоций по речи. ^[6]

Выбор и извлечение [ править ]

Первоначальный набор необработанных функций может быть избыточным и слишком большим для управления. Поэтому предварительный шаг во многих приложениях машинного обучения и распознавания образов состоит из выбора подмножества функций или создания нового сокращенного набора функций для облегчения обучения и улучшения обобщения и интерпретируемости ^{[ необходима цитата ]} .

Извлечение или выбор функций - это сочетание искусства и науки; разработка систем для этого известна как разработка функций . Это требует экспериментов с множеством возможностей и комбинации автоматизированных методов с интуицией и знаниями специалиста в предметной области . Автоматизация этого процесса - это изучение функций , когда машина не только использует функции для обучения, но и сама изучает функции.

См. Также [ править ]

Ковариантный
Снижение размерности
Функциональная инженерия
Уловка хеширования
Статистическая классификация
Объяснимый искусственный интеллект

Ссылки [ править ]

↑ Епископ, Кристофер (2006). Распознавание образов и машинное обучение . Берлин: Springer. ISBN 0-387-31073-8.
^ Лю, Х., Мотода Х. (1998) Выбор функций для обнаружения знаний и интеллектуального анализа данных . , Kluwer Academic Publishers. Норвелл, Массачусетс, США. 1998 г.
^ Пирамуту, С., Сикора Р.Т. Конструирование итерационных функций для улучшения алгоритмов индуктивного обучения . В журнале экспертных систем с приложениями. Vol. 36, вып. 2 (март 2009 г.), стр. 3401-3406, 2009 г.
^ Bloedorn, E., Michalski, R. Конструктивная индукция, управляемая данными: методология и ее приложения. Интеллектуальные системы IEEE, специальный выпуск о преобразовании признаков и выборе подмножества, стр. 30-37, март / апрель 1998 г.
^ Брейман, Л. Фридман, Т., Олшен, Р., Стоун, К. (1984) Деревья классификации и регрессии , Уодсворт
^ Сидорова, Дж., Бадиа Т. Синтаксическое обучение для ESEDA.1, инструмент для расширенного обнаружения и анализа речевых эмоций . Конференция по Интернет-технологиям и защищенным сделкам 2009 г. (ICITST-2009), Лондон, 9–12 ноября. IEEE

Эта статья требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален.
Поиск источников: «Feature» машинного обучения - новости · газеты · книги · научный сотрудник · JSTOR ( декабрь 2014 г. ) ( Узнайте, как и когда удалить это сообщение-шаблон )

[ml-1] Епископ, Кристофер (2006). Распознавание образов и машинное обучение . Берлин: Springer. ISBN 0-387-31073-8.

[Liu1998-2] Лю, Х., Мотода Х. (1998) Выбор функций для обнаружения знаний и интеллектуального анализа данных . , Kluwer Academic Publishers. Норвелл, Массачусетс, США. 1998 г.

[Piramithu2009-3] Пирамуту, С., Сикора Р.Т. Конструирование итерационных функций для улучшения алгоритмов индуктивного обучения . В журнале экспертных систем с приложениями. Vol. 36, вып. 2 (март 2009 г.), стр. 3401-3406, 2009 г.

[bloedorn1998-4] Bloedorn, E., Michalski, R. Конструктивная индукция, управляемая данными: методология и ее приложения. Интеллектуальные системы IEEE, специальный выпуск о преобразовании признаков и выборе подмножества, стр. 30-37, март / апрель 1998 г.

[breinman1984-5] Брейман, Л. Фридман, Т., Олшен, Р., Стоун, К. (1984) Деревья классификации и регрессии , Уодсворт

[Sidorova2009-6] Сидорова, Дж., Бадиа Т. Синтаксическое обучение для ESEDA.1, инструмент для расширенного обнаружения и анализа речевых эмоций . Конференция по Интернет-технологиям и защищенным сделкам 2009 г. (ICITST-2009), Лондон, 9–12 ноября. IEEE

[1]