Размерность Вапника — Червоненкиса


Размерность Вапника — Червоненкиса или VC-размерность — это характеристика семейства алгоритмов для решения задачи классификации с двумя классами, характеризующая сложность или ёмкость этого семейства. Это одно из ключевых понятий в теории Вапника-Червоненкиса о статистическом машинном обучении, названное в честь Владимира Вапника и Алексея Червоненкиса.

Сами Вапник и Червоненкис предпочитают называть эту величину комбинаторной размерностью, так как выяснилось, она была известна алгебраистам еще до открытия их теории машинного обучения.

Пусть задано множество и некоторое семейство индикаторных функций (алгоритмов классификации, решающих правил) , где  — аргумент функций,  — вектор параметров, задающий функцию. Каждая такая функция сопоставляет каждому элементу множества один из двух заданных классов. VC-размерностью семейства называется наибольшее число , такое, что существует подмножество из элементов множества , которые функции из могут разбить на два класса всеми возможными способами. Если же такие подмножества существуют для сколь угодно большого , то VC-размерность полагается равной бесконечности.

VC-размерность можно обобщить и на случай семейства функций , принимающих действительные значения. Его VC-размерность определяется как VC-размерность семейства индикаторных функций , где пробегает область значений функций .[1]