Линейная отделимость

В евклидовой геометрии , линейная разделимость является свойством двух наборов точек . Это легче всего визуализировать в двух измерениях ( евклидова плоскость ), считая, что один набор точек окрашен в синий цвет, а другой набор точек - в красный. Эти два набора линейно разделимы, если существует хотя бы одна линия на плоскости со всеми синими точками на одной стороне и всеми красными точками на другой стороне. Эта идея немедленно распространяется на евклидовы пространства более высокой размерности, если прямая заменяется гиперплоскостью .

Наличие линии, разделяющей точки двух типов, означает, что данные линейно разделимы.

Проблема определения, является ли пара наборов линейно разделимой, и поиска разделяющей гиперплоскости, если они есть, возникает в нескольких областях. В статистике и машинном обучении классификация определенных типов данных является проблемой, для которой существуют хорошие алгоритмы, основанные на этой концепции.

Математическое определение

Позволять ${\ displaystyle X_ {0}}$ а также ${\ displaystyle X_ {1}}$ - два набора точек в n- мерном евклидовом пространстве. потом ${\ displaystyle X_ {0}}$ а также ${\ displaystyle X_ {1}}$ являются линейно разделимы , если существует п + 1 действительных чисел ${\ displaystyle w_ {1}, w_ {2}, .., w_ {n}, k}$ , так что каждая точка ${\ Displaystyle х \ в X_ {0}}$ удовлетворяет ${\ displaystyle \ sum _ {я = 1} ^ {n} w_ {i} x_ {i}> k}$ и каждая точка ${\ Displaystyle х \ в X_ {1}}$ удовлетворяет ${\ Displaystyle \ сумма _ {я = 1} ^ {п} ш_ {я} х_ {я} <к}$ , где ${\ displaystyle x_ {i}}$ это ${\ displaystyle i}$ -й компонент ${\ displaystyle x}$ .

Эквивалентно, два набора линейно разделимы именно тогда, когда их соответствующие выпуклые оболочки не пересекаются (в просторечии не перекрываются). ^{[ необходима цитата ]}

Примеры

Три неколлинеарных точки в двух классах («+» и «-») всегда линейно разделимы в двух измерениях. Это проиллюстрировано тремя примерами на следующем рисунке (случай "+" не показан, но аналогичен случаю "-"):

Однако не все наборы из четырех точек, ни три коллинеарных, линейно разделимы в двух измерениях. В следующем примере потребуются две прямые линии, поэтому его нельзя разделить линейно:

Обратите внимание, что три точки, которые коллинеарны и имеют форму «+ ⋅⋅⋅ - ⋅⋅⋅ +», также не являются линейно разделимыми.

Линейная разделимость булевых функций от n переменных

Функции булева в п переменных можно рассматривать как присвоение 0 или 1 в каждую вершину булева гиперкуба в п измерений. Это дает естественное разделение вершин на два множества. Булева функция называется линейно разделимой, если эти два набора точек линейно разделимы. Количество различных булевых функций равно ${\ displaystyle 2 ^ {2 ^ {n}}}$ где n - количество переменных, переданных в функцию. ^[1]

Количество линейно разделимых булевых функций в каждом измерении ^[2] (последовательность A000609 в OEIS )
Количество переменных	Логические функции	Линейно разделимые булевы функции
2	16	14
3	256	104
4	65536	1882 г.
5	4294967296	94572
6	18446744073709552000	15028134
7	3,402823669 × 10 ^ 38	8378070864
8	1,157920892 × 10 ^ 77	17561539552946
9	1,340780792 × 10 ^ 154	144130531453121108

Опорные векторные машины

H ₁ не разделяет наборы. H ₂ делает, но только с небольшим запасом. H ₃ разделяет их с максимальным запасом.

Классификация данных - обычная задача машинного обучения . Предположим, что даны некоторые точки данных, каждая из которых принадлежит одному из двух наборов, и мы хотим создать модель, которая будет решать, в каком наборе будет находиться новая точка данных. В случае машин опорных векторов точка данных рассматривается как p -мерный вектор (список из p чисел), и мы хотим знать, можем ли мы разделить такие точки с помощью ( p - 1) -мерной гиперплоскости . Это называется линейным классификатором . Есть много гиперплоскостей, которые могут классифицировать (разделять) данные. Один разумный выбор в качестве лучшей гиперплоскости - это та, которая представляет наибольшее разделение или запас между двумя наборами. Поэтому мы выбираем гиперплоскость так, чтобы расстояние от нее до ближайшей точки данных с каждой стороны было максимальным. Если такая гиперплоскость существует, она называется гиперплоскостью с максимальным запасом, а определяемый ею линейный классификатор называется классификатором максимального поля .

Более формально, учитывая некоторые данные обучения ${\ displaystyle {\ mathcal {D}}}$ , набор из n точек вида

{\ Displaystyle {\ mathcal {D}} = \ left \ {(\ mathbf {x} _ {i}, y_ {i}) \ mid \ mathbf {x} _ {i} \ in \ mathbb {R} ^ {p}, \, y_ {i} \ in \ {- 1,1 \} \ right \} _ {i = 1} ^ {n}}

где y _i равно 1 или -1, что указывает на набор, к которому точка ${\ Displaystyle \ mathbf {х} _ {я}}$ принадлежит. Каждый ${\ Displaystyle \ mathbf {х} _ {я}}$ является p -мерным вещественным вектором. Мы хотим найти гиперплоскость с максимальным запасом, которая разделяет точки, имеющие ${\ displaystyle y_ {i} = 1}$ от тех, у кого есть ${\ displaystyle y_ {i} = - 1}$ . Любую гиперплоскость можно записать как набор точек ${\ displaystyle \ mathbf {x}}$ удовлетворение

{\ Displaystyle \ mathbf {w} \ cdot \ mathbf {x} -b = 0,}

где ${\ displaystyle \ cdot}$ обозначает скалярное произведение, а ${\ displaystyle {\ mathbf {w}}}$ (не обязательно нормализованный) нормальный вектор к гиперплоскости. Параметр ${\ Displaystyle {\ tfrac {b} {\ | \ mathbf {w} \ |}}}$ определяет смещение гиперплоскости от начала координат вдоль вектора нормали ${\ displaystyle {\ mathbf {w}}}$ .

Если данные обучения линейно разделимы, мы можем выбрать две гиперплоскости таким образом, чтобы они разделяли данные и между ними не было точек, а затем попытаться максимизировать их расстояние.

Линейная отделимость

Математическое определение

Примеры

Линейная разделимость булевых функций от n переменных

Опорные векторные машины

Смотрите также

Рекомендации