Пусть обозначает матрицу входных данных, количество столбцов, соответствующее количеству выборок смешанных сигналов, и количество строк, соответствующее количеству независимых исходных сигналов. Матрицу входных данных необходимо предварительно отбелить или центрировать и отбелить перед применением к ней алгоритма FastICA.
Центрирование данных влечет за собой унижение каждого компонента входных данных , то есть
для каждого и . После центрирования, каждая строка имеет ожидаемое значение из .
Отбеливание данных требует линейного преобразования центрированных данных, чтобы компоненты не коррелировали и имели единичную дисперсию. Точнее, если - это центрированная матрица данных, ковариация - это -мерная единичная матрица, то есть
Общий метод для отбеливания посредством выполнения разложения по собственным значениям на ковариационной матрице центрированных данных , где матрица собственных векторов и диагональная матрица собственных значений. Матрица отбеленных данных определяется таким образом
Однокомпонентная экстракция
Итерационный алгоритм находит направление для вектора весов,
которое максимизирует меру негауссовости проекции , с обозначением предварительно отбеленной матрицы данных, как описано выше. Обратите внимание, что это вектор-столбец. Для измерения негауссовости FastICA использует неквадратичную нелинейную функцию , ее первую производную и вторую производную . Хювяринен утверждает, что функции
полезны для общих целей, а
может быть очень надежным. [1] Шаги по извлечению вектора весов для отдельного компонента в FastICA следующие:
Произвести случайный выбор вектора начального веса
Пусть , где означает усреднение по всем векторам-столбцам матрицы
Позволять
Если не сходится, вернитесь к 2
Многокомпонентная экстракция
Единичный итерационный алгоритм оценивает только один весовой вектор, который извлекает единственный компонент. Оценка дополнительных компонентов, которые являются взаимно «независимыми», требует повторения алгоритма для получения линейно независимых векторов проекции - обратите внимание, что понятие независимости здесь относится к максимизации негауссовости в оцениваемых компонентах. Hyvärinen предлагает несколько способов извлечения нескольких компонентов, самый простой из которых - следующий. Здесь - вектор-столбец размерности единиц .
Алгоритм FastICA
Ввод: количество желаемых компонентов.
Вход: предварительно отбеленная матрица, где каждый столбец представляет собой -мерный образец, где
Выход: матрица несмешивания, в которой каждый столбец проецируется на независимый компонент.
Выход: матрица независимых компонентов со столбцами, представляющими образец с размерами.
для p в 1 - C: случайный вектор длины N при изменении вывода вывода
Шумная экстракция
Примечательно, что Fast ICA чрезвычайно устойчив к аддитивному шуму в смешанном сигнале. Рассмотрим следующую зашумленную модель.
После предварительного отбеливания влияние аддитивного шума на экстракцию значительно снижается. Оценка Reconstruction ICA , скажем, для двух случаев высокого и низкого содержания шума показана на рисунке, который ясно подчеркивает устойчивость Fast ICA к аддитивному шуму.