Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Факторный анализ - это статистический метод, используемый для описания изменчивости среди наблюдаемых коррелированных переменных с точки зрения потенциально меньшего числа ненаблюдаемых переменных, называемых факторами . Например, возможно, что вариации шести наблюдаемых переменных в основном отражают вариации двух ненаблюдаемых (лежащих в основе) переменных. Факторный анализ ищет такие совместные вариации в ответ на ненаблюдаемые скрытые переменные . Наблюдаемые переменные моделируются как линейные комбинации потенциальных факторов плюс условия « ошибки ».

Проще говоря, факторная нагрузка переменной количественно определяет степень, в которой переменная связана с данным фактором. [1]

Общее объяснение методов факторной аналитики состоит в том, что полученная информация о взаимозависимостях между наблюдаемыми переменными может быть использована позже для сокращения набора переменных в наборе данных. Факторный анализ обычно используется в биологии, психометрии , теориях личности , маркетинге , управлении продуктами , исследованиях операций и финансах.. Это может помочь иметь дело с наборами данных, в которых имеется большое количество наблюдаемых переменных, которые, как считается, отражают меньшее количество основных / скрытых переменных. Это один из наиболее часто используемых методов взаимозависимости, который используется, когда соответствующий набор переменных показывает систематическую взаимозависимость, а цель состоит в том, чтобы выявить скрытые факторы, которые создают общность.

Статистическая модель [ править ]

Определение [ править ]

Модель пытается объяснить набор из p наблюдений у каждого из n индивидуумов с помощью набора из k общих факторов ( F ), где меньше факторов на единицу, чем наблюдений на единицу ( k < p ). У каждого человека есть k собственных общих факторов, и они связаны с наблюдениями через матрицу факторной нагрузки ( ) для одного наблюдения, согласно

где - член ненаблюдаемой стохастической ошибки со средним нулевым и конечной дисперсией, а - среднее значение наблюдения для i- го наблюдения.

В матричных обозначениях

где матрица наблюдения , факторная матрица , матрица условий ошибок и матрица средних значений, где элемент i , m является простым .

Также мы сделаем следующие предположения :

  1. F и независимы.
  2. ; где E - ожидание
  3. где Cov - ковариационная матрица , чтобы убедиться, что факторы некоррелированы, а I - единичная матрица .

Предположим . потом

и, следовательно, из условий, наложенных на F выше,

или, установка ,

Обратите внимание, что для любой ортогональной матрицы Q , если мы установим и , критерии для того, чтобы быть факторами и факторными нагрузками, по-прежнему остаются в силе. Следовательно, набор факторов и факторных нагрузок уникален только с точностью до ортогонального преобразования .

Пример [ править ]

Предположим, у психолога есть гипотеза о том, что существует два вида интеллекта : «вербальный интеллект» и «математический интеллект», ни один из которых не наблюдается напрямую. Доказательства этой гипотезы ищутся в результатах экзаменов по каждой из 10 различных академических областей 1000 студентов. Если каждый студент выбирается случайным образом из большой совокупности , то 10 баллов каждого студента являются случайными величинами. Гипотеза психолога может утверждать, что для каждой из 10 академических областей средний балл по группе всех студентов, разделяющих некоторую общую пару ценностей вербального и математического «интеллекта», является некоторой константой.умноженное на их уровень вербального интеллекта плюс еще одно постоянное умноженное на их уровень математического интеллекта, то есть это линейная комбинация этих двух «факторов». Числа для конкретного предмета, на которые умножаются два вида интеллекта для получения ожидаемой оценки, постулируются гипотезой как одинаковые для всех пар уровней интеллекта и называются «факторной нагрузкой» для этого предмета. [ требуется пояснение ] Например, гипотеза может утверждать, что прогнозируемые средние способности студента в области астрономии равны

{10 × вербальный интеллект учащегося} + {6 × математический интеллект учащегося}.

Числа 10 и 6 - факторные нагрузки, связанные с астрономией. Другие учебные предметы могут иметь другие факторные нагрузки.

Предполагается, что два студента с одинаковыми степенями вербального и математического интеллекта могут иметь разные измеренные способности в астрономии, потому что индивидуальные способности отличаются от средних способностей (предсказанных выше) и из-за самой ошибки измерения. Такие различия составляют то, что в совокупности называется «ошибкой» - статистическим термином, обозначающим величину, на которую индивидуум при измерении отличается от среднего или прогнозируемого его уровня интеллекта (см. Ошибки и остатки в статистике). ).

Наблюдаемые данные, которые войдут в факторный анализ, будут включать 10 баллов каждого из 1000 студентов, всего 10 000 чисел. Факторные нагрузки и уровни двух видов интеллекта каждого студента должны быть выведены из данных.

Математическая модель того же примера [ править ]

В дальнейшем матрицы будут обозначаться индексированными переменными. Индексы "Subject" будут обозначены буквами , и со значениями, начинающимися от до которых в приведенном выше примере равно . «Факторные» индексы будут обозначены буквами , и со значениями от до которых в приведенном выше примере равно . Индексы «экземпляра» или «образца» будут обозначены буквами , и со значениями от до . В приведенном выше примере, если выборка студентов участвовала в экзаменах, оценка th студента за th экзамен определяется как. Цель факторного анализа - охарактеризовать корреляции между переменными, которые являются конкретным примером или набором наблюдений. Чтобы переменные были приравнены друг к другу, их нормируют в стандартные баллы :

где выборочное среднее:

а дисперсия выборки определяется как:

Таким образом, модель факторного анализа для этой конкретной выборки:

или, точнее:

куда

  • это в «вербальный интеллект» ЧТ студента,
  • является в ЧТ студента «математический интеллект»,
  • - факторные нагрузки для -го предмета, для .

В матричных обозначениях имеем

Обратите внимание на то, что удвоение шкалы, по которой измеряется «вербальный интеллект» - первый компонент в каждом столбце , и одновременное уменьшение вдвое факторных нагрузок для вербального интеллекта не имеет никакого значения для модели. Таким образом, не теряется общность, если предположить, что стандартное отклонение факторов вербального интеллекта равно . То же самое и с математическим интеллектом. Более того, по аналогичным причинам не теряется общность, если предположить, что два фактора не коррелируют друг с другом. Другими словами:

где - дельта Кронекера ( когда и когда ). Предполагается, что ошибки не зависят от факторов:

Обратите внимание: поскольку любое вращение решения также является решением, это затрудняет интерпретацию факторов. См. Недостатки ниже. В этом конкретном примере, если мы не знаем заранее, что два типа интеллекта не коррелируют, мы не можем интерпретировать эти два фактора как два разных типа интеллекта. Даже если они не коррелируют, мы не можем сказать, какой фактор соответствует вербальному интеллекту, а какой соответствует математическому интеллекту без сторонних аргументов.

Значения нагрузок , средние значения и дисперсии «ошибок» должны быть оценены с учетом наблюдаемых данных и (предположение об уровнях факторов фиксировано для данного ). «Основная теорема» может быть получена из приведенных выше условий:

Член слева - это член корреляционной матрицы ( матрица, полученная как произведение матрицы стандартизированных наблюдений с ее транспонированием) наблюдаемых данных, а ее диагональные элементы будут s. Второй член справа будет диагональной матрицей с членами меньше единицы. Первый член справа - это «сокращенная корреляционная матрица» и будет равен корреляционной матрице, за исключением ее диагональных значений, которые будут меньше единицы. Эти диагональные элементы сокращенной корреляционной матрицы называются «общностями» (которые представляют собой долю дисперсии наблюдаемой переменной, которая учитывается факторами):

Разумеется, данные выборки не будут точно подчиняться фундаментальному уравнению, приведенному выше, из-за ошибок выборки, неадекватности модели и т. Д. Цель любого анализа вышеуказанной модели - найти факторы и нагрузки, которые в некотором смысле дать "наилучшее соответствие" данным. В факторном анализе наилучшее соответствие определяется как минимум среднеквадратической ошибки недиагональных остатков корреляционной матрицы: [2]

Это эквивалентно минимизации недиагональных компонентов ковариации ошибок, которые в уравнениях модели имеют ожидаемые значения, равные нулю. Это должно контрастировать с анализом главных компонент, который стремится минимизировать среднеквадратичную ошибку всех остатков. [2] До появления высокоскоростных компьютеров значительные усилия направлялись на поиск приближенных решений проблемы, в частности, при оценке общностей другими способами, что затем значительно упрощает задачу, давая известную сокращенную матрицу корреляции. Затем это было использовано для оценки факторов и нагрузок. С появлением высокоскоростных компьютеров проблема минимизации может быть решена итеративно с достаточной скоростью, а общности вычисляются в процессе, а не требуются заранее. ВАлгоритм MinRes особенно подходит для этой проблемы, но не является единственным итеративным средством поиска решения.

Если коэффициенты решения могут быть коррелированы (как, например, в случае «oblimin» вращения), то соответствующая математическая модель использует координаты перекоса, а не ортогональные координаты.

Геометрическая интерпретация [ править ]

Геометрическая интерпретация параметров факторного анализа для 3 респондентов на вопрос «а». «Ответ» представлен единичным вектором , который проецируется на плоскость, определяемую двумя ортонормированными векторами и . Вектор проекции и ошибка перпендикулярны плоскости, так что . Вектор проекции может быть представлен в терминах векторов факторов как . Квадрат длины вектора проекции является коммунальность: . Если бы был нанесен другой вектор данных , косинус угла между и был бы  : -запись в корреляционной матрице. (Адаптировано из Хармана Рис. 4.3) [2]

Параметрам и переменным факторного анализа можно дать геометрическую интерпретацию. Данные ( ), коэффициенты ( ) и ошибки ( ) можно рассматривать как векторы в -мерном евклидовом пространстве (пространство выборки), представленные как , и соответственно. Поскольку данные стандартизированы, векторы данных имеют единичную длину ( ). Факторные векторы определяют -мерное линейное подпространство (т.е. гиперплоскость) в этом пространстве, на которое векторы данных проецируются ортогонально. Это следует из модельного уравнения

и независимость факторов и ошибок: . В приведенном выше примере гиперплоскость - это просто 2-мерная плоскость, определяемая двумя факторами-векторами. Проекция векторов данных на гиперплоскость определяется выражением

а ошибки - это векторы от этой проецируемой точки до точки данных и перпендикулярны гиперплоскости. Цель факторного анализа - найти гиперплоскость, которая в некотором смысле "наилучшим образом подходит" для данных, поэтому не имеет значения, как выбираются факторные векторы, которые определяют эту гиперплоскость, если они независимы и лежат в гиперплоскость. Мы можем указать их как ортогональные, так и нормальные () без потери общности. После того, как подходящий набор факторов найден, они также могут быть произвольно повернуты в пределах гиперплоскости, так что любое вращение векторов факторов будет определять ту же самую гиперплоскость, а также быть решением. В результате, в приведенном выше примере, в котором соответствующая гиперплоскость является двумерной, если мы не знаем заранее, что два типа интеллекта не коррелированы, то мы не можем интерпретировать два фактора как два разных типа интеллекта. Даже если они не коррелируют, мы не можем сказать, какой фактор соответствует вербальному интеллекту, а какой соответствует математическому интеллекту, или являются ли факторы линейными комбинациями обоих без сторонних аргументов.

Векторы данных имеют единичную длину. Элементы корреляционной матрицы для данных представлены как . Матрица корреляции может быть геометрически интерпретирована как косинус угла между двумя векторами данных и . Очевидно, что диагональные элементы будут s, а недиагональные элементы будут иметь абсолютные значения, меньшие или равные единице. «Редуцированная корреляционная матрица» определяется как

.

Цель факторного анализа - выбрать аппроксимирующую гиперплоскость так, чтобы уменьшенная матрица корреляции воспроизводила матрицу корреляции как можно ближе, за исключением диагональных элементов матрицы корреляции, которые, как известно, имеют единичное значение. Другими словами, цель состоит в том, чтобы как можно точнее воспроизвести взаимные корреляции в данных. В частности, для аппроксимирующей гиперплоскости среднеквадратичная ошибка недиагональных компонентов

должен быть минимизирован, и это достигается путем минимизации его относительно набора ортонормированных векторов факторов. Видно, что

Член справа - это просто ковариация ошибок. В модели ковариация ошибок указывается как диагональная матрица, и поэтому вышеупомянутая задача минимизации фактически даст "наилучшее соответствие" модели: она даст выборочную оценку ковариации ошибки, которая имеет свои недиагональные компоненты. минимизированы в среднеквадратическом смысле. Можно видеть, что, поскольку это ортогональные проекции векторов данных, их длина будет меньше или равна длине проецируемого вектора данных, которая равна единице. Квадрат этих длин - это просто диагональные элементы сокращенной корреляционной матрицы. Эти диагональные элементы сокращенной корреляционной матрицы известны как «общности»:

Большие значения общностей будут указывать на то, что аппроксимирующая гиперплоскость довольно точно воспроизводит корреляционную матрицу. Средние значения факторов также должны быть ограничены равными нулю, из чего следует, что средние значения ошибок также будут равны нулю.

Практическая реализация [ править ]

Виды факторного анализа [ править ]

Исследовательский факторный анализ [ править ]

Исследовательский факторный анализ (EFA) используется для выявления сложных взаимосвязей между элементами и элементами группы, которые являются частью единых концепций. [3] Исследователь не делает априорных предположений о взаимосвязи между факторами. [3]

Подтверждающий факторный анализ [ править ]

Подтверждающий факторный анализ (CFA) - более сложный подход, который проверяет гипотезу о том, что элементы связаны с конкретными факторами. [3] CFA использует моделирование структурным уравнением для тестирования модели измерения, при которой нагрузка на факторы позволяет оценить взаимосвязь между наблюдаемыми и ненаблюдаемыми переменными. [3] Подходы к моделированию структурным уравнением могут учитывать ошибку измерения и являются менее строгими, чем оценка методом наименьших квадратов . [3] Предполагаемые модели проверяются на фактических данных, и анализ продемонстрирует нагрузки наблюдаемых переменных на скрытые переменные (факторы), а также корреляцию между скрытыми переменными. [3]

Типы факторного извлечения [ править ]

Анализ главных компонентов (PCA) - широко используемый метод экстракции факторов, который является первым этапом EFA. [3] Веса факторов вычисляются для извлечения максимально возможной дисперсии, при этом последующее разложение на множители продолжается до тех пор, пока не исчезнет значимая дисперсия. [3] Затем факторную модель необходимо повернуть для анализа. [3]

Канонический факторный анализ, также называемый каноническим факторингом Рао, - это другой метод вычисления той же модели, что и PCA, который использует метод главной оси. Канонический факторный анализ ищет факторы, которые имеют самую высокую каноническую корреляцию с наблюдаемыми переменными. На канонический факторный анализ не влияет произвольное изменение масштаба данных.

Общий факторный анализ, также называемый анализом главных факторов (PFA) или факторингом по главной оси (PAF), ищет наименьшее количество факторов, которые могут объяснить общую дисперсию (корреляцию) набора переменных.

Факторинг изображений основан на корреляционной матрице прогнозируемых переменных, а не фактических переменных, где каждая переменная прогнозируется на основе других с использованием множественной регрессии .

Альфа-факторинг основан на максимальной надежности факторов при условии, что переменные выбираются случайным образом из множества переменных. Все другие методы предполагают выборку случаев и фиксированные переменные.

Факторная регрессионная модель - это комбинаторная модель факторной модели и регрессионной модели; или, альтернативно, ее можно рассматривать как гибридную факторную модель [4] , факторы которой частично известны.

Терминология [ править ]

Факторные нагрузки: Общность - это квадрат стандартизированной внешней нагрузки элемента. По аналогии с r -квадратом Пирсона, возведенная в квадрат факторная нагрузка - это процент дисперсии в этой индикаторной переменной, объясняемой этим фактором. Чтобы получить процент дисперсии всех переменных, учитываемых каждым фактором, сложите сумму возведенных в квадрат факторных нагрузок для этого фактора (столбец) и разделите на количество переменных. (Обратите внимание, что количество переменных равно сумме их дисперсий, поскольку дисперсия стандартизованной переменной равна 1.) Это то же самое, что и деление собственного значения фактора на количество переменных.

Интерпретация факторных нагрузок: согласно практическому правилу подтверждающего факторного анализа, нагрузки должны быть 0,7 или выше, чтобы подтвердить, что независимые переменные, определенные априори, представлены конкретным фактором, исходя из того, что уровень 0,7 соответствует примерно половине отклонение показателя объясняется фактором. Однако стандарт 0,7 является высоким, и реальные данные могут не соответствовать этому критерию, поэтому некоторые исследователи, особенно в исследовательских целях, будут использовать более низкий уровень, такой как 0,4 для центрального фактора и 0,25 для другие факторы. В любом случае факторные нагрузки следует интерпретировать в свете теории, а не с помощью произвольных уровней отсечения.

При наклонном вращении можно исследовать как матрицу шаблона, так и матрицу структуры. Структурная матрица - это просто матрица факторных нагрузок, как при ортогональном вращении, представляющая дисперсию измеряемой переменной, объясняемую фактором как на основе уникальных, так и общих вкладов. Матрица шаблонов, напротив, содержит коэффициенты, которые просто представляют уникальные вклады. Чем больше факторов, тем ниже коэффициенты паттерна, как правило, поскольку будет объяснено больше общих вкладов в дисперсию. Для наклонного вращения исследователь смотрит как на коэффициенты структуры, так и на коэффициенты структуры, приписывая метку фактору. Принципы наклонного вращения могут быть выведены как из перекрестной энтропии, так и из ее двойной энтропии. [5]

Общность: сумма квадратов факторных нагрузок для всех факторов для данной переменной (строки) является дисперсией этой переменной, учитываемой всеми факторами. Общность измеряет процент дисперсии данной переменной, объясняемой всеми факторами совместно, и может интерпретироваться как надежность индикатора в контексте предполагаемых факторов.

Ложные решения: если общность превышает 1,0, существует ложное решение, которое может отражать слишком маленькую выборку или выбор извлекать слишком много или слишком мало факторов.

Уникальность переменной: изменчивость переменной за вычетом ее общности.

Собственные значения / характеристические корни: собственные значения измеряют количество вариаций в общей выборке, учитываемых каждым фактором. Отношение собственных значений - это отношение объясняющей важности факторов по отношению к переменным. Если фактор имеет низкое собственное значение, то он мало способствует объяснению дисперсии переменных и может быть проигнорирован как менее важный, чем факторы с более высокими собственными значениями.

Суммы извлечения квадратов нагрузок: Начальные собственные значения и собственные значения после извлечения (перечисленные SPSS как «Суммы извлечения квадратов загрузок») такие же для извлечения PCA, но для других методов извлечения собственные значения после извлечения будут ниже, чем их исходные аналоги. SPSS также печатает «Суммы вращения квадратов нагрузок», и даже для PCA эти собственные значения будут отличаться от исходных и извлеченных собственных значений, хотя их сумма будет такой же.

Оценки факторов (также называемые оценками компонентов в PCA): это оценки каждого случая (строки) по каждому фактору (столбцу). Чтобы вычислить факторную оценку для данного случая для данного фактора, нужно взять стандартизированную оценку случая по каждой переменной, умножить на соответствующие нагрузки переменной для данного фактора и суммировать эти продукты. Вычисление оценок факторов позволяет искать выбросы факторов. Кроме того, факторные оценки могут использоваться в качестве переменных в последующем моделировании. (Объясняется с точки зрения PCA, а не с точки зрения факторного анализа).

Критерии определения количества факторов [ править ]

Исследователи хотят избежать таких субъективных или произвольных критериев удержания фактора, как «это имело смысл для меня». Для решения этой проблемы был разработан ряд объективных методов, позволяющих пользователям определить подходящий набор решений для исследования. [6] Методы могут не совпадать. Например, параллельный анализ может предложить 5 факторов, в то время как MAP Велисера предлагает 6, поэтому исследователь может запросить как 5-, так и 6-факторные решения и обсудить каждое с точки зрения их отношения к внешним данным и теории.

Современные критерии [ править ]

Параллельный анализ Хорна (PA): [7] Метод моделирования на основе Монте-Карло, который сравнивает наблюдаемые собственные значения с значениями, полученными из некоррелированных нормальных переменных. Фактор или компонент сохраняется, если соответствующее собственное значение больше 95-го процентиля распределения собственных значений, полученных из случайных данных. PA является одним из наиболее часто рекомендуемых правил для определения количества компонентов, которые необходимо сохранить, [6] [8], но многие программы не включают эту опцию (заметным исключением является R ). [9] Однако Форманнпредоставили как теоретические, так и эмпирические доказательства того, что его применение может быть неприемлемым во многих случаях, поскольку его эффективность в значительной степени зависит от размера выборки , дискриминации элементов и типа коэффициента корреляции . [10]

Тест Velicer's (1976) MAP [11], как описано Кортни (2013) [12]«Включает в себя полный анализ основных компонентов с последующим исследованием серии матриц частичных корреляций» (стр. 397 (хотя обратите внимание, что эта цитата не встречается в Velicer (1976), и номер указанной страницы находится за пределами страниц цитирования) Квадрат корреляции для шага «0» (см. Рисунок 4) является средним квадратом недиагональной корреляции для неотчлененной корреляционной матрицы. На шаге 1 первый главный компонент и связанные с ним элементы разделяются. После этого средний квадрат Затем для шага 1 вычисляется недиагональная корреляция для последующей матрицы корреляции. На шаге 2 первые два главных компонента разделяются, и снова вычисляется результирующий средний квадрат недиагональной корреляции.Вычисления выполняются для k минус один шаг (k представляет собой общее количество переменных в матрице). После этого выстраиваются все средние квадраты корреляций для каждого шага, и номер шага в анализах, которые привели к самому низкому среднему квадрату частичной корреляции, определяет количество компонентов или факторов, которые необходимо сохранить.[11] С помощью этого метода компоненты сохраняются до тех пор, пока дисперсия в корреляционной матрице представляет собой систематическую дисперсию, в отличие от дисперсии остатка или ошибки. Хотя методологически метод MAP близок к анализу основных компонентов, он показал себя достаточно хорошо при определении количества факторов, которые необходимо сохранить в нескольких исследованиях моделирования. [6] [13] [14] [15] Эта процедура доступна через пользовательский интерфейс SPSS, в [12] , а также Psych пакет для языка программирования R . [16] [17]

Старые методы [ править ]

Критерий Кайзера: правило Кайзера состоит в том, чтобы отбросить все компоненты с собственными значениями ниже 1.0 - это собственное значение, равное информации, приходящейся на средний отдельный элемент. [18] Критерий Кайзера используется по умолчанию в SPSS и большинстве статистических программ, но не рекомендуется при использовании в качестве единственного критерия отсечения для оценки количества факторов, поскольку он имеет тенденцию к чрезмерному извлечению факторов. [19] Был создан вариант этого метода, в котором исследователь вычисляет доверительные интервалы для каждого собственного значения и сохраняет только те факторы, у которых весь доверительный интервал превышает 1,0. [13] [20]

Скрите участок : [21] Cattell тест осыпи участки компонента , как X-ось и соответствующие собственные значения , как Y-ось . При движении вправо к более поздним компонентам собственные значения уменьшаются. Когда падение прекращается и кривая изгибается в сторону менее крутого спуска, тест осыпи Кеттелла требует опускать все остальные компоненты после того, который начинается в локте. Это правило иногда критикуют за то, что оно допускает контролируемые исследователями « выдумки ». То есть, поскольку выбор «локтя» может быть субъективным, поскольку кривая имеет несколько изгибов или представляет собой плавную кривую, у исследователя может возникнуть соблазн установить пороговое значение для числа факторов, требуемых его программой исследования. [ цитата необходима]

Критерии объяснения дисперсии: некоторые исследователи просто используют правило сохранения достаточного количества факторов, чтобы составлять 90% (иногда 80%) вариации. В тех случаях, когда цель исследователя подчеркивает экономичность (объяснение дисперсии минимальным количеством факторов), критерий может составлять всего 50%.

Байесовский метод [ править ]

Байесовский подход, основанный на индийском шведском процессе, возвращает вероятностное распределение по вероятному количеству скрытых факторов. [22]

Способы вращения [ править ]

Невращенный выходной сигнал максимизирует дисперсию, учитываемую первым и последующими факторами, и заставляет факторы быть ортогональными . Это сжатие данных происходит за счет того, что большая часть элементов загружается на ранние факторы, и, как правило, из-за того, что многие элементы существенно загружаются более чем одним фактором. Вращение служит для того, чтобы сделать вывод более понятным, ища так называемую «простую структуру»: схему нагрузок, при которой каждый элемент сильно нагружается только по одному из факторов и намного слабее по другим факторам. Вращения могут быть ортогональными или наклонными (позволяющими соотносить факторы).

Вращение Varimaxпредставляет собой ортогональное вращение факторных осей для максимизации дисперсии возведенных в квадрат нагрузок фактора (столбца) по всем переменным (строкам) в факторной матрице, что имеет эффект дифференцирования исходных переменных по извлеченным факторам. Каждый фактор будет иметь либо большие, либо малые нагрузки любой конкретной переменной. Решение Varimax дает результаты, которые максимально упрощают идентификацию каждой переменной с помощью одного фактора. Это наиболее распространенный вариант вращения. Однако предположение об ортогональности (т. Е. Независимости) факторов часто является нереалистичным. Наклонные вращения включают ортогональные вращения, и по этой причине наклонные вращения являются предпочтительным методом. Учет факторов, которые коррелируют друг с другом, особенно применим в психометрических исследованиях, поскольку отношения, мнения,и интеллектуальные способности, как правило, коррелируют, и поскольку во многих ситуациях было бы нереалистично предположить иное.[23]

Вращение Quartimax - это ортогональная альтернатива, которая сводит к минимуму количество факторов, необходимых для объяснения каждой переменной. Этот тип вращения часто создает общий фактор, на который в высокой или средней степени загружается большинство переменных. Такая факторная структура обычно не помогает целям исследования.

Ротация Equimax - это компромисс между критериями варимакс и квартимакс.

Прямое вращение облимина является стандартным методом, когда нужно получить неортогональное (наклонное) решение, то есть такое, в котором факторы могут быть коррелированы. Это приведет к более высоким собственным значениям, но уменьшит интерпретируемость факторов. Смотри ниже. [ требуется разъяснение ]

Вращение Promax - это альтернативный метод неортогонального (наклонного) вращения, который в вычислительном отношении быстрее, чем метод прямого наклона, и поэтому иногда используется для очень больших наборов данных .

Факторный анализ высшего порядка [ править ]

Факторный анализ высшего порядка - это статистический метод, состоящий из повторяющихся шагов факторного анализа - наклонного вращения - факторного анализа повернутых факторов. Его заслуга в том, чтобы дать возможность исследователю увидеть иерархическую структуру изучаемых явлений. Для интерпретации результатов следует либо последующее умножение матрицы паттернов первичных факторов на матрицы паттернов множителей более высокого порядка (Gorsuch, 1983) и, возможно, применение вращения Varimax к результату (Thompson, 1990), либо использование схемы Шмид- Решение Леймана (SLS, Schmid & Leiman, 1957, также известное как преобразование Шмида-Леймана), приписывающее изменение первичных факторов факторам второго порядка.

В психометрии [ править ]

История [ править ]

Чарльз Спирмен был первым психологом, который обсудил общий факторный анализ [24], и сделал это в своей статье 1904 года. [25] Он предоставил немного подробностей о его методах и был посвящен однофакторным моделям. [26] Он обнаружил, что оценки школьников по широкому кругу, казалось бы, не связанных между собой предметов имеют положительную корреляцию, что привело его к постулату о том, что одна общая умственная способность, или g , лежит в основе и формирует когнитивные способности человека.

Первоначальное развитие общего факторного анализа с множественными факторами было дано Луи Терстоуном в двух статьях в начале 1930-х годов [27] [28], обобщенных в его книге 1935 года «Вектор разума» . [29] Терстон представил несколько важных концепций факторного анализа, включая общность, уникальность и ротацию. [30] Он выступал за «простую структуру» и разработал методы вращения, которые можно было бы использовать как способ достижения такой структуры. [24]

В методологии Q Стивенсон, ученик Спирмена, различает R- факторный анализ, ориентированный на изучение межиндивидуальных различий, и анализ Q- фактора, ориентированный на субъективные внутрииндивидуальные различия. [31] [32]

Раймонд Кеттелл был ярым сторонником факторного анализа и психометрии и использовал многофакторную теорию Терстона для объяснения интеллекта. Кеттелл также разработал «осыпной» тест и коэффициенты сходства.

Приложения в психологии [ править ]

Факторный анализ используется для выявления «факторов», объясняющих различные результаты различных тестов. Например, исследование интеллекта показало, что люди, получившие высокий балл в тесте на вербальные способности, также хороши в других тестах, требующих вербальных способностей. Исследователи объяснили это использованием факторного анализа для выделения одного фактора, часто называемого вербальным интеллектом, который представляет степень, в которой кто-то может решать проблемы, связанные с вербальными навыками.

Факторный анализ в психологии чаще всего связан с исследованиями интеллекта. Тем не менее, он также использовался для поиска факторов в широком диапазоне областей, таких как личность, отношения, убеждения и т. Д. Он связан с психометрикой , так как может оценивать валидность инструмента, выясняя, действительно ли инструмент измеряет постулируемое факторы.

Факторный анализ - часто используемый метод в кросс-культурных исследованиях. Он служит для извлечения культурных аспектов . Самыми известными моделями культурных измерений являются модели, разработанные Гиртом Хофстеде , Рональдом Инглхартом , Кристианом Вельзелем , Шаломом Шварцем и Майклом Минковым.

Преимущества [ править ]

  • Уменьшение количества переменных за счет объединения двух или более переменных в один фактор. Например, результаты в беге, метании мяча, отбивании, прыжках и поднятии тяжестей можно объединить в один фактор, такой как общие спортивные способности. Обычно в матрице элементов по людям факторы выбираются путем группировки связанных элементов. В методе анализа Q-фактора матрица транспонируется, и факторы создаются путем группирования связанных людей. Например, либералы, либертарианцы, консерваторы и социалисты могут объединяться в отдельные группы.
  • Идентификация групп взаимосвязанных переменных, чтобы увидеть, как они связаны друг с другом. Например, Кэрролл использовал факторный анализ для построения своей теории трех слоев . Он обнаружил, что фактор, называемый «широкое визуальное восприятие», относится к тому, насколько хорошо человек справляется с визуальными задачами. Он также обнаружил фактор «широкого слухового восприятия», относящийся к способности слуховой задачи. Кроме того, он обнаружил глобальный фактор, называемый «g» или общий интеллект, который относится как к «широкому зрительному восприятию», так и «широкому слуховому восприятию». Это означает, что человек с высоким «g», вероятно, будет обладать как высокой способностью «зрительного восприятия», так и высокой способностью «слухового восприятия», и что «g»таким образом объясняет хорошую часть того, почему кто-то хорош или плох в обеих этих областях.

Недостатки [ править ]

  • «... каждая ориентация одинаково приемлема с математической точки зрения. Но оказалось, что разные факторные теории различаются как в отношении ориентации факторных осей для данного решения, так и в отношении чего-либо еще, так что подгонка модели не оказалась полезной в различая теории ". (Штернберг, 1977 [33] ). Это означает, что все ротации представляют различные базовые процессы, но все ротации в равной степени являются допустимыми результатами стандартной оптимизации факторного анализа. Таким образом, невозможно выбрать правильное вращение, используя только факторный анализ.
  • Факторный анализ может быть настолько хорош, насколько позволяют данные. В психологии, где исследователям часто приходится полагаться на менее достоверные и надежные меры, такие как самоотчеты, это может быть проблематичным.
  • Интерпретация факторного анализа основана на использовании «эвристики», которая представляет собой решение, которое «удобно, даже если не совсем верно». [34] Можно сделать более одной интерпретации одних и тех же данных с одинаковым факторизацией, и факторный анализ не может выявить причинно-следственную связь.

Исследовательский факторный анализ (EFA) в сравнении с анализом главных компонентов (PCA) [ править ]

Факторный анализ связан с анализом главных компонентов (PCA), но они не идентичны. [35] В этой области существует значительная полемика по поводу различий между двумя методами. PCA можно рассматривать как более базовую версию исследовательского факторного анализа (EFA), который был разработан в первые дни до появления высокоскоростных компьютеров. И PCA, и факторный анализ нацелены на уменьшение размерности набора данных, но подходы, используемые для этого, различны для этих двух методов. Факторный анализ четко разработан с целью выявления некоторых ненаблюдаемых факторов из наблюдаемых переменных, тогда как PCA напрямую не решает эту задачу; в лучшем случае PCA дает приближение к требуемым факторам.[36] С точки зрения исследовательского анализа, собственные значения PCA - это завышенные нагрузки компонентов, т. Е. Загрязненные дисперсией ошибок. [37] [38] [39] [40] [41] [42]

Хотя EFA и PCA рассматриваются как синонимы в некоторых областях статистики, это подвергается критике. [43] [44] Факторный анализ «имеет дело с предположением о лежащей в основе причинной структуре : [он] предполагает, что ковариация наблюдаемых переменных обусловлена ​​наличием одной или нескольких скрытых переменных (факторов), которые оказывают на них причинное влияние. наблюдаемые переменные ". [45]Напротив, PCA не предполагает и не зависит от такой основной причинно-следственной связи. Исследователи утверждали, что различия между этими двумя методами могут означать, что есть объективные преимущества от предпочтения одного перед другим на основе аналитической цели. Если факторная модель сформулирована неправильно или предположения не выполняются, то факторный анализ даст ошибочные результаты. Факторный анализ успешно применялся там, где адекватное понимание системы позволяет правильно сформулировать исходную модель. PCA использует математическое преобразование исходных данных без каких-либо предположений о форме ковариационной матрицы. Задача PCA - определить линейные комбинации исходных переменных и выбрать несколько, которые можно использовать для обобщения набора данных без потери большого количества информации. [46]

Аргументы, противопоставляющие PCA и EFA [ править ]

Fabrigar et al. (1999) [43] обращаются к ряду причин, по которым PCA не эквивалентен факторному анализу:

  1. Иногда предполагается, что PCA быстрее в вычислительном отношении и требует меньше ресурсов, чем факторный анализ. Fabrigar et al. предполагают, что легкодоступные компьютерные ресурсы сделали эту практическую проблему неуместной.
  2. PCA и факторный анализ могут дать аналогичные результаты. К этому вопросу также обращаются Fabrigar et al .; в некоторых случаях, когда общности низкие (например, 0,4), эти два метода дают разные результаты. Фактически, Fabrigar et al. утверждают, что в случаях, когда данные соответствуют предположениям общей факторной модели, результаты PCA являются неточными результатами.
  3. Есть определенные случаи, когда факторный анализ приводит к «случаям Хейвуда». Сюда входят ситуации, когда 100% или более дисперсии измеряемой переменной оценивается как учет модели. Fabrigar et al. предполагают, что эти случаи действительно информативны для исследователя, указывая на неверно заданную модель или нарушение модели общего фактора. Отсутствие случаев Хейвуда в подходе PCA может означать, что такие проблемы останутся незамеченными.
  4. Исследователи получают дополнительную информацию от подхода PCA, такую ​​как индивидуальный балл по определенному компоненту; такая информация не получается из факторного анализа. Однако, как отмечает Fabrigar et al. утверждают, что типичная цель факторного анализа - то есть определение факторов, определяющих структуру корреляций между измеряемыми переменными - не требует знания факторных оценок, и, таким образом, это преимущество сводится на нет. Также возможно вычислить факторные оценки на основе факторного анализа.

Дисперсия против ковариации [ править ]

Факторный анализ учитывает случайную ошибку , присущую измерению, тогда как PCA этого не делает. Этот момент иллюстрируется Брауном (2009), [47], который указал, что в отношении корреляционных матриц, участвующих в расчетах:

"В PCA 1,00 ставятся по диагонали, что означает, что должна быть учтена вся дисперсия в матрице (включая дисперсию, уникальную для каждой переменной, дисперсию, общую для переменных, и дисперсию ошибок). Следовательно, это будет по определению , включают в себя все отклонения в переменных. Напротив, в EFA общности помещаются по диагонали, что означает, что учитывается только дисперсия, общая с другими переменными (исключая дисперсию, уникальную для каждой переменной, и дисперсию ошибок). поэтому, по определению, будет включать только дисперсию, которая является общей для переменных ».

-  Браун (2009), Анализ основных компонентов и исследовательский факторный анализ - Определения, различия и выбор

По этой причине Браун (2009) рекомендует использовать факторный анализ, когда существуют теоретические идеи о взаимосвязях между переменными, тогда как PCA следует использовать, если целью исследователя является изучение закономерностей в их данных.

Различия в процедурах и результатах [ править ]

Различия между PCA и факторным анализом (FA) дополнительно проиллюстрированы Suhr (2009): [44]

  • PCA приводит к основным компонентам, которые объясняют максимальную дисперсию наблюдаемых переменных; FA учитывает общие расхождения в данных.
  • PCA вставляет единицы на диагоналях корреляционной матрицы; FA корректирует диагонали корреляционной матрицы с помощью уникальных факторов.
  • PCA минимизирует сумму квадратов перпендикулярных расстояний к оси компонента; FA оценивает факторы, которые влияют на реакцию на наблюдаемые переменные.
  • Баллы компонентов в PCA представляют собой линейную комбинацию наблюдаемых переменных, взвешенных по собственным векторам ; наблюдаемые переменные в FA являются линейными комбинациями основных и уникальных факторов.
  • В PCA полученные компоненты не интерпретируемы, то есть они не представляют собой лежащие в основе «конструкции»; в FA лежащие в основе конструкции могут быть помечены и легко интерпретированы при наличии точной спецификации модели.


В маркетинге [ править ]

Основные шаги:

  • Определите основные атрибуты, которые потребители используют для оценки продуктов в этой категории.
  • Используйте методы количественного маркетингового исследования (например, опросы ) для сбора данных от выборки потенциальных клиентов относительно их оценок всех атрибутов продукта.
  • Введите данные в статистическую программу и запустите процедуру факторного анализа. Компьютер выдаст набор базовых атрибутов (или факторов).
  • Используйте эти факторы для построения карт восприятия и других устройств позиционирования продукта .

Сбор информации [ править ]

Стадия сбора данных обычно выполняется профессионалами в области маркетинговых исследований. Вопросы опроса просят респондента оценить образец продукта или описания концепций продукта по ряду атрибутов. Выбирается от пяти до двадцати атрибутов. Они могут включать в себя такие вещи, как простота использования, вес, точность, долговечность, цветность, цена или размер. Выбранные атрибуты будут различаться в зависимости от изучаемого продукта. Тот же вопрос задается обо всех продуктах в исследовании. Данные для нескольких продуктов кодируются и вводятся в статистическую программу, такую ​​как R , SPSS , SAS , Stata , STATISTICA , JMP и SYSTAT.

Анализ [ править ]

Анализ позволит выделить основные факторы, объясняющие данные, с помощью матрицы ассоциаций. [48]Факторный анализ - это метод взаимозависимости. Рассматривается полный набор взаимозависимых отношений. Нет спецификации зависимых переменных, независимых переменных или причинно-следственной связи. Факторный анализ предполагает, что все рейтинговые данные по различным атрибутам могут быть сокращены до нескольких важных измерений. Это сокращение возможно, потому что некоторые атрибуты могут быть связаны друг с другом. Рейтинг, присвоенный одному атрибуту, частично является результатом влияния других атрибутов. Статистический алгоритм разбивает рейтинг (так называемый исходный балл) на его различные компоненты и реконструирует частичные баллы в баллы основных факторов. Степень корреляции между исходной необработанной оценкой и окончательной факторной оценкой называется факторной нагрузкой .

Преимущества [ править ]

  • Могут использоваться как объективные, так и субъективные атрибуты при условии, что субъективные атрибуты могут быть преобразованы в оценки.
  • Факторный анализ может выявить скрытые измерения или конструкции, которые прямой анализ не может.
  • Это просто и недорого.

Недостатки [ править ]

  • Полезность зависит от способности исследователей собрать достаточный набор атрибутов продукта. Если важные атрибуты исключены или игнорируются, ценность процедуры уменьшается.
  • Если наборы наблюдаемых переменных очень похожи друг на друга и отличаются от других элементов, факторный анализ присвоит им один фактор. Это может скрыть факторы, которые представляют более интересные отношения. [ требуется разъяснение ]
  • Факторы именования могут потребовать знания теории, поскольку кажущиеся несходными атрибутами могут сильно коррелировать по неизвестным причинам.

В физических и биологических науках [ править ]

Факторный анализ также широко используется в физических науках, таких как геохимия , гидрохимия , [49] астрофизика и космология , а также в биологических науках, таких как экология , молекулярная биология , нейробиология и биохимия .

При управлении качеством подземных вод важно связать пространственное распределение различных химических параметров с различными возможными источниками, которые имеют разные химические характеристики. Например, сульфидный рудник может быть связан с высоким уровнем кислотности, растворенными сульфатами и переходными металлами. Эти сигнатуры могут быть идентифицированы как факторы посредством факторного анализа в R-режиме, а расположение возможных источников может быть предложено путем контурирования оценок факторов. [50]

В геохимии разные факторы могут соответствовать разным минеральным ассоциациям и, следовательно, минерализации. [51]

В анализе микрочипов [ править ]

Факторный анализ можно использовать для суммирования данных микромассивов олигонуклеотидной ДНК высокой плотности на уровне зонда для Affymetrix GeneChips. В этом случае скрытая переменная соответствует концентрации РНК в образце. [52]

Реализация [ править ]

С 1980-х годов факторный анализ был реализован в нескольких программах статистического анализа:

  • BMDP
  • JMP (статистическое программное обеспечение)
  • Mplus (статистическая программа)]
  • Python : модуль Scikit-learn [53]
  • R (с базовой функцией factanal или функцией fa в пакете mental ). Вращения реализованы в пакете GPArotation R.
  • SAS (с использованием PROC FACTOR или PROC CALIS)
  • SPSS [54]
  • Stata

См. Также [ править ]

  • Дизайн экспериментов
  • Формальный анализ концепции
  • Факторный анализ высшего порядка
  • Независимый компонентный анализ
  • Неотрицательная матричная факторизация
  • Q методология
  • Система рекомендаций
  • Анализ причин
  • Теория граней

Ссылки [ править ]

  1. ^ Bandalos, Deborah L. (2017). Теория измерений и приложения для социальных наук . Гилфорд Пресс.
  2. ^ a b c Харман, Гарри Х. (1976). Современный факторный анализ . Издательство Чикагского университета. С. 175, 176. ISBN 978-0-226-31652-9.
  3. ^ Б с д е е г ч я Polit DF Beck CT (2012). Медсестринское исследование: создание и оценка доказательств для сестринской практики, 9-е изд . Филадельфия, США: Wolters Klower Health, Lippincott Williams & Wilkins.
  4. Перейти ↑ Meng, J. (2011). «Раскройте регуляции кооперативных генов с помощью микроРНК и факторов транскрипции в глиобластоме, используя модель неотрицательного гибридного фактора» . Международная конференция по акустике, обработке речи и сигналов . Архивировано из оригинала на 2011-11-23.
  5. ^ Liou, C.-Y .; Musicus, BR (2008). «Кросс-энтропийная аппроксимация структурированных гауссовских ковариационных матриц». Транзакции IEEE по обработке сигналов . 56 (7): 3362–3367. Bibcode : 2008ITSP ... 56.3362L . DOI : 10.1109 / TSP.2008.917878 . S2CID 15255630 . 
  6. ^ a b c Цвик, Уильям Р .; Велисер, Уэйн Ф. (1986). «Сравнение пяти правил определения количества компонентов, которые необходимо сохранить». Психологический бюллетень . 99 (3): 432–442. DOI : 10.1037 // 0033-2909.99.3.432 .
  7. Хорн, Джон Л. (июнь 1965 г.). «Обоснование и тест на количество факторов в факторном анализе». Психометрика . 30 (2): 179–185. DOI : 10.1007 / BF02289447 . PMID 14306381 . S2CID 19663974 .  
  8. ^ Dobriban, Эдгар (2017-10-02). «Перестановочные методы для факторного анализа и PCA». arXiv : 1710.00479v2 [ math.ST ].
  9. ^ * Ledesma, RD; Валеро-Мора, П. (2007). «Определение количества факторов, которые необходимо сохранить в EFA: простая в использовании компьютерная программа для проведения параллельного анализа» . Практическое оценочное исследование и оценка . 12 (2): 1–11.
  10. Перейти ↑ Tran, США, & Formann, AK (2009). Выполнение параллельного анализа при получении одномерности при наличии двоичных данных. Образовательные и психологические измерения, 69, 50-61.
  11. ^ a b Velicer, WF (1976). «Определение количества компонентов из матрицы частных корреляций». Психометрика . 41 (3): 321–327. DOI : 10.1007 / bf02293557 . S2CID 122907389 . 
  12. ^ а б Кортни, MGR (2013). Определение количества факторов, которые необходимо сохранить в EFA: использование SPSS R-Menu v2.0 для более разумных оценок. Практическая оценка, исследования и оценка, 18 (8). Доступно в Интернете: http://pareonline.net/getvn.asp?v=18&n=8
  13. ^ a b Варн, RT; Ларсен, Р. (2014). «Оценка предложенной модификации правила Гуттмана для определения количества факторов в исследовательском факторном анализе». Психологический тест и моделирование оценки . 56 : 104–123.
  14. ^ Ruscio, Джон; Рош, Б. (2012). «Определение количества факторов, которые необходимо сохранить в исследовательском факторном анализе с использованием данных сравнения известной факторной структуры». Психологическая оценка . 24 (2): 282–292. DOI : 10.1037 / a0025697 . PMID 21966933 . 
  15. ^ Гарридо, LE, и Абаде, FJ, и Ponsoda, В. (2012). Новый взгляд на параллельный анализ Хорна с порядковыми переменными. Психологические методы. Предварительная онлайн-публикация. DOI : 10,1037 / a0030005
  16. ^ Ревелль, Уильям (2007). «Определение количества факторов: на примере NEO-PI-R» (PDF) . Cite journal requires |journal= (help)
  17. ^ Revelle, Уильям (8 января 2020). «Психология: процедуры психологического, психометрического и личностного исследования» .
  18. ^ Кайзер, Генри Ф. (апрель 1960). «Применение электронных компьютеров к факторному анализу». Образовательные и психологические измерения . 20 (1): 141–151. DOI : 10.1177 / 001316446002000116 .
  19. ^ Bandalos, DL; Бём-Кауфман, MR (2008). «Четыре распространенных заблуждения в исследовательском факторном анализе» . В Лансе, Чарльз Э .; Ванденберг, Роберт Дж. (Ред.). Статистические и методологические мифы и городские легенды: доктрина, истина и басня в организационных и социальных науках . Тейлор и Фрэнсис. С. 61–87. ISBN 978-0-8058-6237-9.
  20. ^ Ларсен, R .; Варн, RT (2010). «Оценка доверительных интервалов для собственных значений в исследовательском факторном анализе» . Методы исследования поведения . 42 (3): 871–876. DOI : 10,3758 / BRM.42.3.871 . PMID 20805609 . 
  21. ^ Кеттел, Raymond (1966). «Осыпной тест на количество факторов». Многофакторные поведенческие исследования . 1 (2): 245–76. DOI : 10.1207 / s15327906mbr0102_10 . PMID 26828106 . 
  22. ^ Alpaydin (2020). Введение в машинное обучение (5-е изд.). С. 528–9.
  23. Перейти ↑ Russell, DW (декабрь 2002 г.). «В поисках основных параметров: использование (и злоупотребление) факторного анализа в бюллетене личности и социальной психологии». Бюллетень личности и социальной психологии . 28 (12): 1629–46. DOI : 10.1177 / 014616702237645 . S2CID 143687603 . 
  24. ^ a b Мулайк, Стэнли А (2010). Основы факторного анализа. Второе издание . Бока-Ратон, Флорида: CRC Press. п. 6. ISBN 978-1-4200-9961-4.
  25. ^ Спирмен, Чарльз (1904). «Общий интеллект объективно определен и измерен». Американский журнал психологии . 15 (2): 201–293. DOI : 10.2307 / 1412107 . JSTOR 1412107 . 
  26. Перейти ↑ Bartholomew, DJ (1995). «Спирмен и происхождение и развитие факторного анализа». Британский журнал математической и статистической психологии . 48 (2): 211–220. DOI : 10.1111 / j.2044-8317.1995.tb01060.x .
  27. ^ Терстон, Луи (1931). «Многофакторный анализ». Психологический обзор . 38 (5): 406–427. DOI : 10.1037 / h0069792 .
  28. ^ Терстон, Луи (1934). «Векторы разума». Психологический обзор . 41 : 1–32. DOI : 10.1037 / h0075959 .
  29. ^ Терстон, LL (1935). Векторы разума. Многофакторный анализ для выделения первичных признаков . Чикаго, Иллинойс: Издательство Чикагского университета.
  30. ^ Бок, Роберт (2007). «Переосмысление Терстона». В Кадеке, Роберт; МакКаллум, Роберт С. (ред.). Факторный анализ на 100 . Махва, Нью-Джерси: Lawrence Erlbaum Associates. п. 37. ISBN 978-0-8058-6212-6.
  31. ^ Mckeown, Брюс (2013-06-21). Q Методология . ISBN 9781452242194. OCLC  841672556 .
  32. ^ Стефенсон, В. (август 1935 г.). «Методика факторного анализа». Природа . 136 (3434): 297. Bibcode : 1935Natur.136..297S . DOI : 10.1038 / 136297b0 . ISSN 0028-0836 . S2CID 26952603 .  
  33. Перейти ↑ Sternberg, RJ (1977). Метафоры разума: концепции природы интеллекта . Нью-Йорк: Издательство Кембриджского университета. С. 85–111.[ требуется проверка ]
  34. ^ «Факторный анализ» . Архивировано из оригинального 18 августа 2004 года . Проверено 22 июля 2004 года .
  35. Варфоломей, ди-джей; Стил, Ф .; Galbraith, J .; Мустаки, И. (2008). Анализ многомерных данных социальных наук . Статистика в серии социальных и поведенческих наук (2-е изд.). Тейлор и Фрэнсис. ISBN 978-1584889601.
  36. ^ Jolliffe IT " Анализ основных компонентов" , Серия: Springer Series in Statistics, 2-е изд., Springer, NY, 2002, XXIX, 487 p. 28 илл. ISBN 978-0-387-95442-4 
  37. ^ Кеттел, RB (1952). Факторный анализ . Нью-Йорк: Харпер.
  38. ^ Fruchter, B. (1954). Введение в факторный анализ . Ван Ностранд.
  39. ^ Кеттел, RB (1978). Использование факторного анализа в поведенческих науках и науках о жизни . Нью-Йорк: Пленум.
  40. Перейти ↑ Child, D. (2006). Основы факторного анализа, 3-е издание . Bloomsbury Academic Press.
  41. ^ Gorsuch, RL (1983). Факторный анализ, 2-е издание . Хиллсдейл, Нью-Джерси: Эрлбаум.
  42. Перейти ↑ McDonald, RP (1985). Факторный анализ и связанные с ним методы . Хиллсдейл, Нью-Джерси: Эрлбаум.
  43. ^ а б Фабригар; и другие. (1999). «Оценка использования исследовательского факторного анализа в психологических исследованиях» (PDF) . Психологические методы.
  44. ^ a b Зур, Дайан (2009). «Анализ главных компонентов против исследовательского факторного анализа» (PDF) . SUGI 30 Proceedings . Проверено 5 апреля 2012 года .
  45. ^ Статистика SAS. "Анализ основных компонентов" (PDF) . Учебник по поддержке SAS .
  46. ^ Meglen, RR (1991). «Изучение больших баз данных: хемометрический подход с использованием анализа главных компонентов». Журнал хемометрики . 5 (3): 163–179. DOI : 10.1002 / cem.1180050305 . S2CID 120886184 . 
  47. ^ Браун, JD (январь 2009 г.). «Анализ основных компонентов и исследовательский факторный анализ - Определения, различия и выбор» (PDF) . Shiken: Информационный бюллетень SIG по тестированию и оценке JALT . Проверено 16 апреля 2012 года .
  48. Перейти ↑ Ritter, N. (2012). Сравнение методов без распространения и без распространения в факторном анализе. Документ, представленный на конференции Юго-Западной ассоциации исследований в области образования (SERA) 2012, Новый Орлеан, Лос-Анджелес (ED529153).
  49. ^ Subbarao, C .; Суббарао, штат Невада; Чанду, С. Н. (декабрь 1996 г.). «Характеристика загрязнения подземных вод с помощью факторного анализа». Экологическая геология . 28 (4): 175–180. Bibcode : 1996EnGeo..28..175S . DOI : 10.1007 / s002540050091 . S2CID 129655232 . 
  50. ^ Любовь, D .; Хальбауэр, Дания; Amos, A .; Гранова, РК (2004). «Факторный анализ как инструмент управления качеством подземных вод: два тематических исследования в Южной Африке». Физика и химия Земли . 29 (15–18): 1135–43. Bibcode : 2004PCE .... 29.1135L . DOI : 10.1016 / j.pce.2004.09.027 .
  51. ^ Бартон, ES; Хальбауэр, ДК (1996). «Микроэлементные и изотопные составы U-Pb типов пирита в протерозойском черном рифе, трансваальская толща, Южная Африка: влияние на генезис и возраст». Химическая геология . 133 (1–4): 173–199. DOI : 10.1016 / S0009-2541 (96) 00075-7 .
  52. ^ Hochreiter, Зепп; Клеверт, Джорк-Арне; Обермайер, Клаус (2006). «Новый метод обобщения данных уровня зонда affymetrix» . Биоинформатика . 22 (8): 943–9. DOI : 10.1093 / биоинформатики / btl033 . PMID 16473874 . 
  53. ^ "sklearn.decomposition.FactorAnalysis - документация scikit-learn 0.23.2" . scikit-learn.org .
  54. ^ MacCallum, Роберт (июнь 1983). «Сравнение программ факторного анализа в SPSS, BMDP и SAS». Психометрика . 48 (2): 223–231. DOI : 10.1007 / BF02294017 . S2CID 120770421 . 

Дальнейшее чтение [ править ]

  • Чайлд, Деннис (2006), Основы факторного анализа (3-е изд.), Continuum International , ISBN 978-0-8264-8000-2.
  • Fabrigar, LR; Wegener, DT; MacCallum, RC; Страхан, EJ (сентябрь 1999 г.). «Оценка использования исследовательского факторного анализа в психологических исследованиях». Психологические методы . 4 (3): 272–299. DOI : 10.1037 / 1082-989X.4.3.272 .
  • Б.Т. Грей (1997) Факторный анализ высшего порядка (доклад на конференции)
  • Дженнрих, Роберт И., "Вращение для простых нагрузок с использованием функции потери компонентов: наклонный случай", Psychometrika , Vol. 71, № 1, стр. 173–191, март 2006 г.
  • Кац, Джеффри Оуэн и Рольф, Ф. Джеймс. Функциональная плоскость основного продукта: наклонное вращение к простой конструкции. Многомерное исследование поведения , апрель 1975 г., Vol. 10. С. 219–232.
  • Кац, Джеффри Оуэн и Рольф, Ф. Джеймс. Функциональная плоскость: новый подход к повороту простой конструкции. Psychometrika , март 1974, т. 39, № 1, с. 37–51.
  • Кац, Джеффри Оуэн и Рольф, Ф. Джеймс. Кластерный анализ функциональных точек. Систематическая зоология , сентябрь 1973 г., т. 22, № 3, с. 295–301.
  • Мулайк, С.А. (2010), Основы факторного анализа , Chapman & Hall.
  • Проповедник, KJ; MacCallum, RC (2003). «Ремонт машины электрического факторного анализа Тома Свифта» (PDF) . Понимание статистики . 2 (1): 13–43. DOI : 10.1207 / S15328031US0201_02 . hdl : 1808/1492 .
  • Дж. Шмид и Дж. М. Лейман (1957). Разработка иерархических факторных решений. Психометрика , 22 (1), 53–61.
  • Томпсон, Б. (2004), Исследовательский и подтверждающий факторный анализ: понимание концепций и приложений , Вашингтон, округ Колумбия: Американская психологическая ассоциация , ISBN 978-1591470939.
  • Ханс-Георг Вольф, Катя Прейзинг (2005) Изучение структуры элементов и факторов более высокого порядка с помощью решения Шмида-Леймана: Синтаксические коды для SPSS и SAS Поведенческие методы исследования, инструменты и компьютеры , 37 (1), 48-58

Внешние ссылки [ править ]

  • Руководство по факторному анализу для новичков
  • Исследовательский факторный анализ. Рукопись книги Tucker, L. & MacCallum R. (1993). Получено 8 июня 2006 г. из: [1]
  • Гарсон, Дж. Дэвид, «Факторный анализ», из Statnotes: темы многомерного анализа . Получено 13 апреля 2009 г. из StatNotes: Topics in Multivariate Analysis, получено от Дж. Дэвида Гарсона из Университета штата Северная Каролина, Программа государственного управления.
  • Факторный анализ на 100 - материалы конференции
  • FARMS - Факторный анализ для надежного суммирования микрочипов, пакет R