Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Факторная структура в общем виде





(М — число факторов, Р — число переменных)

        к   м кг
  «11 а12   «14   а к]
  «21 а22   а   а к]
               
  Я/1 ап   «,*   «»/ к)
               
Р аР[ ап   аРк   арм к}
X X, Х2   К      

 

Алгоритм факторного анализа обеспечивает максимально возможное при­ближение вычисленных, или восстановленных, коэффициентов корреляции к исходным корреляциям. Это достигается варьированием числа факторов и диагональными элементами корреляционной матрицы, на которых распола­гаются не единицы, как в компонентном анализе, а значения общностей.

Проблема числа факторов

Это первая проблема при проведении факторного анализа. Обычно зара­нее не известно, сколько факторов необходимо и достаточно для представле­ния данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Поэтому исследова­тель должен заранее определить или оценить их возможное количество. Для этого на первом этапе факторного анализа обычно применяют анализ глав­ных компонент и используют график собственных значений (Зсгее р1о1).

На рис. 16.2 представлен график собственных значений для компонент из табл. 16.3. Компонентные нагрузки интерпретации на данном этапе не под­лежат, нас интересуют только величины собственных значений.

Для определения числа факторов были предложены два критерия. Пер­вый — критерий Кайзера: число факторов равно числу компонент, собственные значения которых больше 1.

Второй способ определения числа факторов — критерий отсеивания Р. Кеттелла (зсгее—1ез1), требует построения графика собственных значений

Рис. 16.2. График собственных значений для пяти показателей интеллекта

 

(компьютерные программы предлагают этот график при выборе метода глав­ных компонент — зсгее р1о{). Количество факторов определяется приблизи­тельно по точке перегиба на графике собственных значений до его выхода на по­логую прямую после резкого спада. При этом проверяются три гипотезы: если К— точка перегиба, то возможное количество факторов равно К- 1, К\\ К+ 1.

По первому критерию (Кайзера) в нашем примере число факторов равно двум, так как первые два собственных значения больше 1. По второму крите­рию (Р. Кеттелла) — от двух до четырех, так как точке перегиба соответствует третья компонента (см. рис. 16.2).

При определении числа факторов на практике следует помнить, что ука­занные критерии являются лишь примерным ориентиром. Окончательное ре­шение о числе факторов принимается только после интерпретации факторов.

Проблема общности

Это вторая главная проблема факторного анализа. Единичная дисперсия каждой переменной представлена в факторном анализе как сумма ее общно­сти и характерности:

1 = И2 + е2,

I I'

где к2 — общность переменной с номером /'; е2 — ее характерность.

Общность — это часть дисперсии переменной, обусловленная действием общих факторов. Характерность — часть ее дисперсии, обусловленная специ­фикой данной переменной и ошибками измерения. Иначе говоря, общность — это полный вклад всех факторов в единичную дисперсию переменной, а ха­рактерность — это разность полной единичной дисперсии переменной и ее общности. Общность переменной I равна сумме квадратов ее нагрузок по всем М факторам (по строке факторных нагрузок):

м

к=1

Полнота факторизации — важное понятие факторного анализа, вытекаю­щее из определения общности. Любой элемент факторной структуры — фак­торная нагрузка переменной, возведенная в квадрат, — приобретает смысл доли дисперсии переменной, обусловленной данным фактором. Суммируя эти доли по строке, мы получаем общность — долю дисперсии переменной, обусловленную влиянием всех общих факторов.

Суммарная дисперсия всех переменных есть сумма единичных дисперсий всех признаков, что равно просто количеству признаков. Суммируя доли дис­персии всех переменных по одному фактору, мы получаем суммарную дис­персию всех переменных, обусловленную действием этого фактора. Разделив суммарную дисперсию, обусловленную действием данного фактора, на ко­личество признаков, мы получим долю дисперсии, обусловленную данным фактором, или информативность (мощность) фактора. Сумма квадратов всех элементов факторной структуры — факторных нагрузок — равна сумме всех общностей и суммарной дисперсии всех переменных, обусловленной общи­ми факторами. Эта величина, деленная на количество признаков, известна как полнота факторизации:

М 1 М 1 Р 1 М Р

к=1 г к=1 г 1=1 г к=М=1

где Ук — мощность фактора с номером к\ Кк — собственное число фактора с номером /; к} — общность переменной /; а}к — вклад фактора / в переменную к\ М — число факторов; Р — число переменных.

Понятно, что качество факторного анализа тем выше, чем выше полнота факторизации. И эта величина является одним из важных показателей при выборе пользователем варианта решения, наряду с показателем того, насколь­ко полно воспроизводятся коэффициенты корреляции. Надо отметить, что четких статистических критериев полноты факторизации не существует. Тем не менее, низкие ее значения, например меньше 0,7, свидетельствуют о же­лательности сокращения количества признаков или увеличения количества факторов.

Вообще говоря, проблема общностей заключается в том, что они, как и число общих факторов, не известны до начала анализа, но должны каким-то обра­зом задаваться, так как величины факторных нагрузок зависят от величин общностей. Отметим, что в компонентном анализе этой проблемы не суще­ствует: общность каждой переменной равна 1, при условии выделения всех Р компонент. Различия в методах факторного анализа и определяются тем, как решается проблема общностей.

Методы факторного анализа

Методы факторного анализа — это различные способы получения фак­торной структуры при заданном числе факторов. Эти способы, как уже гово­рилось, отличаются решением проблемы общностей. Рассмотрим наиболее часто применяемые методы: анализ главных компонент, метод главных фак­торов, факторный анализ образов (общности равны квадрату КМК), метод не взвешенных наименьших квадратов, обобщенный метод наименьших квад­ратов и метод максимального правдоподобия.

Анализ главных компонент (Рппс1ра1 СотропеШз) иногда используется в ка­честве факторного анализа, хотя это и не вполне корректно. При использова­нии этого метода общность каждой переменной получается автоматически, путем суммирования квадратов ее нагрузок по всем главным компонентам. Вопрос о приближении восстановленных коэффициентов корреляции к ис­ходным корреляциям не решается. В результате факторная структура иска­жается в сторону преувеличения абсолютных величин факторных нагрузок.

Факторный анализ образов (общности равны квадрату КМК) (1та§е Рас1о- пп§) — это метод главных компонент, применяемый к так называемой реду­цированной корреляционной матрице, у которой вместо единиц на главной диагонали располагаются оценки общностей. Общность каждой переменной оценивается предварительно, как квадрат коэффициента множественной корреляции (КМК) этой переменной со всеми остальными. Такая оценка, с точки зрения теоретиков факторного анализа, приводит к более точным ре­зультатам, чем в анализе главных компонент. Но значения общностей недо­оцениваются, что также приводит к искажениям факторной структуры, хотя и меньшим, чем в предыдущем случае.

Метод главных осей (Рппс1ра1 Ахи Рас(опп§), позволяет получить более точ­ное решение. На первом шаге общности вычисляются по методу главных ком­понент. На каждом последующем шаге собственные значения и факторные нагрузки вычисляются исходя из предыдущих значений общностей. Оконча­тельное решение получается при выполнении заданного числа итераций или достижении минимальных различий между общностями на данном и преды­дущем шагах.

Метод не взвешенных наименьших квадратов (ШшщШей 1еа$(хциагех) — минимизирует квадраты остатков (разностей) исходной и воспроизведенной корреляционных матриц (вне главной диагонали). На первом шаге оценива­ются общности через квадрат КМК. Затем вычисляется факторная структура и восстанавливаются коэффициенты корреляции. Проверяется разность квад­ратов исходных и вычисленных корреляций. За новые значения общностей принимаются вычисленные по полученной факторной структуре. На втором шаге вычисляется новая факторная структура, и снова проверяется соответ­ствие исходных и восстановленных коэффициентов корреляции. Процесс повторяется многократно до тех пор, пока не достигается минимально воз­можная разница между исходными и вычисленными корреляциями при за­данном числе факторов. Метод, по определению, дает минимальные ошибки факторной структуры при фиксированном числе факторов. Реализация ме­тода в компьютерных программах позволяет проверить расхождения между исходными и вычисленными корреляциями. Наличие многочисленных рас­хождений может служить дополнительным аргументом в пользу увеличения числа факторов.


Обобщенный метод наименьших квадратов (СепегаГцес! 1еаз1 хдиагех) — отли­чается от предыдущего тем, что для каждой переменной вводятся специаль­ные весовые коэффициенты. Чем больше общность переменной, тем в боль­шей степени она влияет на факторную структуру (имеет больший вес). Это соответствует основному принципу статистического оценивания, по которо­му менее точные наблюдения учитываются в меньшей степени. В этом — ос­новное преимущество этого метода перед остальными.

Метод максимального правдоподобия (Махтит ИкеИНоой) также направлен на уменьшение разности исходных и вычисленных корреляций между при­знаками. Дополнительно этот метод позволяет получить важный показатель полноты факторизации — статистическую оценку «качества подгонки». Ме­рой качества является оценка различия исходных и вычисленных коэффици­ентов корреляции по х2-критерию, значимость которого определяется в за­висимости от числа факторов и количества переменных. Если критерий показывает значимое отклонение при Л/-факторной модели, следует перейти к модели с М+1 факторами, и так до тех пор, пока отклонение исходных и вы­численных корреляций перестанет быть статистически значимым по ^-кри­терию. Таким образом, х2-критерий позволяет определить минимально допу­стимое количество факторов для данного числа переменных. Однако следует помнить, что этот критерий, как и остальные формальные критерии, являет­ся дополнительным. Окончательное же решение о числе факторов принима­ется после содержательной интерпретации факторной структуры.

Вряд ли возможно дать общие рекомендации о преимуществе или недо­статке того или иного метода. Можно лишь отметить, что анализ главных ком­понент дает наиболее грубое решение, а метод максимального правдоподо­бия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, ко­торый позволяет получить наиболее простую и доступную интерпретации факторную структуру.

Проблема вращения и интерпретации

Это третья основная проблема факторного анализа, решение которой свя­зано с геометрическим представлением факторной структуры. Необходимость решения этой проблемы обусловлена тем, что, как правило, результаты фак­торизации непосредственно не подлежат интерпретации. В то же время цен­ность результата факторного анализа определяется прежде всего возможно­стью его однозначной интерпретации.

Рассмотрим результат применения метода главных осей к данным о пяти показателях способностей. Из табл. 16.5 видно, что все переменные имеют наибольшие нагрузки по первому фактору, и невозможно определить, какие переменные идентифицируют второй фактор. То есть данная факторная струк­тура не поддается интерпретации. Для ответа на вопрос о распределении пе-

Табл ица 16.5 Факторная структура пяти показателей способностей (метод главных осей, до вращения)
Переменные Факторные нагрузки а,к Общность к!
  Ъ    
  0,807 -0,482 0,88
  0,774 -0,481 0,83
  0,661 0,416 0,61
  0,580 0,470 0,56
  0,675 0,317 0,56
Собственное значение \к 2,478 0,959 3,44
Доля дисперсии 0,496 0,192 0,69

 

ременных по факторам и необходимо решить проблему вращения факторов относительно признаков.

Факторную структуру графически можно представить в виде точек-при­знаков в пространстве М факторов. Положение каждой точки задается фак­торными нагрузками как координатами этой точки по соответствующим осям- факторам. Для нашего примера такое графическое изображение факторной структуры представлено на рис. 16.3.

Рис. 16.3. График пяти показателей интеллекта в осях двух факторов до вращения Фактор 1

0,6" 0,4- 0,2-

-0,2- -0,4- -0,6-

см о.

Расстояние каждой точки от начала координат или длина вектора-пере- менной равны сумме квадратов всех координат этой точки (конца вектора- переменной). Поскольку координаты — это факторные нагрузки, то длина каждого вектора равна общности соответствующей переменной.

Без доказательства укажем, что коэффициент корреляции между каждой парой переменных равен косинусу угла между соответствующими векторами в пространстве общих факторов. Иначе говоря, чем выше корреляция, тем мень­ше угол между соответствующими переменными.

Указанные соотношения между переменными в осях факторов никак не изменятся, если мы повернем оси факторов на любой угол относительно пе­ременных, при условии соблюдения взаимной ортогональности (перпенди­кулярности) факторов. Из этого следует вывод, что мы можем поворачивать факторы относительно переменных как угодно, соблюдая ортогональность факторов. При этом наиболее предпочтительно, чтобы каждая переменная в результате вращения оказалась вблизи оси фактора, иными словами, имела бы максимальную нагрузку по одному фактору и минимальные — по всем остальным. Только в этом случае каж­дая переменная будет соотнесена только с одним фактором, что и тре­буется для интерпретации факторной структуры.

Каждая переменная имеет большую нагрузку только по одному из факторов

В нашем примере (рис. 16.3) жела­телен поворот осей факторов по часовой стрелке так, чтобы фактор 1 прошел вблизи переменных 1 и 2, а фактор 2 — вблизи переменных 3—5. Решение, при котором каждая переменная имеет большую нагрузку только по одному факто­ру, а по остальным ее нагрузки близки к нулю, называется простой структурой.

На заре появления многофакторного анализа проблема вращения решалась графически. Чертились графики факторной структуры — по одному для каж­дой пары факторов. Затем делали графический поворот осей факторов относи­тельно переменных, после чего линейкой измеряли новые проекции перемен­ных на эти оси. Таким образом получали факторную структуру после вращения.

В настоящее время используются аналитические способы вращения, реа­лизованные во всех компьютерных программах факторного анализа. Работа аналитических методов подобна геометрическому вращению «вручную». Каж­дая пара факторов поворачивается относительно переменных до тех пор, пока не достигается наиболее возможная простота структуры. В одних случаях кри­терием простоты является факторная сложность переменных (квартимакс), в других — индекс сложности каждого фактора (варимакс), где факторная слож­ность переменной пропорциональна числу общих факторов, связанных с ней, а индекс сложности фактора пропорционален числу переменных, с ним связанных. Наиболее широко применяется вращение, где на каждом шаге простота структуры определяется по критерию варимакс Г. Кайзера — вари- макс-вращение.

Результат применения варимакс-вращения к факторной структуре из табл. 16.5 представлен в табл. 16.6; графический результат — на рис. 16.4.


0,80" 0,70" 0,60- 0,50- см о. 0,40" & В 0.30- 0,20- 0,10- 0,00-
0,00 0,20 0,40 0,60 0,80 1,00 Фактор 1 Рис. 16.4. Факторная структура пяти показателей интеллекта после варимакс-вращения

После вращения каждая переменная имеет большую нагрузку только по одному фактору. Следовательно, каждый фактор может быть однозначно ин­терпретирован через входящие в него переменные: фактор 1 — по признакам 1 и 2, фактор 2 — по признакам 3 и 5. Так как переменная 1 — счет в уме, переменная 2 — числовые ряды, то фактор 1 может быть идентифицирован как «арифметические способности». Переменные, входящие в фактор 2 (ос­ведомленность, словарный запас, сходство), позволяют интерпретировать его как фактор словесного понимания.

Таб л и ца 16.6 Факторная структура пяти показателей интеллекта после варимакс-вращения
Переменные   Рг И[18]
  0,921 0,217 0,88
  0,903 0,193 0,83
  0,183 0,757 0,61
  0,088 0,739 0,56
  0,260 0,700 0,56
СКН* 1,773 1,694 3,44
Доля дисперсии 0,355 0,339 0,69

* СКН — сумма квадратов факторных нагрузок1

 

Проблема оценки значений факторов

После интерпретации факторной структуры допустима оценка значений факторов для объектов. Это позволяет перейти от множества исходных пере­менных к существенно меньшему числу факторов как новых переменных. Это может понадобиться исследователю как для более компактного представле­ния различий между объектами (или их группами), так и для дальнейшего анализа — регрессионного, дисперсионного и т. д. В этом смысле факторный анализ как общенаучный метод выполняет задачу сокращения размерности набора переменных с минимальными потерями исходной информации.

В качестве оценки значения фактора / для объекта к используется линейная

комбинация значений исходных переменных X.

р

■4 = ЕР/Л* =Р|/*1* +Р2/*2* + - + РР1ХРк, (16.6)

У=1

где/ — значение фактора с номером / для объекта к; Хд — значение признака с номером у для этого объекта; (3,^ — факторный коэффициент признака у для фактора /.

Поскольку известны корреляции между исходными переменными и кор­реляции этих переменных с факторами (факторные нагрузки), то в качестве наиболее состоятельной оценки факторных коэффициентов чаще всего вы­ступают коэффициенты множественной регрессии. В качестве «зависимой» пе­ременной выступает фактор, в качестве «независимых» — исходные перемен­ные, а вычисления производятся по формуле 15.3.

Вычисленные по модели множественной регрессии оценки факторных коэффициентов далее используются для вычисления всех оценок значений факторов для каждого объекта по формуле 16.6. Таким образом, исследова­тель переходит от множества Р переменных к небольшому числу М новых переменных-факторов, интерпретируемых через исходные переменные. От­метим, что средние значения каждой такой новой переменной для всех объек­тов равно 0, а стандартное отклонение близко (но меньше) 1.

Проблема оценки значений факторов связана с тем, что невозможно точно выразить общий фактор через исходные переменные, так как каждая из этих переменных содержит помимо общности и характерную часть, которую не­возможно отделить. Поэтому можно получить лишь оценку значений факто­ров по исходным переменным, надежность которой обладает большей или меньшей определенностью — в зависимости от вида исходных данных и фак­торной структуры.

Зависимость надежности факторных оценок от факторной структуры вы­ражается в следующем. Чем меньше суммарная общность всех переменных, тем меньше надежность факторных оценок всех факторов. Чем меньше ин­формативность фактора (сумма квадратов факторных нагрузок по столбцу), тем меньше надежность факторных оценок данного фактора.

В связи с надежностью факторных оценок особое значение приобретает качество измерения исходных переменных. Чем больше исходные переменные соответствуют требованиям, которые предъявляются к метрическим перемен­ным, тем надежнее факторные оценки. Если переменные измерены в поряд­ковой или, тем более, в дихотомической шкале, то надежность факторных оценок снижается до непредсказуемого уровня. Тем не менее, некоторые ав­торы (см. К. Иберла, 1980) на основе факторного моделирования доказыва­ют, что в случае исходных порядковых и даже дихотомических данных фак­торные оценки могут быть состоятельными. Условиями состоятельности факторных оценок являются действительно простая факторная структура, а также высокие значения общностей и факторных нагрузок переменных.

В заключение обзора математико-статистических идей факторного ана­лиза заметим, что современный факторный анализ — изящная математиче­ская процедура, имеющая достаточное статистическое обоснование. Это вы­годно отличает данный метод от остальных. Эта изящность, наряду с исходным психологическим обоснованием, однако, часто вводит в заблуждение нович­ка, ожидающего получить «готовый ответ» в результате применения фактор­ного анализа. Необходимо помнить, что факторный анализ не добавляет никакой новой информации к эмпирическим данным. Его задача — в обес­печении возможности интерпретировать данные. Качество же интерпрета­ции целиком зависит от исследователя, оттого, насколько и как он понимает исходные измерения, основы и процедуру факторного анализа.

ПОСЛЕДОВАТЕЛЬНОСТЬ ФАКТОРНОГО АНАЛИЗА

Особенность факторного анализа заключается в неопределенности реше­ния его основных проблем, изложенных в предыдущем параграфе. Нет чет­ких критериев качества их решения, есть лишь рекомендации, которыми руководствуется исследователь в своем стремлении содержательно интерпре­тировать получаемые результаты. Поэтому факторный анализ — это пошаго­вая процедура, где на каждом шаге исследователь принимает решение о даль­нейших преобразованиях данных. Главным же ориентиром на этом пути остается возможность получения содержательной интерпретации конечных результатов.

Весь процесс факторного анализа можно представить как выполнение шести этапов:

1. Выбор исходных данных.

2. Предварительное решение проблемы числа факторов.

3. Факторизация матрицы интеркорреляций.

4. Вращение факторов и их предварительная интерпретация.

5. Принятие решения о качестве факторной структуры.

6. Вычисление факторных коэффициентов и оценок.

Исследователь, в зависимости от своих целей, решает, сколько раз повто­рить эту последовательность, какие из этапов будут пропущены и насколько глубоко будет проработан каждый из них. Например, если исследователя ин­тересует только структура взаимосвязей признаков, то достаточно выполнить эту последовательность один раз, без последнего этапа.

Этап 1. Выбор исходных данных

Модель факторного анализа разрабатывалась для метрических данных. Поэтому первое требование к исходным данным — представление всех при­знаков в метрической шкале (не обязательно с одинаковыми средними и дис­персиями).

Включение в анализ порядковых или бинарных данных допустимо, но ис­следователь должен отдавать себе отчет, что искажения факторной структуры при этом будут соответствовать искажениям коэффициентов корреляций, и характер этих искажений неизвестен. В общем случае желательно перейти к единой шкале для всех признаков, либо ранговой, либо бинарной, затем вы­числять матрицу интеркорреляций, выбирая соответствующие меры взаимо­связи. Исследователь потеряет при этом существенную долю исходной ин­формации. А о допустимости дальнейшего вычисления значений факторных коэффициентов и оценок для объектов известно мало. Можно лишь сказать, что достоверность и ценность конечного результата обратно пропорциональ­ны доле потерянной исходной информации.

Если цель факторного анализа заключается только в определении струк­туры взаимосвязей переменных, то допустимо применение порядковых дан­ных, но перед проведением факторного анализа необходимо перейти к ран­гам по каждой переменной. Допустимо также использовать факторный анализ в отношении дихотомических переменных, если задача ограничивается оп­ределением структуры взаимосвязей и дихотомические корреляции между переменными не очень велики (не превышают 0,7)'.

Порядковые и даже дихотомические данные могут использоваться для вычисления оценок факторов, но при условии действительно простой фак­торной структуры, высоких значениях общностей и факторных нагрузок переменных, определяющих каждый фактор (К. Иберла, 1980). При этом же­лательно проверять устойчивость факторной структуры на параллельных вы­борках.

Как и в других многомерных методах, недопустимы функциональные за­висимости между переменными и корреляции, близкие к единице.

Количественное соотношение признаков и объектов зависит от целей исследования. Если цель анализа — изучение структуры взаимосвязей при­знаков, уменьшение их исходного количества путем перехода к новым пере­менным — факторам, то строгих ограничений нет. Желательно лишь, чтобы количество признаков было не меньше количества объектов. Если исследо­ватель хочет обнаружить и обосновать наличие факторов за взаимосвязями переменных, то желательно иметь в три раза больше объектов, чем призна­ков. Данное соотношение может сложиться и в процессе анализа — при отсе­ивании мало информативных переменных. Если же стоит задача обоснова­ния выявленной факторной структуры для генеральной совокупности, то объектов должно быть еще больше, для проверки устойчивости этой структу­ры на параллельных выборках.

Этап 2. Решение проблемы числа факторов

На этом этапе матрица интеркорреляций исходных признаков обрабаты­вается с использованием анализа главных компонент. Применяется крите­рий отсеивания Р. Кеттелла и критерий Кайзера — величины собственного значения фактора, большего 1 (ЕщепуаЬе, X > 1). Эти критерии не являются жесткими, поэтому далее проверяется несколько гипотез о числе факторов. Начинать при этом рекомендуется с максимально возможного числа факто­ров, с учетом обоих критериев, постепенно уменьшая их число.

Этап 3. Факторизация матрицы интеркорреляций

Выбирается метод факторизации, желательно — главных осей, наимень­ших квадратов или максимального правдоподобия. Задается число факторов, в соответствии с проверяемой гипотезой. Результатом данного этапа являет­ся матрица факторных нагрузок (факторная структура) до вращения, которая не подлежит интерпретации.

Полезной информацией на этом этапе могут являться суммарная доля дис­персии (информативность) факторов и значения общностей переменных. Суммарная доля дисперсии — показатель того, насколько полно выделяемые факторы могут представить данный набор признаков, а этот набор — выделя­емые факторы. Общность переменной — показатель ее «участия» в фактор­ном анализе, насколько она влияет на факторную структуру. Переменные с наименьшими общностями — ближайшие кандидаты на исключение из ана­лиза в дальнейшем.

Этап 4. Вращение факторов и их предварительная интерпретация

На этом этапе выбирается один из аналитических методов вращения фак­торов, обычно — варимакс-вращение (Уапшах погшайгес!). Существуют и дру­гие методы вращения, в том числе косоугольного, но они выходят за рамки нашего рассмотрения. В результате вращения достигается факторная струк­тура, наиболее доступная для интерпретации при данном соотношении пе­ременных и факторов.

Интерпретация факторов производится по таблице факторных нагрузок после вращения в следующем порядке. По каждой переменной (строке) выде­ляется наибольшая по абсолютной величине нагрузка — как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная. После про­смотра всех строк — переменных, начинают просмотр столбцов — факторов. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору — выделенных на преды­дущем шаге. При этом обязательно учитывается знак факторной нагрузки переменной. Если знак отрицательный, это отмечается как противополож­ный полюс переменной. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные. Если трудно подобрать термин из соответствующей теории, до­пускается наименование фактора по имени переменной, имеющей по срав­нению с другими наибольшую нагрузку по этому фактору.

Этап 5. Принятие решения о качестве факторной структуры

Формальное требование к факторной структуре сформулировал Л. Терстоун еще в 1930-х годах, назвав его принципом простой структуры. Геометрически принцип простой структуры означает, что все переменные располагаются на осях факторов, то есть каждая переменная имеет близкие к нулю нагрузки по всем факторам, кроме одного. На практике достижение такого результата с первого раза маловероятно, но качество факторной структуры определяется степенью приближения к простой структуре.

Следует отметить общий принцип соотношения качества факторной струк­туры и качества исходных данных: чем ниже качество исходных данных в смысле требований, предъявляемых к метрическим переменным, тем выше требования к простоте факторной структуры, величине общностей и фактор­ных нагрузок.

В настоящее время не существует формальных критериев соответствия факторной структуры простой. Поэтому основным критерием остается воз­можность хорошей содержательной интерпретации каждого фактора по двум и более исходным переменным. Если перед исследователем стоит дополни­тельно проблема обоснования устойчивости (воспроизводимости) факторной структуры в генеральной совокупности, то добавляется требование однознач­ного соотнесения каждой переменной с одним из факторов. Это требование означает, что каждая переменная имеет большую по абсолютной величине нагрузку (0,7 и выше) только по одному фактору и малые (0,2 и менее) — по всем остальным.

Можно предложить способы максимального приближения к простой структуре путем пошагового сокращения числа факторов и переменных.

1. Если по результатам интерпретации выявлен фактор, по которому ни одна из переменных не получила максимальной нагрузки (по строке), то это свидетельствует о необходимости сокращения количества факторов на один и повторения этапов 3 и 4 с новым числом факторов. То же касается фактора, идентифицируемого лишь по одной переменной, когда остальные в него не попадают даже с второстепенными нагрузками.

2. Определяются неоднозначные переменные. Каждая такая переменная имеет примерно одинаковые по абсолютной величине максимальные нагрузки по двум и более факторам. Если обосновывается устойчивость факторной структуры, то неоднозначной является переменная, у которой между макси­мальной и следующей за ней по величине нагрузкой разность менее 0,5. Нео­днозначные переменные поочередно удаляются из числа исходных перемен­ных, и каждый раз повторяются этапы 3 и 4.

Очевидно, что приближение к простой структуре связано с невосполни­мой потерей исходной эмпирической информации. И каждый раз исследо­ватель должен решать, насколько целесообразна эта потеря в свете стоящих перед ним задач. Наиболее жестки требования к простой структуре в случае обоснования устойчивости и воспроизводимости факторов, например, при разработке теста или факторной теоретической модели. Гораздо мягче тре­бования при решении наиболее часто встречающихся задач — при изуче­нии структуры взаимосвязей или при сокращении исходного набора при­знаков для дальнейшего исследования, например, различий между группами объектов.

Этап 6. Вычисление факторных коэффициентов и оценок

Это заключительный, наиболее однозначный и простой этап факторного анализа.

Оценки факторных коэффициентов являются коэффициентами линейного уравнения, связывающего значение фактора и значения исходных перемен­ных. Они показывают, с каким весом входят исходные значения каждой пе­ременной в оценку фактора. Факторные коэффициенты можно использовать для вычисления факторных оценок для новых объектов, не включенных ра­нее в факторный анализ.

Факторные оценки — значения факторов для каждого объекта (испытуе­мого). Их получение чаще всего и является конечным результатом факторно­го анализа. Вычисленные оценки факторов, как новые переменные, являют­ся независимыми, отражающими реальную структуру взаимосвязей исходных признаков и наиболее полно передающими исходную эмпирическую инфор­мацию. В этом факторные оценки выгодно отличаются от других способов интегрирования исходных данных, например от простого суммирования пун­ктов теста или анкеты в шкалы.

ПРИМЕР 16.2_____________________________________________________________________________________

До широкого распространения персональных компьютеров полновесный фактор­ный анализ был экзотической, весьма трудоемкой многоэтапной процедурой, ког­да очередной шаг исследователь выбирает по результатам выполнения предыду­щих этапов. В настоящее время можно контролировать процесс факторного анализа без «посредников» (программиста, операторов), пользуясь современным программ­ным обеспечением. Для этого не нужны знания программиста и математика, до­статочны осведомленность в основных математико-статистических идеях метода и умение «читать» промежуточные и конечные результаты факторного анализа. При этом факторный анализ может быть рекомендован для решения очень широкого круга не только исследовательских, но и практических задач. Перечислим некото­рые из них.

1. Факторный анализ как инструмент интерпретации позволяет быстро выделить группировки (кластеры) взаимосвязанных переменных, решая проблемы корреля­ционного анализа: наличия множества переменных и множества статистических проверок.

2. Факторный анализ как альтернатива простого суммирования значений исход­ных переменных позволяет учитывать реальную структуру данных и избегать из­лишних потерь драгоценной исходной информации. Затраты времени и сил на та­кую обработку данных при помощи факторного анализа часто меньше, чем при суммировании баллов «вручную». При этом выигрыш весьма ощутим — в деталь­ности и корректности получаемых результатов.

3. Как подготовительный этап для прогнозирования факторный анализ позволяет получить некоррелированные интегральные переменные (факторы), наиболее при­годные для применения в регрессионном или дискриминантном анализе.

4. При исследовании индивидуальных или межгрупповых различий по множеству признаков факторный анализ позволяет сократить исходное множество признаков до нескольких факторов, по кото







ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...

Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.