Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







ИСХОДНЫЕ ДАННЫЕ, ПРОЦЕДУРА И РЕЗУЛЬТАТЫ





Исходными данными для МРА является набор переменных, измеренных для выборки объектов (испытуемых). Одна из переменных определяется как «зависимая», остальные — как «независимые» переменные.

ПРИМЕР 15.1_____________________________________________________________________

Перед исследователем стоит задача предсказания успеваемости пяти абитуриентов поданным вступительных тестов (4 теста). Кроме того, его интересует, какие тесты обладают наибольшей предсказательной силой в отношении последующей успева­емости. В качестве исходных данных психолог имеет для каждого из 20 учащихся предыдущего набора средний балл отметок и 4 показателя тестирования. В его рас­поряжении имеются результаты применения тех же 4 тестов для пяти абитуриен­тов, и исследователь надеется предсказать для них средний балл успеваемости. Та­ким образом, исходными данными для МРА являются: средний балл отметок как «зависимая» переменная (У) и 4 «независимых» переменных — результатов тестов (Тез11, 1ез1 2, Гей 3, Гей 4) (табл. 15.1).

Таблица 15.1

Пример исходных данных для МРА

Гей 1 Гей 2 Гей 3 Гей 4 У У
  86,00 110,00 110,00 101,00 3,88  
  80,00 97,00 99,00 100,00 3,64  
  93,00 107,00 103,00 103,00 4,11  
  87,00 117,00 93,00 88,00 3,54  
             
  120,00 94,00 110,00 105,00 3,71  
  74,00 121,00 100,00 100,00    
  96,00 114,00 114,00 103,00    
  104,00 73,00 105,00 95,00    
  94,00 121,00 115,00 104,00    
  91,00 129,00 105,00 98,00    

 

Первые 20 объектов — это учащиеся предыдущего набора, для которых известен средний балл успеваемости, последние 5 объектов — это абитуриенты, для которых известны только результаты тестирования. Последний столбец (У) — это оценки «зависимой» переменной, которые исследователь надеется получить в результате применения МРА. Корреляции исходных переменных приведены в табл. 15.2.

Таблица 15.2

Корреляция исходных данных для МРА

  Гей 1 Гей 2 Гей 3 Гей 4 У
Гей 1   -0,015 0,263 0,402 0,639
Гей 2 -0,015   0,356 0,317 0,552
Гей 3 0,263 0,356   0,772 0,706
Гей 4 0,402 0,317 0,772   0,736
У 0,639 0,552 0,706 0,736  

 

Строгих указаний о соотношении количества объектов N и количества признаков Р нет, но чем больше объем выборки, тем выше шансы получить статистически достоверные результаты.

Главное требование к исходным данным — отсутствие линейных взаимосвя­зей между переменными, когда одна переменная является линейной произ­водной другой переменной. Таким образом, нельзя пользоваться суммой пе­ременных или их средним арифметическим наряду с самими переменными. Соответственно, недопустимы переменные, коэффициент корреляции кото­рых с любой другой переменной равен 1. Следует избегать включения в ана­лиз переменных, корреляция между которыми близка к 1, так как сильно кор­релирующая переменная не несет для анализа новой информации, добавляя излишний «шум».

Следующее требование — переменные должны быть измерены в метричес­кой шкале (интервалов или отношений) и иметь нормальное распределение. При нарушении этого требования, однако, результаты могут быть полезны, если, конечно, соблюдать известную осторожность.

Желательно отбирать для МРА «независимые» переменные, сильно кор­релирующие с «зависимой» переменной и слабо — друг с другом. Если «неза­висимых» переменных много и наблюдается множество связей между ними, то перед МРА целесообразно провести факторный анализ этих «независимых» переменных с вычислением значений факторов для объектов (см. главу 16).

Практически во всех компьютерных программах анализ начинается с за­дания «зависимой» и «независимых» переменных, а также одного из методов МРА. Основные методы МРА:

□ исходный или стандартный (Еп1ег);

□ прямой пошаговый (Ропуагс!);

□ обратный пошаговый (Васк\уагс1).


 

Стандартный метод учитывает в МРА все «зависимые» переменные. Поша­говый метод обычно выступает в нескольких модификациях, основными из которых являются прямой и обратный метод.

Прямой пошаговый метод поочередно включает в регрессионное уравнение каждую переменную, начиная с наиболее тесно коррелирующей с «зависимой» переменной, до тех пор, пока ^-уровень значимости р-коэффициента послед­ней из включенных переменных не превысит заданное значение (по умолча­нию — 0,1). Обратный пошаговый метод поочередно исключает переменные из анализа, начиная с той, которая имеет наибольшее значение ^-уровня значи­мости Р-коэффициента, до тех пор, пока все оставшиеся переменные не будут иметь статистически значимые р-коэффициенты (по умолчанию р<0,1). Та­ким образом, пошаговые методы позволяют отсеивать несущественные для предсказания «независимые» переменные — те, Р-коэффициенты которых ста­тистически не достоверны. Следует отметить, что разные варианты пошагово­го метода могут давать разные результаты, поэтому следует применить каждый из них и выбрать наиболее приемлемый конечный результат.

Основные результаты применения МРА:

К — коэффициент множественной корреляции;

Г — критерий Фишера и ^-уровень статистической значимости КМК;

К2 — квадрат КМК или КМД;

Р (Веш) — стандартизированные коэффициенты регрессии и /7-уровень их статистической значимости;

В — коэффициенты регрессии (регрессионного уравнения).

Дополнительно возможно вычисление оценок «зависимой» переменной (Ргеё1с1её Уа1ие§) и ошибок оценки (Ке§Миа1з).

Рассмотрим процедуру обработки, основные результаты и их интерпрета­цию, применив программу 8Р88 к данным примера 15.1.

ОБРАБОТКА НА КОМПЬЮТЕРЕ

Исходные данные (Ба*а Е<Шог) представляют собой 5 переменных (ьезь 1, ЬезЬ 2, ьезь 3, ЬезЬ 4, У) для 25 объектов; для последних 5 объектов значе­ния Уне определены (табл. 15.1).

1. Выбираем Апа!ухе > Ке§ге8$юп (Регрессионный) > Упеаг... (Линейный).

2. В открывшемся основном окне диалога Ьтеаг Ке§ге$$10п (Линейный регрессионный) выделяем и переносим из левого окна переменные при по­мощи кнопки >: зависимую переменную (У) в правое верхнее окно ферепйеп*), независимые переменные (ЬезЬ 1, (гезЬ 2, (гезЬ 3, (гезь 4) — в правое второе сверху окно (1п(1ереп(1еп18).

3. В том же окне диалога выбираем метод. Для этого в окне МеШой (Ме­тод) вместо принятого по умолчанию стандартного метода (Еп1ег) при помо­щи кнопки > выбираем один из пошаговых методов, в данном случае — Васк\уап1 (Обратный).

4. Для вычисления и сохранения оценок зависимой переменной1 в том же окне диалога нажимаем клавишу 8ауе... (Сохранить). В появившемся окне диалога в разделе РгеШс^ей Уа1ие$ (Предсказанные оценки) отмечаем флаж­ком Ш§1ап(]аг(Н2е(1 (Не стандартизованные). Нажимаем СогШпие (Продол­жить).

5. После указания всех установок в основном окне диалога Ыпеаг Ке^геазюп (Линейный регрессионный) нажимаем ОК и получаем результаты.

Рассмотрим наиболее важные результаты МРА.

Мойе1 Зиттагу(с)
МосЗе1 К Я Здиаге АсЗ^изЬей К Бдиаге зьа. Еггог оЕ (:Ье ЕзЫтаЬе
  . 886(а) .786 .729 .29023
  .879(Ь) . 773 .731 .28914

а РгесЗгсЬогз: (СопзЬагИ:), ТЕЗТ4, ТЕ5Т2, ТЕЗТ1, ТЕЗТЗ Ь РгесИсЬогз: (СопзЬапЬ), ТЕБТ4, ТЕ5Т2, ТЕЗТ1 с БерепсЗепЬ УаггаЫе: У

 

 

АМОУА(с)
МосЗе1   Зит оЕ Здиагез сЗГ Меап Здиаге Р 31д.
  Яедгезз1оп         . 159 13.755 . 000 (а)
  Нез1<3иа1 1.            
  ТоЬа1              
  Яедгезз1оп         . 520 18.183 .000(Ъ)
  Кез 1<3иа1              
  ТоЬа!              

а РгесЗгсЬогз: (СопзЬапЬ), ТЕЗТ4, ТЕЗТ2, ТЕЗТ1, ТЕЗТЗ Ь РгесЗгсЬогз: (СопзЬапЬ), ТЕЗТ4, ТЕЗТ2, ТЕЗТ1 с БерепсЗепЬ Уаг1аЫе: У

 

Эти две таблицы содержат наиболее общие результаты МРА для двух мо­делей (Моёе1): 1 — исходная модель, с включением всех переменных; 2 — окончательная модель, с исключенной переменной ьезьз. Интерпретации подлежат: в первой таблице — КМК (К) и КМД (К. Зциаге); во второй табли­це — значение критерия ^-Фишера и его /7-уровень значимости. КМК для окончательной модели статистически достоверен, поэтому модель множе­ственной регрессии может быть содержательно интерпретирована. КМД до­статочно большой, регрессионная модель объясняет более 77% дисперсии за­висимой переменной, и результаты предсказания могут быть приняты во внимание.

СоеЕЕ1с1епЬ8(а)
Мойе1   №з(:апс1агс112ес1 ЗЬапйагсИгесИ   51д.
    Сое{Е1с1епЬз Сое{{1с1еп<;з    
    В зъа. Веса    
      Еггог      
  (СопвЬапЪ) -1.486 .871   -1.705 . 109
  ТЕ5Т1 .011 . 004 .384 2.825 .013
  ТЕ5Т2 . 012 . 005 .334 2.565 . 022
  ТЕ5ТЗ . 014 .015 . 196 . 938 .363
  ТЕ5Т4 .017 .012 .295 1.380 . 188
  (СопзЬапЬ) -1.049 .733   -1.430 . 172
  ТЕ8Т1 .011 . 004 .379 2. 800 .013
  ТЕ5Т2 .014 . 005 .368 2. 949 .009
  ТЕ5Т4 .026 . 008 .445 3.161 .006

а ОерепйепЪ \/аг1аЫе: У

 

Эта таблица содержит величины не стандартизованных (В) и стандартизо­ванных (Ве1а) коэффициентов регрессии, а также критерии /-Стьюдента (I) и/7-уровни позволяющие определить их статистическую значимость.

Отметим, что во внимание могут быть приняты только те регрессионные ко­эффициенты, которые являются статистически значимыми.

Показателем вклада каждой из переменных в регрессионную модель слу­жат их р-коэффициенты. В результирующей модели (2) для предсказания остаются три переменные: переменная 1ез1: 3 исключена. Представляет ин­терес анализ причин исключения переменной 1ез13 из модели. Как видно из табл. 15.2, эта переменная весьма существенно коррелируете зависимой пе­ременной. Однако она сильно связана и с переменной 1ез14, что обусловли­вает существенное снижение ее р-коэффициента: в исходной модели (1) он наименьший из всех остальных (р = 0,196). Исключение переменной 1ез1 3 повышает предсказательную ценность переменной 1ез1: 4.

^-коэффициенты используются для предсказания значений зависимой переменной — путем вычисления ее оценок по уравнению регрессии, в соот­ветствии с формулой 15.2:

У= -1,049 + 0,026(1ез14) + 0,0П(1еа 1) + 0,014(1ей 2). Фрагмент таблицы (Ба(а ЕйКог) с оценками зависимой переменной (У)

  Гез! 1 ГезГ 2 1е51 3 (ей 4 У рге_1
  86,00 110,00 110,00 101,00 3,88 3,98
             
  74,00 121,00 100,00 100,00   3,98
  96,00 114,00 114,00 103,00   4,19
  104,00 73,00 105,00 95,00   3,52
  94,00 121,00 115,00 104,00   4,29
  91,00 129,00 105,00 98,00   4,22

В связи с тем, что назначено сохранение оценок зависимой переменной (см. шаг 4), в таблице исходных данных (Ба1а ЕсШог) появилась новая пере­менная рге_1 — оценки зависимой переменной. Они вычислены по указан­ной формуле для всех 25 объектов и в данном примере могут служить для пред­сказания успеваемости 5 абитуриентов.


Глава 16

ФАКТОРНЫЙ АНАЛИЗ

НАЗНАЧЕНИЕ

Возникновение и развитие факторного анализа тесно связано с измерени­ями в психологии. Длительное время факторный анализ и воспринимался как математическая модель в психологической теории интеллекта. Лишь начи­ная с 50-х годов XX столетия, одновременно с разработкой математического обоснования факторного анализа, этот метод становится общенаучным. К на­стоящему времени факторный анализ является неотъемлемой частью любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим описа­нием изучаемых объектов, таких, как социология, экономика, биология, ме­дицина и другие.

Основная идея факторного анализа была сформулирована еще Ф. Гальтоном, ос­новоположником измерений индивидуальных различий. Она сводится к тому, что если несколько признаков, измеренных на группе индивидов, изменяются согла­сованно, то можно предположить существование одной общей причины этой со­вместной изменчивости — фактора как скрытой (латентной), непосредственно не доступной измерению переменной. Далее К. Пирсон в 1901 году выдвигает идею «метода главных осей», а Ч. Спирмен, отстаивая свою однофакторную концепцию интеллекта, разрабатывает математический аппарат для оценки этого фактора, ис­ходя из множества измерений способнос­тей. В своей работе, опубликованной в 1904 году, Ч. Спирмен показал, что если ряд при- знаков попарно коррелируют друг с другом, _ то может быть составлена система линей­ных уравнений, связывающих все эти при­знаки, один общий фактор «общей ода­ренности» и по одному специфическому фактору «специальных способностей» для каждой переменной. В 1930-х годах Л. Тер-

Фактор — скрытая причина согласованной изменчивости наблюдаемых переменных

стоун впервые предлагает «многофакторный анализ» для описания многочислен­ных измеренных способностей меньшим числом общих факторов интеллекта, яв­ляющихся линейной комбинацией этих исходных способностей. С 1950-х годов, с появлением компьютеров, факторный анализ начинает очень широко использоваться в психологии при разработке тестов, обоснования струк­турных теорий интеллекта и личности. При этом исследователь начинает с множе­ства измеренных эмпирических показателей, которые при помощи факторного анализа группируются по факторам (изучаемым свойствам). Факторы получают интерпретацию по входящим в них переменным, затем отбираются наиболее «ве­сомые» показатели этих факторов, отсеиваются малозначимые переменные, вы­числяются значения факторов для испытуемых и сопоставляются с внешними эм­пирическими показателями изучаемых свойств.

В дальнейшем, по мере развития математического обеспечения факторного анали­за, накопления опыта его использования, прежде всего в психологии, задача фак­торного анализа обобщается. Как общенаучный метод, факторный анализ стано­вится средством для замены набора коррелирующих измерений существенно меньшим числом новых переменных (факторов). При этом основными требовани­ями являются: а) минимальная потеря информации, содержащейся в исходных дан­ных, и б) возможность представления (интерпретации) факторов через исходные переменные.

Таким образом, главная цель факторного анализа — уменьшение размерно­сти исходных данных с целью их экономного описания при условии мини­мальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно мень­шему числу новых переменных — факторов. Фактор при этом интерпретиру­ется как причина совместной изменчивости нескольких исходных перемен­ных.

Если исходить из предположения о том, что корреляции могут быть объ­яснены влиянием скрытых причин — факторов, то основное назначение фак­торного анализа — анализ корреляций множества признаков.

ПРИМЕР 16.1_____________________________________________________________________

Рассмотрим результаты факторного анализа на простом примере. Предположим, исследователь измерил на выборке из 50 испытуемых 5 показателей интеллекта: счет в уме, продолжение числовых рядов, осведомленность, словарный запас, установ­ление сходства. Все показатели статистически значимо взаимосвязаны на уровне р < 0,05, кроме показателя № 4 с № 1 и 2 (табл. 16.1).

Табл и ца 16.1







ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...

Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)...

ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.