Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Проблема связанных (одинаковых) рангов





В измерениях часто встречаются одинаковые значения. При их ранжиро­вании возникает проблема связанных рангов (Лей Капкз). В этом случае дей­ствует особое правило ранжирования: объектам с одинаковыми значениями

=Шг

приписывается один и тот же, сред­ний ранг. Например, когда эксперт

не может установить различие меж­ду двумя лучшими образцами това­ра, им приписывается одинаковый ранг: (1 + 2)/2 = 1,5. Это сохраняет неизменной сумму рангов для вы­борки объемом К. уУ(Аг+ 1)/2.

При наличии одинаковых (связан­ных) рангов формулы ранговой корре­
ляции Спирмена (6.6) и Кендалла (6.7 и 6.8) не подходят.
Хотя сумма рангов и не меняется, но изменчивость данных становится меньше. Соответственно, умень­шается возможность оценить степень связи между измеренными свойствами.

При использовании корреляции Спирмена в случае связанных рангов возмож­ны два подхода:

О если связей немного (менее 10% для каждой переменной), то вычис­лить г-Спирмена приближенно по формуле 6.6; □ при большем количестве связей применить к ранжированным данным классическую формулу /--Пирсона 6.1 — это всегда позволит опреде­лить ранговую корреляцию независимо от наличия связей в рангах.

При использовании корреляции т-Кендалла в случае наличия связанных ран­гов в формулу вносятся поправки, и тогда получается общая формула для вы­числения т коэффициента корреляции хь-Кендалла (КепёаИ'з 1аи-Ь) независи­мо от наличия или отсутствия связей в рангах:

Та=___________ РЧ1___________ 5

где Хх -(1 -1) (' ~~ количество групп связей по Х,^ — численность

каждой группы); к =(1 ^ ~ количество групп связей по У,/,—

численность каждой группы').

ПРИМЕР 6.6____________________________________________________________________________________



Супруги X и У ранжировали 8 жизненных ценностей по степени предпочтения. Данные представлены в таблице:
Ценности Ранги X Ранги У Р (совпадения) <2 (инверсии)
Здоровье
Любовь
Богатство
Свобода
Мудрость
Познание
Развитие
Творчество
      2 = 20  

В качестве меры согласованности предпочтений супругов вычислим корреляцию т6-Кендалла, так как наблюдаются связи в рангах: одна группа из трех рангов по Хн две группы по три ранга по У.

Обратите внимание на подсчет совпадений для объектов, попадающих в «связки». Например, для объекта «Богатство» пропускаются два ниже находящихся объекта, как имеющие одинаковые с ним ранги по X.


 

Подсчитаем поправочные коэффициенты: Кх= (1/2)[(3(3 - 1)] = 3; Ку= (1/2)[3(3 - — 1) + 3(3 — 1)] = 6. Подставим полученные значения в формулу 6.9:

2°-° поо

т„ = . = 0,853.

7(8 х 7/2)-3 7(8x7/2) -6

Заметим, что инверсии отсутствуют, и если бы связей в рангах не было, то корреля­ция была бы строго прямой (равна 1).

КОРРЕЛЯЦИЯ БИНАРНЫХ ДАННЫХ

Как отмечалось ранее, если одна из двух переменных представлена в но­минативной шкале, а другая — в числовой (ранговой или метрической), то связь между этими переменными лучше изучать путем сравнения групп по уровню выраженности числовой переменной.

ПРИМЕР_________________________________________________________________________

Предположим, исследуется связь количества пропущенных лекций студентами и курса обучения (с 1-го по 5-й). Первая переменная — метрическая, а вторая — но­минативная. Связь между этими переменными может быть изучена путем сравне­ния разных курсов по количеству пропущенных лекций (по средним значениям). Если будут обнаружены различия между курсами, то посещаемость лекций связана с курсом обучения, в противном случае — связи нет.

То же касается проблемы изучения связи между двумя номинативными переменными. Хотя и для этого случая существуют коэффициенты корреля­ции (К— Чупрова, С — Пирсона), но возможность их интерпретации весьма ограничена, в частности потому, что они отражают лишь силу связи, но не ее направление. Поэтому и в этом случае проблему связи между двумя номина­тивными переменными лучше изучать путем сравнения градаций одной пе­ременной по распределению другой переменной.

ПРИМЕР_________________________________________________________________________

Предположим, исследуется связь агрессивности учащихся (три градации: низкая, средняя, высокая) и образования их родителей (среднее, высшее техническое, выс­шее гуманитарное). Результаты исследования связей двух номинативных перемен­ных обычно представляются в виде таблицы сопряженности:

Агрессивность Образование родителей
Среднее Высш. технич. Высш. гуманит.
Низкая
Средняя
Высокая

Связь между этими переменными может быть изучена путем сравнения распреде­лений учащихся по степени агрессивности для разных градаций образования роди­телей (или, что то же самое, путем сравнения распределения образования родите­лей для разных градаций степени агрессивности учащихся).

Исключением можно считать случай изучения связи двух бинарных перемен­ных. Бинарная переменная имеет только две градации, обычно обозначаемые как О и 1. Примеры таких переменных: пол (мужской, женский), образование (сред­нее, высшее), тревожность (низкая, высокая), успешность (низкая, высокая) и т. д.

При изучении связей между бинарными переменными обычно строят че- тырехклеточные таблицы сопряженности:

Таблица 6.1

 

Таблица сопряженности 2x2

    Признак X Итог
     
Признак У а Ъ а + Ь
с с1 с+ с1
Итог   а + с Ь + Л N

 

В этом случае допустимо применение г-Пирсона (формула 6.1) непосред­ственно к исходным данным — двум бинарным переменным, принимающим значение 0 или 1, измеренным для каждого члена выборки численностью N. Результат применения г-Пирсона к двум бинарным переменным называется «фи- коэффициентом сопряженности» {РЫ). Если данные представлены в четырех- клеточпой таблице сопряженности, то применяется формула, существенно упрощающая расчеты, но дающая аналогичный результат:

ай-Ъс ,

Ф= , ---------- —, (6.Ю)

а + Ь)(с + с!)(а + с)(Ь + с1)

где а, Ь, с, й соответствуют обозначениям в четырехклеточной таблице 6.1.

ПРИМЕР 6.7______________________________________________________________________

Исследовалась связь семейного положения студенток (X: 0 — холостая, 1 — заму­жем) и их академической успеваемости (У: 0 — закончила вуз, 1 — отчислена). В рас­поряжении исследователя есть данные для 12 студенток:

X
У

 

 

Таблица сопряженности для этих данных:

    X Итог
     
У
 
Итог  

 

Вычислим ф-коэффициент сопряженности:

5-4-1-2 псп„ <р=-, - = 0,507. /6-6-7-5

Получена умеренная положительная взаимосвязь: холостые студентки чаще закан­чивают вуз, а замужние — чаще отчисляются. Отметим, что тот же самый результат был бы получен при применении формулы /--Пирсона непосредственно к исход­ным данным.

Итак, ф-коэффициент есть просто /--Пирсона, вычисленный для бинар­ных данных, а формула 6.10 алгебраически эквивалентна формуле 6.1. Следо­вательно, интерпретация ср-коэффициента подобна интерпретации /--Пирсо­на. Но использование ср-коэффициента существенно ограничено. Чем больше асимметрия распределения 0 и 1 по каждой переменной, тем менее точно ф-коэффициент отражает связь между бинарными переменными. Иначе го­воря, применение ф-коэффициента требует приблизительного равенства коли­чества 0 и 1 по каждой переменной.









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2019 zdamsam.ru Размещенные материалы защищены законодательством РФ.