|
Проблема связанных (одинаковых) ранговВ измерениях часто встречаются одинаковые значения. При их ранжировании возникает проблема связанных рангов (Лей Капкз). В этом случае действует особое правило ранжирования: объектам с одинаковыми значениями
приписывается один и тот же, средний ранг. Например, когда эксперт не может установить различие между двумя лучшими образцами товара, им приписывается одинаковый ранг: (1 + 2)/2 = 1,5. Это сохраняет неизменной сумму рангов для выборки объемом К. уУ(Аг+ 1)/2. При наличии одинаковых (связанных) рангов формулы ранговой корре При использовании корреляции Спирмена в случае связанных рангов возможны два подхода: О если связей немного (менее 10% для каждой переменной), то вычислить г-Спирмена приближенно по формуле 6.6; □ при большем количестве связей применить к ранжированным данным классическую формулу /--Пирсона 6.1 — это всегда позволит определить ранговую корреляцию независимо от наличия связей в рангах. При использовании корреляции т-Кендалла в случае наличия связанных рангов в формулу вносятся поправки, и тогда получается общая формула для вычисления т коэффициента корреляции хь-Кендалла (КепёаИ'з 1аи-Ь) независимо от наличия или отсутствия связей в рангах: Та=___________ РЧ1___________ 5 где Хх -(1 -1) (' ~~ количество групп связей по Х,^ — численность каждой группы); к =(1 ^ ~ количество групп связей по У,/,— численность каждой группы'). ПРИМЕР 6.6____________________________________________________________________________________
Подсчитаем поправочные коэффициенты: Кх= (1/2)[(3(3 - 1)] = 3; Ку= (1/2)[3(3 - — 1) + 3(3 — 1)] = 6. Подставим полученные значения в формулу 6.9: 2°-° поо т„ =. = 0,853. 7(8 х 7/2)-3 7(8x7/2) -6 Заметим, что инверсии отсутствуют, и если бы связей в рангах не было, то корреляция была бы строго прямой (равна 1). КОРРЕЛЯЦИЯ БИНАРНЫХ ДАННЫХ Как отмечалось ранее, если одна из двух переменных представлена в номинативной шкале, а другая — в числовой (ранговой или метрической), то связь между этими переменными лучше изучать путем сравнения групп по уровню выраженности числовой переменной. ПРИМЕР_________________________________________________________________________ Предположим, исследуется связь количества пропущенных лекций студентами и курса обучения (с 1-го по 5-й). Первая переменная — метрическая, а вторая — номинативная. Связь между этими переменными может быть изучена путем сравнения разных курсов по количеству пропущенных лекций (по средним значениям). Если будут обнаружены различия между курсами, то посещаемость лекций связана с курсом обучения, в противном случае — связи нет. То же касается проблемы изучения связи между двумя номинативными переменными. Хотя и для этого случая существуют коэффициенты корреляции (К— Чупрова, С — Пирсона), но возможность их интерпретации весьма ограничена, в частности потому, что они отражают лишь силу связи, но не ее направление. Поэтому и в этом случае проблему связи между двумя номинативными переменными лучше изучать путем сравнения градаций одной переменной по распределению другой переменной. ПРИМЕР_________________________________________________________________________ Предположим, исследуется связь агрессивности учащихся (три градации: низкая, средняя, высокая) и образования их родителей (среднее, высшее техническое, высшее гуманитарное). Результаты исследования связей двух номинативных переменных обычно представляются в виде таблицы сопряженности:
Связь между этими переменными может быть изучена путем сравнения распределений учащихся по степени агрессивности для разных градаций образования родителей (или, что то же самое, путем сравнения распределения образования родителей для разных градаций степени агрессивности учащихся). Исключением можно считать случай изучения связи двух бинарных переменных. Бинарная переменная имеет только две градации, обычно обозначаемые как О и 1. Примеры таких переменных: пол (мужской, женский), образование (среднее, высшее), тревожность (низкая, высокая), успешность (низкая, высокая) и т. д. При изучении связей между бинарными переменными обычно строят че- тырехклеточные таблицы сопряженности: Таблица 6.1 Таблица сопряженности 2x2
|
В этом случае допустимо применение г-Пирсона (формула 6.1) непосредственно к исходным данным — двум бинарным переменным, принимающим значение 0 или 1, измеренным для каждого члена выборки численностью N. Результат применения г-Пирсона к двум бинарным переменным называется «фи- коэффициентом сопряженности» {РЫ). Если данные представлены в четырех- клеточпой таблице сопряженности, то применяется формула, существенно упрощающая расчеты, но дающая аналогичный результат:
ай-Ъс, „
Ф=, ---------- —, (6.Ю)
а + Ь)(с + с!)(а + с)(Ь + с1)
где а, Ь, с, й соответствуют обозначениям в четырехклеточной таблице 6.1.
ПРИМЕР 6.7______________________________________________________________________
Исследовалась связь семейного положения студенток (X: 0 — холостая, 1 — замужем) и их академической успеваемости (У: 0 — закончила вуз, 1 — отчислена). В распоряжении исследователя есть данные для 12 студенток:
|
Таблица сопряженности для этих данных:
|
Вычислим ф-коэффициент сопряженности:
5-4-1-2 псп„ <р=-, - = 0,507. /6-6-7-5
Получена умеренная положительная взаимосвязь: холостые студентки чаще заканчивают вуз, а замужние — чаще отчисляются. Отметим, что тот же самый результат был бы получен при применении формулы /--Пирсона непосредственно к исходным данным.
Итак, ф-коэффициент есть просто /--Пирсона, вычисленный для бинарных данных, а формула 6.10 алгебраически эквивалентна формуле 6.1. Следовательно, интерпретация ср-коэффициента подобна интерпретации /--Пирсона. Но использование ср-коэффициента существенно ограничено. Чем больше асимметрия распределения 0 и 1 по каждой переменной, тем менее точно ф-коэффициент отражает связь между бинарными переменными. Иначе говоря, применение ф-коэффициента требует приблизительного равенства количества 0 и 1 по каждой переменной.
Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...
ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...
ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...
Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычислить, когда этот...
Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: