Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Лекция 5. Статистические критерии различий





Лекция 5. Статистические критерии различий

Статистические критерии различий

2.1. Критерий Розенбаума

Назначение критерия

Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Описание критерия

Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Но если критерий не выявляет достоверных различий, это еще не означает, что их действительно нет.

В этом случае стоит применить критерий Фишера. Если же - критерий выявляет достоверные различия между выборками с уровнем значимости ,можно ограничиться только им и избежать трудностей применения других критериев.

Критерий применяется в тех случаях, когда данные представлены, по крайней мере, в порядковой шкале. Признак должен варьировать в каком-то диапазоне, иначе сопоставления с помощью -критерия просто невозможны.

Применение критерия начинают с того, что упорядочивают значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. При этом сразу видно, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений «выше» , а второй – «ниже» . Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом – тот, где значения ниже.

Гипотезы

: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

: Уровень признака в выборке 1 превышает уровень признака в выборке 2.

Для использования критерия необходимо соблюдать следующие условия:

1. Измерение может быть проведено в шкале порядка, интервалов и отношений.

2. Выборки должны быть независимыми.

3. В каждой из выборок должно быть не меньше 11 испытуемых.

4. Приведенная в настоящем пособии таблица ограничивает верхний предел выборки 26 испытуемыми.

5. При числе наблюдений можно пользоваться следующими величинами :

6. Принципиальным условием, дающим возможность применять критерий, является наличие «хвостов» в сравниваемых рядах (см. задачу). В случае расположения выборок следующим образом:

х х х х х х х х х х х х х х

у у у у у у у

критерий оказывается неприменим. Следует использовать критерий U.

Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот критерий имеет также название — «критерий хвостов». Что же такое «хвост»?

В случае, если в сравниваемых рядах будут равные элементы, их следует размещать точно друг под другом. В этом случае два сравниваемых ряда можно расположить друг под другом следующим способом:

| t t t t | t t t t t t

z z z z | z z z z |

 

Символы и обозначают соответственно правый и левый «хвосты», причем, , а .

подсчитывается очень просто - это сумма величин и , т.е.

После подсчета сумм "хвостов" следует обратиться к таблице 8 Приложения в соответствии с количеством испытуемых в сравниваемых выборках. Когда сумма достаточно велика, можно считать различия сравниваемых выборок значимыми.

Алгоритм

подсчета критерия Розенбаума

1. Проверить, выполняются ли ограничения: .

2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше (правее), а выборкой 2 – ту, где значения предположительно ниже (левее).

3. Определить самое высокое (максимальное) значение в выборке 2.

4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как .

5. Определить самое низкое (минимальное) значение в выборке 1.

6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как .

7. Посчитать по формуле:

8. По таблице 8 Приложения определить для данных и . Если , то - отвергается.

9. При сопоставить полученное с Если превышает или, по крайней мере, равняется , то - отвергается.

 

2.2. Критерий U Вилкоксона-Манна-Уитни

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различие между малыми выборками, когда или и является более мощным, чем критерий Розенбаума.

Описание критерия

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам.

Этот способ определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (1- м рядом, выборкой, группой называется ряд значений, в котором значения, по предварительной оценке, выше, а 2- м рядом – тот, где они предположительно ниже).

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.

Эмпирическое значение критерия отражает то, насколько велика зона совпадения между рядами. Поэтому, чем меньше , тем более вероятно, что различия достоверны.

Гипотезы

: Уровень признака в группе 2 не ниже уровня признака в группе 1.

: Уровень признака в группе 2 ниже уровня признака в группе 1

Для применения критерия U необходимо соблюдать следующие условия:

1. Измерение должно быть проведено в шкале интервалов и отношений.

2. Выборки должны быть несвязанными.

3. Нижняя граница применимости критерия или , а .

4. Верхняя граница применимости критерия: .

Замечание. Критерий U применяют и для связных выборок, рассматривая их при этом как независимые. Последнее возможно, если связи внутри генеральной совокупности оказываются слабыми, а различия между двумя связными выборкам – сильными. В этом случае возможно получение значимых различий по критерию U, в то время как критерии, специально пред­назначенные для связанных выборок, могут и не обнаружить значимых различий.

Рассмотрим на примере применение данного критерия.

Задача 1. Две неравные по численности группы испытуемых решали техническую задачу. Показателем успешности служило время решения. Испытуемые меньшей по численности группы получали дополнительную мотивацию в виде денежного вознаграждения. Психолога интересует вопрос – влияет ли вознаграждение на успешность решения задачи?

Психологом были получены следующие результаты времени решения технической задачи в секундах: в первой группе – с дополнительной мотивацией – 39, 38, 44, 6, 25, 25, 30, 43; во второй группе – без дополнительной мотивации – 46, 8, 50, 45, 32, 41, 41, 31, 55. Число испытуемых в первой группе обозначается, как и равно 8, во – второй, как и равно 9.

Решение. Для ответа на вопрос задачи применим критерий U - Вилкоксона-Манна-Уитни. Существует два способа подсчета по критерию U. Последовательно рассмотрим оба способа.

Алгоритм

Назначение критерия

Критерий хи -квадрат (другая форма записи – греческая буква «хи») один из наиболее часто использующихся в психологических исследованиях, поскольку он позволяет решать боль­шое число разных задач, и, кроме того, исходные данные для него могут быть получены в любой шкале, начиная со шкалы наименований.

Критерий хи -квадрат используется в двух вариантах:

· как расчет согласия эмпирического распределения и предполагаемого теоретического; в этом случае проверяется гипотеза об отсутствии различий между теоретическим и эмпирическим распределениями;

· как расчет однородности двух независимых экспериментальных выборок; в этом случае проверяется гипотеза об отсутствии различий между двумя (тремя или более) эмпирическими (экспериментальными) распределениями одного и того же признака.

Описание критерия

Критерий отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований.

При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами.

При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений.

Критерий построен так, что при полном совпадении экспериментального и теоретического (или двух экспериментальных) распределений величина , и чем больше расхождение между сопоставляемыми распределениями, тем больше величина эмпирического значения хи -квадрат.

Гипотезы

Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим.

Первый вариант:

: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.

: Полученное эмпирическое распределение признака отличается от теоретического распределения.

Второй вариант:

: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

: Эмпирическое распределение 1 отличается от эмпирического распределения 2.

Третий вариант:

: Эмпирические распределения 1, 2. 3. … не различаются между собой.

: Эмпирические распределения 1, 2. 3. … различаются между собой.

Для применения критерия необходимо соблюдать следующие условия:

1. Измерение может быть проведено в любой шкале.

2. Выборки должны быть случайными и независимыми.

3. Желательно, чтобы объем выборки был ≥ 20. С увеличением объема выборки точность критерия повышается.

4. Теоретическая частота для каждого выборочного интервала не должна быть меньше 5.

5. Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений.

6. Таблица критических значений критерия рассчитана для числа степеней свободы , которое каждый раз рассчитывается по определенным правилам.

В общем случае число степеней свободы определяется по формуле: , где с - число альтернатив (признаков, значений, элементов) в сравниваемых переменных.

Для таблиц, число степеней свободы определяется по фор­муле: , где k - число столбцов, с - число строк.

 

 

Назначение критерия

Критерий предназначен для сопоставления двух распределений:

а) эмпирического с теоретическим, например, равномерным или нормальным;

б) одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Описание критерия

Если в методе мы сопоставляли частоты двух распределений отдельно по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т.д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой–то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия включается эта разность. Чем больше эмпирическое значение , тем более существенны различия.

Гипотезы

Различия между распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

: Различия между распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

Для применения критерия Колмогорова–Смирнова необходимо соблюдать следующие условия:

1. Измерение может быть проведено шкале интервалов и отношений.

2. Выборки должны быть случайными и независимыми.

3. Желательно, чтобы суммарный объем двух выборок ≥ 50. С увеличением объема выборки точность критерия повышается.

4. Эмпирические данные должны допускать возможность упорядочения по возрастанию или убыванию какого-либо признака и обязательно отражать какое-то его однонаправленное изменение. В том случае, если трудно соблюсти принцип упорядоченности признака, лучше использовать критерий хи -квадрат.

 

Этот критерий используется для решения тех же задач, что и критерий -квадрат. Иначе говоря, с его помощью можно сра­нивать эмпирическое распределение с теоретическим или два эмпирических распределения друг с другом. Однако если при применении хи -квадрат мы сопоставляем частоты двух распределений, то в данном критерии сравниваются накопленные (кумулятивные) частоты по каждому разряду (альтернативе). При этом если разность накопленных частот в двух распределениях оказывается большой, то различия между двумя распределениями яв­ляются существенными.

Задача 8.12. Предположим, что в эксперименте психологу не­обходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» кубик, т.е. такой, чтобы при достаточно большом числе подбрасываний, каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному?

Решение. Подбросим кубик 120 раз и сравним полученное эмпирическое распределение с теоретическим. Поскольку теоретическое распределение является равновероятным, то соответствующие теоретические частоты равны 20. Распределение эмпирических и теоретических частот представим совместно в таблице 8.15:

Для подсчета по критерию Колмогорова–Смирнова необхо­димо провести ряд преобразований с данными таблицы 8.15. Представим эти преобразования в таблице 8.16 и объясним их получение:

Символом FE в таблице 8.16 будем обозначать накопленные теоретические частоты. В таблице они получаются следующим образом: к первой теоретической частоте 20, добавляется вторая частота, также равная 20, получается число 20 + 20 = 40. Число 40 ставится на место второй частоты. Затем к числу 40 прибавляется следующая теоретическая частота, полученная величина 60 — ставится на место третьей теоретической частоты и так далее.

Символом FB в таблице 8.16 обозначаются накопленные эмпирические частоты. Для их подсчета необходимо расположить эмпирические частоты по возрастанию: 15, 18, 18, 21, 23, 25 и затем по порядку сложить. Так, вначале стоит первая частота равная 15, к ней прибавляется вторая по величине частота и полученная сумма 15 + 18 = 33 ставится на место второй частоты, затем к 33 добавляется 18 (33 + 18 = 51), полученное число 51 ставится на место третьей частоты и т.д.

Символом |FE - FB| в таблице 8.16 обозначаются абсолютные величины разности между теоретической и эмпирической частотой по каждому столбцу отдельно.

Эмпирическую величину этого критерия, которая обозначается как D эмп получают используя формулу (8.13):

Для её получения среди чисел |FE - FB| находят максимальное число (в нашем случае оно равно 9) и делят его на объем выборки п. В нашем случае п = 120, поэтому

Для этого критерия таблица с критическими значениями дана в Приложении 1 под № 13. Из таблицы 13 Приложения 1 следует, однако, что в том случае, если число элементов выборке больше 100, то величины критических значений вычисляются по формуле (8.14):

Иными словами, вместо привычных табличных значений вычисляются величины Dкр подстановкой величины объема выбор­ки вместо символа п.

В нашем случае п = 120, поэтому Dкр для0,05 равно

и Dкp для 0,01 равно , или в привычной форме записи:

В нашем случае Dэмп оказалось равным 0,075, что гораздо меньше 0,124, иначе говоря, эмпирическое значение критерия Колмогорова-Смирнова попало в зону незначимости. Таким об­разом, гипотеза Н 1 отклоняется и принимается гипотеза о том, что теоретическое и эмпирическое распределения не отличаются между собой. Следовательно, можно с уверенностью утверждать, что наш игральный кубик «безупречен».

2.5. Критерий - угловое преобразование Фишера

Назначение критерия

Критерий Фишера предназначен для сопоставления двух рядов выборочных значений по частоте встречаемости какого-либо признака. Этот критерий можно применять для оценки различий в любых двух выборках зависимых или независимых. С его помощью можно сравнивать показатели одной и той же выборки, измеренные в разных условиях.

Описание критерия

Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект.

Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, который измеряется в радианах. Большей процентной доле будет соответствовать больший угол , а меньшей доле – меньший угол,но соотношения здесь не линейные: , где - процентная доля, выраженная в долях единицы.

При увеличении расхождения между углами , и увеличения численности выборок значение критерия возрастет. Чем больше величина , тем более вероятно, что различия достоверны.

Гипотезы

: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2.

: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2.

Для применения критерия Фишера необходимо соблюдать следующие условия:

1. Измерение может быть проведено в любой шкале.

2. Характеристики выборок могут быть любыми.

3. Нижняя граница — в одной из выборок может быть только 2 наблюдения, при этом во второй должно быть не менее 30 наблюдений. Верхняя граница не определена.

4. Нижние границы двух выборок должны содержать не меньше 5 элементов (наблюдений) в каждой.

 

Случай несвязных выборок

В общем случае формула для расчета по t -критерию Стьюдента такова:

где

Рассмотрим сначала равночисленные выборки. В этом случае п 1 = п 2 =п, тогда выражение (9.2) будет вычисляться следующим образом:

В случае не равночисленных выборок п 1 ≠ п 2, выражение (9.2) будет вычисляться следующим образом:

В обоих случаях подсчет числа степеней свободы осуществля­ется по формуле:

где п 1и п 2 соответственно величины первой и второй выборки.

Понятно, что при численном равенстве выборок k= 2 · п – 2.

Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок.

Задача 9.1. Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.

Решение. Результаты эксперимента представим в виде таблицы 9.1, в которой произведем ряд необходимых расчетов:

Средние арифметические составляют в экспериментальной

группе , в контрольной группе .

Разница по абсолютной величине между средними

.

Подсчет выражения 9.4 дает:

Тогда значение tэмп, вычисляемое по формуле (9.1), таково:

Число степеней свободы k = 9 + 8-2= 15. По таблице 16 Приложения 1 для данного числа степеней свободы находим:

Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.

В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на уровне значимости 0,1% принимается альтернативная гипотеза Н 1 - о различии между экспериментальной и контрольными группами.

Случай связных выборок

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t -критерия Стьюдента.

Вычисление значения tэмп осуществляется по формуле:

где

где - разности между соответствующими значениями переменной X ипеременной Y, а среднее этих разностей.

В свою очередь Sd вычисляется по следующей формуле:

Число степеней свободы к определяется по формуле k = n - 1. Рассмотрим пример использования t - критерия Стьюдента для связных, равных по численности выборок.

Задача 9.2. Психолог предположил, что в результате научения время решения эквивалентных задач «игры в 5» (т.е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач.

Решение. Решение задачи представим в виде таблицы 9.2:

Вначале произведем расчет по формуле (9.7):

Затем применим формулу (9.8), получим:

И, наконец, следует применить формулу (9.6). Получим:

Число степеней свободы: k = 8 – 1 = 7 и по таблице 16 Приложения 1 находим tкр:

Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза Н 0 отклоняется и принимается гипотеза Н1 о различиях.

Для применения t -критерия Стъюдента необходимо соблюдать следующие условия:

1. Измерение может быть проведено в шкале интервалов и отношений.

2. Сравниваемые выборки должны быть распределены по нормальному закону.

2.7. F — критерий Фишера

Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух рядов наблюдений. Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе. Формула вычисления по критерию Фишера F такова:

Где

Поскольку, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fэмп всегда будет больше или равно единице, т.е. Fэмп 1. Чис­ло степеней свободы определяется также просто: df1 = п 1 - 1 для первой (т.е. для той выборки, величина дисперсии которой больше) и df2 = п 2 - 1 для второй выборки. В таблице 17 Приложения 1 критические значения критерия Фишера Fкp находятся по величинам dfx (верхняя строчка таблицы) и df2 (левый столбец таблицы).

Задача 9.3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос – есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице:

Как видно из таблицы 9.3, величины средних в обеих группах практически совпадают между собой 60,6 ≈ 63,6 и величина t -критерия Стьюдента оказалась равной 0,347 и незначимой.

Рассчитав дисперсии для переменных X и Y, получаем

Тогда по формуле (9.9) для расчета по F критерию Фишера

находим:

По таблице 17 Приложения 1 для F критерия при степенях свободы в обоих случаях равных df = 10 - 1 = 9 находим Fкр.

Таким образом, полученная величина Fэмп попала в зону неопределенности. В терминах статистических гипотез можно утверждать, что Но (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н1. Психолог может утверждать, что по степени однородности такого показателя, как умственное развитие, имеется различие между выборками из двух классов.

Для применения критерия F Фишера необходимо соблюдать следующие условия:

1. Измерение может быть проведено в шкале интервалов и отношений.

2. Сравниваемые выборки должны быть распределены по нормальному закону

 

Лекция 5. Статистические критерии различий







Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...

ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...

Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.