|
Лекция 5. Статистические критерии различийСтр 1 из 9Следующая ⇒ Лекция 5. Статистические критерии различий Статистические критерии различий 2.1. Критерий Назначение критерия Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых. Описание критерия Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Но если критерий В этом случае стоит применить критерий Критерий применяется в тех случаях, когда данные представлены, по крайней мере, в порядковой шкале. Признак должен варьировать в каком-то диапазоне, иначе сопоставления с помощью Применение критерия начинают с того, что упорядочивают значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. При этом сразу видно, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений «выше» Гипотезы
Для использования критерия 1. Измерение может быть проведено в шкале порядка, интервалов и отношений. 2. Выборки должны быть независимыми. 3. В каждой из выборок должно быть не меньше 11 испытуемых. 4. Приведенная в настоящем пособии таблица ограничивает верхний предел выборки 26 испытуемыми. 5. При числе наблюдений 6. Принципиальным условием, дающим возможность применять критерий, является наличие «хвостов» в сравниваемых рядах (см. задачу). В случае расположения выборок следующим образом: х х х х х х х х х х х х х х у у у у у у у критерий Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот критерий имеет также название — «критерий хвостов». Что же такое «хвост»? В случае, если в сравниваемых рядах будут равные элементы, их следует размещать точно друг под другом. В этом случае два сравниваемых ряда можно расположить друг под другом следующим способом:
z z z z | z z z z |
Символы
После подсчета сумм "хвостов" следует обратиться к таблице 8 Приложения в соответствии с количеством испытуемых в сравниваемых выборках. Когда сумма Алгоритм подсчета критерия 1. Проверить, выполняются ли ограничения: 2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше (правее), а выборкой 2 – ту, где значения предположительно ниже (левее). 3. Определить самое высокое (максимальное) значение в выборке 2. 4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как 5. Определить самое низкое (минимальное) значение в выборке 1. 6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как 7. Посчитать 8. По таблице 8 Приложения определить 9. При
2.2. Критерий U Вилкоксона-Манна-Уитни Назначение критерия Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различие между малыми выборками, когда Описание критерия Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам. Этот способ определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (1- м рядом, выборкой, группой называется ряд значений, в котором значения, по предварительной оценке, выше, а 2- м рядом – тот, где они предположительно ниже). Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок. Эмпирическое значение критерия Гипотезы
Для применения критерия U необходимо соблюдать следующие условия: 1. Измерение должно быть проведено в шкале интервалов и отношений. 2. Выборки должны быть несвязанными. 3. Нижняя граница применимости критерия 4. Верхняя граница применимости критерия: Замечание. Критерий U применяют и для связных выборок, рассматривая их при этом как независимые. Последнее возможно, если связи внутри генеральной совокупности оказываются слабыми, а различия между двумя связными выборкам – сильными. В этом случае возможно получение значимых различий по критерию U, в то время как критерии, специально предназначенные для связанных выборок, могут и не обнаружить значимых различий. Рассмотрим на примере применение данного критерия. Задача 1. Две неравные по численности группы испытуемых решали техническую задачу. Показателем успешности служило время решения. Испытуемые меньшей по численности группы получали дополнительную мотивацию в виде денежного вознаграждения. Психолога интересует вопрос – влияет ли вознаграждение на успешность решения задачи? Психологом были получены следующие результаты времени решения технической задачи в секундах: в первой группе – с дополнительной мотивацией – 39, 38, 44, 6, 25, 25, 30, 43; во второй группе – без дополнительной мотивации – 46, 8, 50, 45, 32, 41, 41, 31, 55. Число испытуемых в первой группе обозначается, как Решение. Для ответа на вопрос задачи применим критерий U - Вилкоксона-Манна-Уитни. Существует два способа подсчета по критерию U. Последовательно рассмотрим оба способа. Алгоритм Назначение критерия Критерий хи -квадрат (другая форма записи – Критерий хи -квадрат используется в двух вариантах: · как расчет согласия эмпирического распределения и предполагаемого теоретического; в этом случае проверяется гипотеза · как расчет однородности двух независимых экспериментальных выборок; в этом случае проверяется гипотеза Описание критерия Критерий Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами. При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Критерий построен так, что при полном совпадении экспериментального и теоретического (или двух экспериментальных) распределений величина Гипотезы Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим. Первый вариант:
Второй вариант:
Третий вариант:
Для применения критерия 1. Измерение может быть проведено в любой шкале. 2. Выборки должны быть случайными и независимыми. 3. Желательно, чтобы объем выборки был ≥ 20. С увеличением объема выборки точность критерия повышается. 4. Теоретическая частота для каждого выборочного интервала не должна быть меньше 5. 5. Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений. 6. Таблица критических значений критерия В общем случае число степеней свободы определяется по формуле: Для таблиц, число степеней свободы определяется по формуле:
Назначение критерия Критерий а) эмпирического с теоретическим, например, равномерным или нормальным; б) одного эмпирического распределения с другим эмпирическим распределением. Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения. Описание критерия Если в методе Если различия между двумя распределениями существенны, то в какой–то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия Гипотезы
Для применения критерия Колмогорова–Смирнова необходимо соблюдать следующие условия: 1. Измерение может быть проведено шкале интервалов и отношений. 2. Выборки должны быть случайными и независимыми. 3. Желательно, чтобы суммарный объем двух выборок ≥ 50. С увеличением объема выборки точность критерия повышается. 4. Эмпирические данные должны допускать возможность упорядочения по возрастанию или убыванию какого-либо признака и обязательно отражать какое-то его однонаправленное изменение. В том случае, если трудно соблюсти принцип упорядоченности признака, лучше использовать критерий хи -квадрат.
Этот критерий используется для решения тех же задач, что и критерий xи -квадрат. Иначе говоря, с его помощью можно сранивать эмпирическое распределение с теоретическим или два эмпирических распределения друг с другом. Однако если при применении хи -квадрат мы сопоставляем частоты двух распределений, то в данном критерии сравниваются накопленные (кумулятивные) частоты по каждому разряду (альтернативе). При этом если разность накопленных частот в двух распределениях оказывается большой, то различия между двумя распределениями являются существенными. Задача 8.12. Предположим, что в эксперименте психологу необходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» кубик, т.е. такой, чтобы при достаточно большом числе подбрасываний, каждая его грань выпадала бы примерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному? Решение. Подбросим кубик 120 раз и сравним полученное эмпирическое распределение с теоретическим. Поскольку теоретическое распределение является равновероятным, то соответствующие теоретические частоты равны 20. Распределение эмпирических и теоретических частот представим совместно в таблице 8.15: Для подсчета по критерию Колмогорова–Смирнова необходимо провести ряд преобразований с данными таблицы 8.15. Представим эти преобразования в таблице 8.16 и объясним их получение: Символом FE в таблице 8.16 будем обозначать накопленные теоретические частоты. В таблице они получаются следующим образом: к первой теоретической частоте 20, добавляется вторая частота, также равная 20, получается число 20 + 20 = 40. Число 40 ставится на место второй частоты. Затем к числу 40 прибавляется следующая теоретическая частота, полученная величина 60 — ставится на место третьей теоретической частоты и так далее. Символом FB в таблице 8.16 обозначаются накопленные эмпирические частоты. Для их подсчета необходимо расположить эмпирические частоты по возрастанию: 15, 18, 18, 21, 23, 25 и затем по порядку сложить. Так, вначале стоит первая частота равная 15, к ней прибавляется вторая по величине частота и полученная сумма 15 + 18 = 33 ставится на место второй частоты, затем к 33 добавляется 18 (33 + 18 = 51), полученное число 51 ставится на место третьей частоты и т.д. Символом |FE - FB| в таблице 8.16 обозначаются абсолютные величины разности между теоретической и эмпирической частотой по каждому столбцу отдельно. Эмпирическую величину этого критерия, которая обозначается как D эмп получают используя формулу (8.13): Для её получения среди чисел |FE - FB| находят максимальное число (в нашем случае оно равно 9) и делят его на объем выборки п. В нашем случае п = 120, поэтому Для этого критерия таблица с критическими значениями дана в Приложении 1 под № 13. Из таблицы 13 Приложения 1 следует, однако, что в том случае, если число элементов выборке больше 100, то величины критических значений вычисляются по формуле (8.14): Иными словами, вместо привычных табличных значений вычисляются величины Dкр подстановкой величины объема выборки вместо символа п. В нашем случае п = 120, поэтому Dкр для0,05 равно и Dкp для 0,01 равно В нашем случае Dэмп оказалось равным 0,075, что гораздо меньше 0,124, иначе говоря, эмпирическое значение критерия Колмогорова-Смирнова попало в зону незначимости. Таким образом, гипотеза Н 1 отклоняется и принимается гипотеза 2.5. Критерий Назначение критерия Критерий Фишера предназначен для сопоставления двух рядов выборочных значений по частоте встречаемости какого-либо признака. Этот критерий можно применять для оценки различий в любых двух выборках зависимых или независимых. С его помощью можно сравнивать показатели одной и той же выборки, измеренные в разных условиях. Описание критерия Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект. Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, который измеряется в радианах. Большей процентной доле будет соответствовать больший угол При увеличении расхождения между углами Гипотезы
Для применения критерия Фишера 1. Измерение может быть проведено в любой шкале. 2. Характеристики выборок могут быть любыми. 3. Нижняя граница — в одной из выборок может быть только 2 наблюдения, при этом во второй должно быть не менее 30 наблюдений. Верхняя граница не определена. 4. Нижние границы двух выборок должны содержать не меньше 5 элементов (наблюдений) в каждой.
Случай несвязных выборок В общем случае формула для расчета по t -критерию Стьюдента такова: где Рассмотрим сначала равночисленные выборки. В этом случае п 1 = п 2 =п, тогда выражение (9.2) будет вычисляться следующим образом: В случае не равночисленных выборок п 1 ≠ п 2, выражение (9.2) будет вычисляться следующим образом: В обоих случаях подсчет числа степеней свободы осуществляется по формуле: где п 1и п 2 соответственно величины первой и второй выборки. Понятно, что при численном равенстве выборок k= 2 · п – 2. Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок. Задача 9.1. Психолог измерял время сложной сенсомоторной реакции выбора (в мс) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающиеся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом. Решение. Результаты эксперимента представим в виде таблицы 9.1, в которой произведем ряд необходимых расчетов: Средние арифметические составляют в экспериментальной группе Разница по абсолютной величине между средними
Подсчет выражения 9.4 дает: Тогда значение tэмп, вычисляемое по формуле (9.1), таково: Число степеней свободы k = 9 + 8-2= 15. По таблице 16 Приложения 1 для данного числа степеней свободы находим: Таким образом, обнаруженные психологом различия между экспериментальной и контрольной группами значимы более чем на 0,1% уровне, или, иначе говоря, средняя скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом. В терминах статистических гипотез это утверждение звучит так: гипотеза Н0 о сходстве отклоняется и на уровне значимости 0,1% принимается альтернативная гипотеза Н 1 - о различии между экспериментальной и контрольными группами. Случай связных выборок В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t -критерия Стьюдента. Вычисление значения tэмп осуществляется по формуле: где где В свою очередь Sd вычисляется по следующей формуле: Число степеней свободы к определяется по формуле k = n - 1. Рассмотрим пример использования t - критерия Стьюдента для связных, равных по численности выборок. Задача 9.2. Психолог предположил, что в результате научения время решения эквивалентных задач «игры в 5» (т.е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач. Решение. Решение задачи представим в виде таблицы 9.2: Вначале произведем расчет по формуле (9.7): Затем применим формулу (9.8), получим: И, наконец, следует применить формулу (9.6). Получим: Число степеней свободы: k = 8 – 1 = 7 и по таблице 16 Приложения 1 находим tкр: Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза Н 0 отклоняется и принимается гипотеза Н1 — о различиях. Для применения t -критерия Стъюдента необходимо соблюдать следующие условия: 1. Измерение может быть проведено в шкале интервалов и отношений. 2. Сравниваемые выборки должны быть распределены по нормальному закону. 2.7. F — критерий Фишера Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух рядов наблюдений. Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе. Формула вычисления по критерию Фишера F такова: Где Поскольку, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fэмп всегда будет больше или равно единице, т.е. Fэмп ≥ 1. Число степеней свободы определяется также просто: df1 = п 1 - 1 для первой (т.е. для той выборки, величина дисперсии которой больше) и df2 = п 2 - 1 для второй выборки. В таблице 17 Приложения 1 критические значения критерия Фишера Fкp находятся по величинам dfx (верхняя строчка таблицы) и df2 (левый столбец таблицы). Задача 9.3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос – есть ли различия в степени однородности показателей умственного развития между классами. Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице: Как видно из таблицы 9.3, величины средних в обеих группах практически совпадают между собой 60,6 ≈ 63,6 и величина t -критерия Стьюдента оказалась равной 0,347 и незначимой. Рассчитав дисперсии для переменных X и Y, получаем Тогда по формуле (9.9) для расчета по F критерию Фишера находим: По таблице 17 Приложения 1 для F критерия при степенях свободы в обоих случаях равных df = 10 - 1 = 9 находим Fкр. Таким образом, полученная величина Fэмп попала в зону неопределенности. В терминах статистических гипотез можно утверждать, что Но (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н1. Психолог может утверждать, что по степени однородности такого показателя, как умственное развитие, имеется различие между выборками из двух классов. Для применения критерия F Фишера необходимо соблюдать следующие условия: 1. Измерение может быть проведено в шкале интервалов и отношений. 2. Сравниваемые выборки должны быть распределены по нормальному закону
Лекция 5. Статистические критерии различий ![]() ![]() ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры... ![]() ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... ![]() ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между... ![]() Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|