Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Гипотеза. Генеральная совокупность. Выборка, виды выборок





Гипотеза. Генеральная совокупность. Выборка, виды выборок

Статистические гипотезы

Статистические гипотезы подразделяются на нулевые и альтерна­тивные, направленные и ненаправленные.

Нулевая гипотеза- это гипотеза об отсутствии различий. Она обозначается как H0 и называется нулевой потому, что содержит число 0: X1- Х2=0, где X1, X2 - сопоставляемые значения признаков. Нулевая гипотеза - это то, что мы хо­тим опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза- это гипотеза о значимости различий. Она обозначается как H1. Альтернатив­ная гипотеза - это то, что мы хотим до­казать, поэтому иногда ее называют экспериментальной гипотезой.

Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

Если в одной из групп индивидуальные значе­ния испытуемых по какому-либо признаку выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.

Если надо доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные измене­ния, чем в группе Б, то тоже необходимо сформулировать направ­ленные гипотезы.

Если же надо доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.

Генеральная совокупность и выборка

Исходным понятием статистики является понятие совокупность, объединяющее обычно какое-либо множество объектов, испытуемых по одному или нескольким интересующим признакам. Применение большинства статистических методов основано на идее использования небольшой случайной совокупности испытуемых из общего числа тех, на которых можно было бы распространить (генерализовать) выводы, полученные в результате изучения совокупности. Эта небольшая совокупность в статистике называется выборочной совокупностью (выборкой). Главный принцип формирования выборки - это случайный отбор испытуемых из мыслимого множества испытуемых, называемого генеральной совокупностью или популяцией объектов или явлений. Как по анализу элементов, содержащихся в капле крови, медики нередко судят о составе всей крови человека, так и по выборочной совокупности учащихся изучаются явления, характерные для всей генеральной совокупности.



Одной из основных задач статистического анализа является получение по имеющейся выборке достоверных сведений о интересующих исследователя характеристиках генеральной совокупности. Поэтому важным требованием к выборке является ее репрезентативность, то есть правильная представимость в ней пропорций генеральной совокупности. Достижению репрезентативности может способствовать такая организация эксперимента, при которой элементы выборки извлекаются из генеральной совокупности случайным образом.

Зависимые и независимые выборки.

Независимые выборки характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого испытуемого другой выборки.

Зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

 

 

Критерии обоснованности выводов исследования.

Основные критерии обоснованности выводов исследования – это репрезентативность выборки и статистическая достоверность (эмпирических) результатов.

Статистическая достоверность, или статистическая значимость, результатов эксперимента определяется при помощи методов статистического вывода, которые предъявляют определенные требования к численности, или объему выборки.

Сформулируем наиболее общие рекомендации, т.к. строгих рекомендаций нет.

q Если надо сравнить 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть ~ одинаковой.

q Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.

q Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки.

Измерительные шкалы

Измерение – это приписывание чисел объектам в соответствии с определенными правилами. Числа – это удобные в обработке объекты, в которые мы преобразуем определенные свойства нашего восприятия.

Измерительные шкалы.

1. Шкала наименований (качественная шкала) или номинальная шкала. Номинальное измерение сводится к разбиению совокупности объектов на классы, в каждом из которых сосредоточены объекты, идентичные по какому-нибудь признаку или свойству, например, по национальности, по полу, по типу темперамента.

При данных измерениях каждому из классов присваивается число, но оно используется исключительно как название этого класса и никаких операций над этими числами производить не предполагается.

2. Порядковая шкала. Порядковые переменные позволяют ранжировать объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать "на сколько больше" или "на сколько меньше". Порядковые переменные иногда также называют ординальными.

3. Интервальная шкала. Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними.

4. Шкала отношений. Относительные переменные очень похожи на интервальные переменные. В дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их характерной чертой является наличие определенной точки абсолютного нуля. Типичными примерами шкал отношений являются измерения времени или пространства.

Статистические критерии. Возможности и ограничения параметрических и непараметрических критериев

Статистические критерии

Статистический критерий - это решающее правило, обеспечиваю­щее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью.

Статистические критерии обозначают также метод расчета опре­деленного числа и само это число.

Критерии делятся на параметрические и непараметрические.

 

Параметрические критерии - Критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (t - критерий Стьюдента, критерий F и др.)

Непараметрические критерии - Критерии, не включающие в формулу расчета параметров распределе­ния и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.)

 

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют прямо оценить различи* в средних, полученных в двух вы­борках (t - критерий Стьюдента).

2. Позволяют прямо оценить различия в дисперсиях (критерий Фишера).

3. Позволяют выявить тенденции изме-нения признака при переходе от ус­ловия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распреде­ления признака.

4. Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).

5. Экспериментальные данные должны отвечать двум, а иногда трем, усло­виям: а) значения признака измерены по интервальной шкале; б) распределение признака является нормальным; в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

6. Математические расчеты довольно сложны.

7. Если условия, перечисленные в п.5, выполняются, параметрические кри­терии оказываются несколько более мощными, чем непараметрические.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют оценить лишь средние тенден­ции, например, ответить на вопрос, чаще ли в выборке А встречаются более высо­кие, а в выборке Б - более низкие значе­ния признака (критерии Q, U, φ* и др.).

2. Позволяют оценить лишь различия в диа­пазонах вариативности признака (критерий φ*).

3. Позволяют выявить тенденции изменения признака при переходе от условия к усло­вию при любом распределении признака (критерии тенденций L и S).

4. Эта возможность отсутствует.

5. Экспериментальные данные могут не от­вечать ни одному из этих условий: а) значения признака могут быть пред­ставлены в любой шкале, начиная от шка­лы наименований; б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке; в) требование равенства дисперсий отсут­ствует.

6. Математические расчеты по большей час­ти просты и занимают мало времени (за исключением критериев χ2и λ).

7. Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем пара­метрические, так как они менее чувстви­тельны к "засорениям'.

14.Статистические гипотезы: нулевая гипотеза, альтернативная гипотеза.

Формулирование гипотез систематизирует предположения иссле­дователя и представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил.

Статистические гипотезы подразделяются на нулевые и альтерна­тивные, направленные и ненаправленные.

Нулевая гипотеза- это гипотеза об отсутствии различий. Она обозначается как H0 и называется нулевой потому, что содержит число 0: X1- Х2=0, где X1, X2 - сопоставляемые значения признаков. Нулевая гипотеза - это то, что мы хо­тим опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза- это гипотеза о значимости различий. Она обозначается как H1. Альтернатив­ная гипотеза - это то, что мы хотим до­казать, поэтому иногда ее называют экспериментальной гипотезой.

Мощность критериев

Мощность критерия - это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Q - критерий Розенбаума

Назначение критерия

Критерий используется для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны.

Гипотезы

H0: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

H1: Уровень признака в выборке 1 превышает уровень признака в вы­борке 2.

Ограничения критерия Q

1. В каждой из сопоставляемых выборок должно быть не менее 11 на­блюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:

а) если в обеих выборках меньше 50 наблюдений, то абсолютная ве­личина разности между n1 и n2 не должна быть больше 10 на­блюдений;

б) если в каждой из выборок больше 51 наблюдения, но меньше 100, то абсолютная величина разности между щ и Л2 не должна быть больше 20 наблюдений;

в) если в каждой из выборок больше 100 наблюдений, то допуска­ется, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза (Гублер Е.В., 1978, с. 75).

2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмыслен­но. Между тем, возможны случаи, когда диапазоны разброса значе­ний совпадают, но, вследствие разносторонней асимметрии двух рас­пределений, различия в средних величинах признаков существенны.

 

 

17. U- критерий Манна-Уитни

Назначение критерия

Критерий предназначен для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1•n23 или n1=2, n2≥5, и является более мощным, чем критерий Ро­зенбаума.

Этот метод определяет, достаточно ли мала зона перекрещиваю­щихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значе­ния, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более ве­роятно, что различия достоверны. Иногда эти различия называют раз­личиями в расположении двух выборок.

Эмпирическое значение критерия U отражает то, насколько вели­ка зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.

Гипотезы

Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1.

H1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n1•n2≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n1•n2≤60. Однако уже при n1•n2>20 ранжирование становиться достаточно трудоемким.

На наш взгляд, в случае, если n1•n2>20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбина­ции с критерием λ,, позволяющим выявить критическую точку, в кото­рой накапливаются максимальные различия между двумя сопоставляе­мыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих из­менений.

Данный критерий является продолжением критерия U на боль­шее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выбор­ка. Затем все индивидуальные значения возвращаются в свои первона­чальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случай­ны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между вы­борками. Но если в одной из выборок будут преобладать низкие значе­ния рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные раз­личия по уровню исследуемого признака.

Н1: Между выборками 1, 2, 3 и т. д. существуют неслучайные разли­чия по уровню исследуемого признака.

Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них п—Ъ, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р≤0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р5~0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по край­ней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица преду­смотрена только для трех выборок и {n1, n2, n3}≤5.

При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ2, поскольку критерий Крускала-Уоллиса асимптотически прибли­жается к распределению χ2.

Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок.

3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказать­ся стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½·[c·(c-1)]*[1] таких попарных сопоставлений используется, ес­тественно, критерий для двух выборок, например U или φ*.

 

 

19. S- критерий тенденций Джонкира

Назначение критерия S

Критерий S предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок.

Описание критерия S

Критерий S позволяет нам упорядочить обследованные выборки по какому-либо признаку, например, по креативности, фрустрационной толерантности, гибкости и т.п.

Критерий S основан на способе расчета, близком к принципу критерия Q Розенбаума. Все выборки располагаются в порядке возрас­тания исследуемого признака, при этом выборку, в которой значения в общем ниже, мы помещаем слева, выборку, в которой значения выше, правее, и так далее в порядке возрастания значений. Таким образом, все выборки выстраиваются слева направо в порядке возрастания зна­чений исследуемого признака.

При упорядочивании выборок мы можем опираться на средние значения в каждой выборке или даже на суммы всех значений в каж­дой выборке, потому что в каждой выборке должно быть одинаковое 1 количество значений. В противном случае критерий S неприменим j (подробнее об этом см. в разделе "Ограничения критерия S").

Гипотезы

Н0: Тенденция возрастания значений признака при переходе от выбор­ки к выборке является случайной.

H1: Тенденция возрастания значений признака при переходе от выбор­ки к выборке не является случайной.

Ограничения критерия S

1. В каждой из сопоставляемых выборок должно быть одинаковое чис­ло наблюдений. Если число наблюдений неодинаково, то придется искусственно уравнивать выборки, утрачивая при этом часть полу­ченных наблюдений.

Например, если в двух выборках по 7 наблюдений, а в третьей - И, то 4 из них необходимо отсеять. Для этого карточки с индивидуаль­ными значениями переворачиваются лицевой стороной вниз и пере­мешиваются, а затем из них случайным образом извлекается 7 кар­точек. Оставшиеся 4 карточки с индивидуальными значениями не включаются в дальнейшее рассмотрение и в подсчет критерия S. Ясно, что при таком подходе часть информации утрачивается, и об­щая картина может быть искажена.

Если исследователь хочет избежать этого, ему следует воспользо­ваться критерием Н, позволяющим выявить различия между тремя и более выборками без указания на направление этих различий (см. параграф 2.4).

2. Нижний порог: не менее 3 выборок и не менее 2 наблюдений в ка­ждой выборке. Верхний порог в существующих таблицах: не более 6 выборок и не более 10 наблюдений в каждой выборке (см. Табл. III Приложения 1 для определения критических значений S). При большем количестве выборок или наблюдений в них придется поль­зоваться критерием Н Крускала-Уоллиса.

 

 

21. G- критерий знаков

Назначение критерия G

Критерий знаков[2] G предназначен для установления общего на­правления сдвига исследуемого признака.

Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ос­лабления.

Описание критерия G

Критерий знаков применим и к тем сдвигам, которые можно оп­ределить лишь качественно, так и к тем сдвигам, которые могут быть измерены количественно.

Суть критерия знаков состоит в том, что он определяет, не слишком ли много наблюдается "нетипичных сдвигов", чтобы сдвиг в "типичном" направлении считать преобладающим? Ясно, что чем мень­ше "нетипичных сдвигов", тем более вероятно, что преобладание "типичного" сдвига является преобладающим. Gэмп - это количество "нетипичных" сдвигов. Чем меньше Gэмп, тем более вероятно, что сдвиг в "типичном" направлении статистически достоверен.

Гипотезы

Н0: Преобладание типичного направления сдвига является случайным.

H1: Преобладание типичного направления сдвига не является случайным.

Ограничения критерия знаков

Количество наблюдений в обоих замерах - не менее 5 и не более 300.

22. Т- критерий Вилкоксона

Назначение критерия

Критерий применяется для сопоставления показателей,, измерен­ных в двух разных условиях на одной и той же выборке испытуемых.

Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.

Описание критерия Т

Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого мы сначала ранжируем все абсолютные величины сдвигов, а потом суммируем ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из на­правлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Гипотезы

Н0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

H1: Интенсивность сдвигов в типичном направлении превышает интен­сивность сдвигов в нетипичном направлении.

Назначение критерия

Критерий χ2r применяется для сопоставления показателей, изме­ренных в трех или более условиях на одной и той же выборке испы­туемых.

Критерий позволяет установить, что величины показателей от усло­вия кусловию изменяются, но при этом не указывает на направление изменений.

Описание критерия

Данный критерий является распространением критерия Т Вил­коксона на большее, чем 2, количество условий измерения. Однако здесь мы ранжируем не абсолютные величины сдвигов, а сами индиви­дуальные значения, полученные данным испытуемым в 1, 2, 3 и т. д. замерах.

После того, как все значения будут проранжированы, подсчитыва-ются суммы рангов по столбцам для каждого из произведенных замеров.

Если различия между значениями признака, полученными в раз­ных условиях, случайны, то суммы рангов по разным условиям будут приблизительно равны. Но если значения признака изменяются в раз­ных условиях каким-то закономерным образом, то в одних условиях будут преобладать высокие ранги, а в других - низкие. Суммы рангов будут достоверно различаться между собой. Эмпирическое значение критерия χ2r и указывает на то, насколько различаются суммы рангов. Чем больше эмпирическое значение χ2r, тем более существенные рас­хождения сумм рангов оно отражает.

Если χ2rравняется критическому значению или превышает его, различия статистически Достоверны.

Гипотезы

Н0: Между показателями, полученными (измеренными) в разных усло­виях, существуют лишь случайные различия.

H1: Между показателями, полученными в разных условиях, существуют неслучайные различия.

Ограничения критерия

1. Нижний порог: не менее 2-х испытуемых (n≥2), каждый из которых прошел не менее 3-х замеров (с≥3).

2. При с=3, n9, уровень значимости полученного эмпирического зна­чения χ2rопределяется по Таблице VII-A Приложения 1; при с=4, n≤4, уровень значимости полученного эмпирического значения χ2r определяется по Таблице VII-Б Приложения 1; при больших коли­чествах испытуемых или условий полученные эмпирические значения χ2rсопоставляются с критическими значениями χ2r, определяемыми по Таблице IX Приложения 1. Это объясняется тем, что χ2rимеет распределение, сходное с распределением χ2r. Число степеней свобо­ды v определяется по формуле: v=c—1, где с - количество условий измерения (замеров).

 

 

Гипотезы

Н0: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, случайно.

H1: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, неслучайно.

При формулировке гипотез мы имеем в виду новую нумерацию условий, соответствующую предполагаемым тенденциям.

Ограничения критерия Пейджа

1. Нижний порог - 2 испытуемых, каждый из которых прошел не менее 3-х замеров в разных условиях. Верхний порог - 12 испытуемых и 6 условий (n≤12, c≤6). Критические значения критерия L даны по ру­ководству J.Greene, M. D'Olivera (1989). Они предусматривают три уровня статистической значимости: р≤0,05; р≤0,01; р≤0,001.

2. Необходимым условием применения теста является упорядоченность столбцов данных: слева должен располагаться столбец с наименьшей ранговой суммой показателей, справа - с наибольшей. Можно просто пронумеровать заново все столбцы, а потом вести расчеты не слева направо, а по номерам, но так легче запутаться.

 

26.χ2 критерий Пирсона

Назначения критерия

Критерий χ2 применяется в двух целях;

1) для сопоставления эмпирического распределения признака с теоре­тическим - равномерным, нормальным или каким-то иным;

2) для сопоставления двух, трех или более эмпирических распределе­ний одного и того же признака.

Описание критерия

Критерий χ2отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопостав­лять распределения признаков, представленных в любой шкале, начиная от шкалы наименований (см. п. 1.2). В самом простом случае альтерна­тивного распределения "да - нет", "допустил брак - не допустил бра­ка", "решил задачу - не решил задачу" и т. п. мы уже можем приме­нить критерий χ2.

Гипотезы

Возможны несколько вариантов гипотез, в зависимости от задач,

которые мы перед собой ставим.

Первый вариант:

Н0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.

Н1: Полученное эмпирическое распределение признака отличается от теоретического распределения.

Второй вариант:

Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

Н1: Эмпирическое распределение 1 отличается от эмпирического рас­пределения 2.

Третий вариант:

Н0: Эмпирические распределения 1, 2, 3, ... не различаются между собой.

Н1: Эмпирические распределения 1, 2, 3, ... различаются между собой.

Критерий χ2 позволяет проверить все три варианта гипотез.

Ограничения критерия

1.Объем выборки должен быть достаточно большим: п30. При п<30 критерий χ2 дает весьма приближенные значения. Точность крите­рия повышается при больших п.

2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>5. Это означает, что если число разрядов задано зара­нее и не может быть изменено, то мы не можем применять метод χ2, не накопив определенного минимального числа наблюдений. Ес­ли, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin=k*5.

3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопостав­ляемых распределениях.

4. Необходимо вносить "поправку на непрерывность" при сопоставле­нии распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ2 уменьшается (см. Пример с по­ правкой на непрерывность).

5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду.

Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.

Главное же "ограничение" критерия χ2 - то, что он кажется большинству исследователей пугающе сложным.

 

 

27. λ - критерий Колмогорова-Смирнова

Назначение критерия

Критерий X предназначен для сопоставления двух распределений:

а) эмпирического с теоретическим, например, равномерным или
нормальным;

б) одного эмпирического распределения с другими эмпирическим
распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Описание критерия

Если в методе χ2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала часто­ты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверны­ми. В формулу критерия λвключается эта разность. Чем больше эмпи­рическое значение λ, тем более существенны различия.

Гипотезы

Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

Ограничения критерия λ

1. Критерий требует, чтобы выборка была достаточно большой. При сопоставлении двух эмпирических распределений необходимо, что­бы п1,2 >50. Сопоставление эмпирического распределения с теоре­тическим иногда допускается при п>5 (Ван дер Варден Б.Л., 1960; Гублер Е.В., 1978).

2. Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, мы можем за разряды принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточ­ности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то и накопление частот будет отражать лишь этот элемент случайного соседства разрядов. Например, если шесть стимульных картин в ме­тодике Хекхаузена разным испытуемым предъявляются в разном порядке, мы не вправе говорить о накоплении реакций при переходе от картины №1 стандартного набора к картине №2 и т. д. Мы не можем говорить об однонаправленном изменении признака при со­поставлении категорий "очередность рождения", "национальность", "специфика полученного образования" и т.п. Эти данные представ­ляют собой номинативные шкалы: в них нет никакого однозначного однонаправленного изменения признака.

Итак, мы не можем накапливать частоты по разрядам, которые отличаются лишь качественно и не представляют собой шкалы порядка. Во всех тех случаях, когда разряды представляют собой не упо­рядоченные по возрастанию или убыванию какого-либо признака кате­гории, нам следует применять метод χ2.

 

28. Понятие многофункциональных критериев

Многофункциональные статистические критерии - это критерии, которые могут использоваться по отношению к самым разнообразным | данным, выборкам и задачам.

Это означает, что данные могут быть представлены в любой шкале, начиная от номинативной (шкалы наименований).

Это означает также, что выборки могут быть как независимыми, так и "связанными", то есть мы можем с помощью многофункциональных критериев сравнивать и разные выборки испытуемых, и показатели одной и той же выборки, измеренные в разных условиях. Нижние границы вы­борок - 5 наблюдений, но возможно применение критериев и по отноше­нию к выборкам с п=2, с некоторыми оговорками (см. разделы "Ограничения критерия φ*" и "Ограничения биномиального критерия m”)

Верхняя граница выборок задана только в биномиальном критерии - 50 человек. В критерии φ* Фишера верхней границы не существует - выборки могут быть сколь угодно большими.

Многофункциональные критерии позволяют решать задачи сопос­тавления уровней исследуемого признака, сдвигов в значениях исследуемого признака и сравнения распределений.

К числу многофункциональных критериев в полной мере относится критерий φ* Фишера (угловое преобразование Фишера) и, с неко­торыми оговорками - биномиальный критерий m.

Многофункциональные критерии построены на сопоставлении до­лей, выраженных в долях единицы или в процентах. Суть критериев [состоит в определении того, какая доля наблюдений (реакций, выборов, испытуемых) в данной выборке характеризуется интересующим иссле­дователя эффектом и какая доля этим эффектом не характеризуется.

Таким эффектом может быть:

a) определенное значение качественно определяемого признака - на­пример, выражение согласия с каким-либо предложением; выбор правой дорожки из двух симметричных дорожек; отнесенность к опреде­ленному полу; присутствие фигуры отца в раннем воспоминании и др.

б) определенный уровень количественно измеряемого признака, напри­мер, получение оценки, превосходящей проходной балл; решение за­дачи менее чем за 20 сек; факт работы в команде, по численности превышающей 4-х человек; выбор дистанции в разговоре, превы­шающей 50 см, и др.

в) определенное соотношение значений или уровней исследуемого при­знака, например, более частый выбор альтернатив А и Б по сравне­нию с альтернативами В и Г; преимущественное проявление крайних значений признака, как самых высоких, так и самых низких; преоб­ладание положительных сдвигов над отрицательными и др.

Итак, путем сведения любых данных к альтернативной шкале "Есть эффект - нет аффекта" многофункциональные критерии позволя­ют решать все три задачи сопоставлений - сравнения "уровней", оценки "сдвигов" и сравнения распре









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2019 zdamsam.ru Размещенные материалы защищены законодательством РФ.