|
Вариация признаков. Показатели структуры вариации. Показатели размеров вариации. Показатели формы вариации. Дисперсионный анализВарьирующие признаки, изучаемые статистикой, имеют различную вариацию (колеблемость). Например, вариация оценок на экзамене в вузе порождается, в частности, различными способностями студентов, неодинаковым временем самостоятельной подготовки, различием социально-бытовых условий и т.д. В этой связи возникает задача измерения колеблемости признаков, решение которой имеет важное значение для теории и практики. Для характеристики размеров вариации в статистике используются следующие обобщающие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднеквадратическое отклонение и коэффициент вариации. Размах вариации величина показателя зависит от величины только двух крайних вариант и не учитывает степень колеблемости основной массы членов ряда. Для более точного измерения вариации используются среднее линейное отклонение и среднеквадратическое отклонение, которые показывают, насколько в среднем отличаются индивидуальные значения признака от его среднего значения. Среднее линейное отклонение определяется по формулам: - для несгруппированных данных (первичного ряда) ; - для вариационного ряда распределения . Среднее квадратическое отклонение и дисперсия определяются по формулам: - для несгруппированных данных ; - для вариационного ряда Дисперсия также равна средней из квадратов индивидуальных значений признака минус квадрат средней величины Среднеквадратическое отклонение является мерилом надежности средней. Чем меньше среднеквадратическое отклонение, тем лучше средняя арифметическая отражает всю представленную совокупность. Дисперсия имеет следующие свойства: 1. постоянной величины равна 0. 2. Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсию не изменяет. 3. Уменьшение или увеличение всех значений признака на одну и туже величину не меняет величины дисперсии. 4. Уменьшение или увеличение всех значений признака в К раз уменьшает или увеличивает дисперсию в К2 раз, а среднеквадратическое отклонение в К раз. , и выражаются в тех же единицах, что и варьирующий признак. по своей величине всегда > по свойству мажорантности средних. При сравнении колеблемости также используются относительные показатели вариации, наиболее часто из которых применяют коэффициент вариации Чем меньше коэффициент вариации, тем меньше колеблемость признака. Коэффициент вариации применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальным). Наряду с изучением вариации признака по всей совокупности в целом бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также между группами. При этом кроме общей средней для всей совокупности исчисляются средние по отдельным группам и три показателя дисперсии: общая, межгрупповая и средняя внутригрупповая. Величина общей дисперсии характеризует вариацию признака под влиянием всех факторов где – общая средняя арифметическая для всей совокупности. Межгрупповая дисперсия отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки. Определяется по формуле где – средняя по отдельной группе; число единиц в отдельной группе. Средняя внутригрупповая дисперсия характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признак-фактора), положенного в основу группировки где – дисперсия по отдельной группе; Рассмотренные дисперсии взаимно связаны между собой: Это называется правилом сложения дисперсий, которое показывает, какая часть (доля) общей дисперсии складывается под влиянием признак-фактора, положенного в основу группировки. Правило сложения дисперсий позволяет выявить зависимость результата от определенных факторов с помощью отношения межгрупповой дисперсии и общей дисперсии. Это отношение называется эмпирическим коэффициентом детерминации (эта квадрат)
Показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки. Корень квадратный из носит названиеэмпирического корреляционного отношения Пример. Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую и общую дисперсии по данным о ПТ двух бригад рабочих.
Решение. Для расчета групповых дисперсий вычислим средние по каждой группе в строке ср.значений по графам 2 и 6. Промежуточные расчеты дисперсий по группам произведем в графах 3,4,7,8. Тогда
Рассчитаем межгрупповую дисперсию, для этого предварительно определим общую среднюю ПТ как среднюю взвешенную из групповых средних Определим межгрупповую дисперсию Т.об, общая дисперсия по правилу сложения дисперсий равна Проверим полученный результат, вычислив общую дисперсию обычным способом На основании правила сложения дисперсий определим эмпирическое корреляционное отношение =0,86. Величина 0,86 характеризует существенную связь между группировочным и результативным признаком. Дисперсия альтернативного признака В атрибутивных рядах распределения качественный признак, имеющий две взаимоисключающие разновидности (Н-р, работники предприятия подразделяются на мужчин и женщин, продукция – на годную и бракованную и т.д.) называется альтернативным признаком. Альтернативный признак принимает всего два значения: 1 - наличие признака; 0 – отсутствие признака. Если обозначим через p – доли единиц, обладающих признаком, q – доли единиц, не обладающих признаком, то p+q=1. Среднее значение альтернативного признака =p. Дисперсия альтернативного признака Предельное значение вариации альтернативного признака равно 0,25, оно получается при p=q= 0,5. Показатели вариации альтернативных признаков широко используются в статистике, в частности, при проектировании выборочного наблюдения, обработке данных социологических обследований, статистическом контроле качества продукции и др. случаях. Пример. В 3-х партиях готовой продукции, представленной на контроль качества, была обнаружена годная и бракованная продукция.
Определим для всех партий в целом: 1. Средний % годной продукции и средний % брака. 2. Дисперсию, среднее квадратическое отклонение, коэффициент вариации годной продукции. Средний процент годной продукции в 3-х партиях равен Средний процент бракованной продукции в 3-х партиях составит q=1-p= 1-0,8-0,2. Дисперсия удельного веса годной продукции Среднее квадратическое отклонение уд. веса годной продукции Коэффициент вариации уд. веса годной продукции в общем выпуске продукции составит
ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры... ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между... Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|