|
Использованием центрального момента 4-го порядка ⇐ ПредыдущаяСтр 7 из 7
На рис. 7.5 и 7.6 представлены два распределения: островершинное (Ek положительный) и плосковершинное (Ek отрицательный). В нормальном распределении Ek = 0. Среднеквадратическая ошибка эксцесса (Стд^) рассчитывается по формуле:
где n - число наблюдений. 266
Рис. 7.5. Островершинное распределение
Рис. 7.6. Плосковершинное распределение Для определения асимметрии и эксцесса можно пользоваться упрощенными формулами, предложенными Линдбергом:
где Р - удельный вес (%) количества тех вариант, которые превосходят среднюю арифметическую, в общем количестве вариант данного ряда; 50 - удельный вес (%) вариант, превосходящих среднюю арифметическую ряда нормального распределения.
где Р - доля (%) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту или другую сторону от величины средней в общем количестве вариант данного ряда); 38,29 - доля (%) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту или другую сторону от величины средней), в общем количестве вариант ряда нормального распределения. Необходимо отметить, что хотя показатели асимметрии и эксцесса характеризуют непосредственно лишь форму распределения признака в пределах изучаемой совокупности, однако их определение имеет не только описательное значение. Часто асимметрия и эксцесс дают определенные указания для дальнейшего исследования социально-экономических явлений. Например, появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности. Кроме того, эти показатели позволяют сделать вывод о возможности отнесения данного эмпирического распределения к типу кривых нормального распределения. 7.9 ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ В АНАЛИЗЕ ВАРИАЦИОННЫХ РЯДОВ Для аппроксимации (выравнивания) эмпирических кривых распределения и сопоставления их с теоретическими в статистике часто пользуются нормальным распределением, функция которого равняется
где у, - ордината кривой нормального распределения; t = x~x - стандартизованное отклонение; о сия - математические постоянные; х - варианты вариационного ряда; л - их средняя величина; О - среднее квадратическос отклонение. Нормальное распределение полностью определяется двумя параметрами - средней арифметической (х) и средним квадратическим отклонением о. Подчиненность закону нормального распределения проявляется тем точнее, чем больше случайных величин действуют вместе. Если ни одна из случайно действующих причин по своему действию не окажется преобладающей над другими, то закон распределения очень близко подходит к нормальному. Такая закономерность проявляется, например, в распределении отклонений в производственном процессе при нормальном уровне организации и технологии, в распределении населения определенного возраста по размеру обуви и т.д. Часто возникают распределения, хотя и не отвечающие строго нормальному распределению, но имеющие с ним сходство. Такие сходные черты часто обусловлены тем, что крайние значения вариантов, близкие к х^ и х^, встречаются много реже, чем серединные. Рассмотрим некоторые свойства кривой нормального распределения: • ЛО - функция нормального распределения - четная, т.е../(-()3= =У(+(). Следовательно, изображающая ее кривая распределена симметрично относительно оси ординат, т.е. х == Мо = Me; • функция имеет бесконечно малые значения при f = ±°о. Это означает, что ветви кривой удалены в бесконечность и асимптотически приближаются к оси абсцисс. При этом чем больше значения признака отклоняются от х, тем реже встречаются; • функция имеет максимум при (= О.Отсюда следует, что модального значения кривая достигает при / = 0 или при х = х. Величина максимума составляет l / -Tin; • при (= ±1 функция дает точки перегиба. Следовательно, при отклонении значений признака (х) от среднего значения (х) в положительном и отрицательном направлениях на одно стандартное (нормированное) отклонение (±0 от х) кривая дает пе-. реход от выпуклости к вогнутости; • если случайная величина представляет сумму двух независимых случайных величин, следующих каждая нормальному закону, то она тоже следует нормальному закону; • площадь между кривой и осью о/ равна единице, как интеграл Пуассона. Пример. Рассмотрим данные распределения образцов крепости одиночной нити (табл. 7.16). Поскольку нормальное распределение зависит от двух параметров: х и о, прежде всего определим соответствующие характеристики. В графах 1 и 2 табл.7.16 приведены фактические варианты и частоты. Расчет х и о произведен обычным способом. Для расчета частот нормального распределения 500 образцов крепости нити со средней х = 64,66 г и средним квадратическим отклонением О = 3,1 г необходимо использовать формулу плотности вероятности:
Чтобы прийти к частотам нормального распределения^, необходимо выразить их через Р^. Для удобства вычислений вероятностей случайные величины нормируются, а затем используются заранее табулированные значения плотности функции распределения нормированной случайной величины. Первый множитель такой функции - величина постоянная для - KLf 2-500,„, _.,__, данного распределения. В нашем случае: —— =—— = 322,6, во вто-о 3,1 ром множителе выражение х-х обозначим через /, тогда получим: о Полученную функцию от t обозначим^):
В математической статистике существуют специальные таблицы для любых значений fit) (приложение 8). KLf Таким образом, /т = —- • /(0 очень легко рассчитать, определив о у _ у для каждого значения варианта х' величину г = —— (графа 5) и най- о дя по таблицам соответствующие fif) (графа 6). Умножив fit) на по- klf стоянный для всех частот множитель ——, получим теоретические о частоты нормального распределения /^(графа 7). Сравнивая полученные /„ (графа 7) с фактическими частотами/ (графа 2), убеждаемся, что их расхождения невелики. На графике, представленном на рис.7.7, видна довольно большая близость фактических частот распределения к теоретическим. Рис. 7.7. Эмпирические и теоретические данные распределения крепости одиночной нити в 500 образцах В то же время нельзя не отметить, что сопоставление графика эмпирических частот с теоретическими в целях определения соответствия эмпирического распределения нормальному позволяет оценивать эти расхождения только субъективно. Объективная характеристика соответствия может быть получена с помощью особых статистических показателей - критериев согласия. Известны критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, А.Н. Колмогорова и Б.С. Ястремского. Критерий согласия Пирсона (х2) вычисляется по формуле:
где /з и/,, - эмпирические и теоретические частоты соответственно. '272 С помощью величины у1 по специальным таблицам приложения 3 определяется вероятность Р(х2)- Входами в таблицу являются значения 5С2 и число степеней свободы у = п - 1. На основе Р выносится суждение о существенности или несущественности расхождения между эмпирическим и теоретическим распределением. При Р > 0,5 считается, что эмпирическое и теоретическое распределения близки, при Р е [0,2; 0,5] совпадение между ними удовлетворительное, в остальных случаях - недостаточное. Если число степеней свободы большое, то применяется соотношение, равное \2х - ^/2у-1. Расхождение между эмпирическим и теоретическим распределениями существенно при значениях этой разности, заметно превосходящих 2. Критерий Романовского (С), также используемый для проверки близости эмпирического и теоретического распределений, определяется следующим образом:
где х2 - критерий Пирсона, рассчитываемый по формуле (7.78); 7 - число степеней свободы (при проверке гипотезы о нормальности распределения равно числу групп минус три). При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному. Критерий Ястремского (L) может быть найден на основе следующего соотношения:
Где N - объем совокупности; pq - дисперсия альтернативного признака; К - число вариантов или групп; Q - принимает значение 0,6 при числе вариантов или групп от 8 до 20. Если L > 3, то эмпирическое распределение соответствует теоретическому. Критерий Колмогорова (k) вычисляется по формуле:
где D максимальное значение разности между накопленными эмпирическими и теоретическими частотами; •' If — сумма эмпирических частот. Необходимым условием использования этого критерия является достаточно большое число наблюдений (не меньше ста). Рассмотрим применение критерия Колмогорова (табл. 7.17). Пример. Как видно из табл. 7.17, максимальное значение разности между эмпирическими и теоретическими частотами составляет 7, т.е. D = 1. Следовательно, величина критерия Колмогорова в нашем случае равна: По специальным таблицам вероятностей Р(\) определяем, что \ соответствует Р(х), близкой к 1,000. Это означает, что с вероятностью, близкой к 1, можно утверждать, что отклонения фактических частот от теоретических в нашем примере являются случайными. Следовательно, в основе фактического распределения образцов по крепости нити лежит закон нормального распределения. В статистике широко используются различные виды теоретических распределений, кроме нормального распределения, - биномиальное распределение, распределение Пуассона и др. Каждое из теоретических распределений имеет специфику и свою область применения в различных отраслях знания. Рассмотрение других видов распределения, кроме нормального, не является предметом изучения в данной главе. Таблица 7.17 ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам... Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем... ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|