Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА





Средняя величина дает обобщающую характеристику всей сово­купности изучаемого явления. Однако, исчислив среднюю арифме­тическую по данным вариационного ряда, мы еще ничего не знаем о том, как отдельные значения изучаемого признака группируются вок­руг средней. В этом отношении наблюдаются существенные разли­чия. В одних случаях отдельные значения признака весьма близки к средней арифметической и мало чем от нее отличаются. В этом слу­чае средняя хорошо представляет всю совокупность. В другом слу­чае, наоборот, отдельные значения далеки от средней, и тогда сред­няя не будет представлять всю совокупность. Возьмем, например, средний уровень доходов населения. Он может быть исчислен как средняя арифметическая из доходов граждан какой-либо страны. Од­нако значение средней величины для стран, в которых нет резких раз­личий в уровне доходов, буцет гораздо выше, чем для стран, в кото­рых наблюдаются резкие различия.

Поэтому нельзя ограничиться вычислением одной средней вели­чины. Надо изучать не только среднюю, но и отклонения от нее, пото­му что именно в отклонениях виден весь процесс явления в его диа­лектическом развитии. Отклонение в одну сторону от средней для некоторых показателей следует рассматривать как ростки нового, от­клонения в противоположную сторону - как пережитки старого. Для вариационного ряда важно изучать степень сплоченности всех отдель­ных значений признака вокруг его среднего значения, степень раз­бросанности этих значений, степень колеблемости их. Для этого в теории статистики используются показатели вариации.

Показатели вариации делятся на две группы: абсолютные и относи­тельные. К абсолютным показателям относятся: размах вариации, сред­нее линейное отклонение, дисперсия и среднее квадратическое отклоне­ние. К относительным показателям вариации относятся: коэффициенты осцилляции, вариации, относительное линейное отклонение и др. Отно­сительные показатели вычисляются как отношение абсолютных показа­телей вариации к средней арифметической (или медиане).

Вариационный размах. Вариационный размах (R) (или, как еще говорят, амплитуда колебаний) показывает, насколько велико разли­чие между единицами совокупности, имеющими самое маленькое и самое большое значение признака.


Размах рассчитывают как разность между наибольшим (хmax ) наименьшим (хmin) значениями варьирующего признака, т.е.:


(7.11)


Пример. Рассмотрим возраст студентов какого-нибудь вуза: са­мому молодому студенту - 17 лет, самому старшему - 25 лет. Раз­ность составляет 8 лет.

Значение подобного рода величины необходимо в практической и хозяйственной деятельности, а также в научных исследованиях. На­пример, размах вариации применяется для контроля качества продук­ции при определении влияния систематически действующих причин на производственный процесс. Дня этого через определенные проме­жутки времени отбирают несколько деталей и проводят их измерение. Рассчитав по данным этих выборок показатели размаха вариации и сопоставив результаты вычислений, судят об устойчивости режима про­изводственного процесса.



В учебной литературе по статистике обычно указывается, что раз­мах имеет существенный недостаток. Его величина всецело зависит от крайних значений признака, и он не учитывает всех изменений варьирующего признака в пределах совокупности. Этот упрек в ад­рес размаха является не совсем верным. Какой же это недостаток, когда именно в этом заключается суть показателя.

Размах вариации для того и существует, чтобы измерять расстоя­ние между крайними точками. Другое дело, что в изучении вариации нельзя ограничиться определением одного лишь ее размаха. Но это не исключает необходимости определения величины этого показате­ля, не умаляет его значения.

К действительным недостаткам размаха вариации можно отнести следующее: очень низкое и очень высокое значения признака по срав­нению с основной массой его значений в совокупности могут быть обусловлены какими-либо сугубо случайными обстоятельствами, т.е. эти значения являются аномальными в совокупности. В этих случаях размах вариации даст искаженную амплитуду колебания признака про­тив, так сказать, нормальных его размеров, так как в данную совокуп­ность включены единицы другой совокупности с аналогичным при­знаком. Поэтому прежде чем определить величину размаха вариации, следует очистить совокупность от аномальных наблюдений. Например,


нельзя вычислять размах вариации заработков работников какого-либо частного предприятия, если наряду с заработками наемных работни­ков в совокупность включен «заработок» владельца.

Итак, размах вариации - важный показатель колеблемости при­знака, но он не исчерпывает характеристику вариации.

Среднее линейное отклонение. Для анализа вариации необхо­дим показатель, который бы отражал все колебания варьирующего признака и давал обобщенную его характеристику. Для многих варь­ирующих признаков возможно допущение, что при прочих равных условиях все единицы совокупности в соответствии с основными за­конами своего развития имеют одинаковую и при том вполне опреде­ленную величину в данных условиях места и времени. Вполне логич­но в качестве такой величины условно принять среднюю величину из всех значений признака, поскольку в ней более или менее погашают­ся случайные отклонения от закономерного развития явления, и сред­няя тем самым отражает типичный размер признака у данной одно­родной совокупности единиц. Но условия существования и развития отдельных единиц совокупности в определенной степени различны, что сказывается на различии значений признака. Средняя величина отражает эти средние условия.

Следовательно, средняя применяется в качестве своего рода центра тяжести, вокруг которого происходит колебание, рассеяние значений признака. При обобщении этих колебаний необходимо прибегать к ме­тоду средних величин - искать среднюю величину этих отклонений.

Такая средняя называется средним линейным отклонением (3). Эта величина вычисляется как средняя арифметическая из абсолют­ных значений отклонений вариант х и х (простая (формула 7.12) или взвешенная (формула 7.13), в зависимости от исходных условий):


(7.12)


(7.13)



ой' Поскольку сумма отклонений значений признака от средней ве­личины равна нулю, приходится все отклонения брать по модулю, на что указывают прямые скобки в числителе формул.

Пример. Покажем расчет среднего линейного отклонения по дан­ным табл. 7.5.

Таблица 7.5 Обеспеченность населения города общей жилой площадью

Алгоритм расчета среднего линейного отклонения следующий:!

1. Найдем середину интервалов (х\) по исходным данным (гр^ фа А) и запишем в таблицу (графа 2).

2. Определим произведения значений середины интервалов (х[) на соответствующие им веса (^) (графа 3). В итоге получим 1 206. Рассчитаем среднюю величину по формуле средней арифметической взвешенной:


3. Для расчета линейного отклонения найдем абсолютные откло­нения середины интервалов, принятых нами в качестве вариантов признака (х,) от средней величины (х) (графа 4).

4. Наконец, вычислим произведения отклонений \х'i-х\ на их веса (Л и подсчитаем сумму их произведений. Она равна 236,6. Результа­ты записываем в графу 5.

Делим эту сумму на сумму весов, чтобы получитьискомую вели­чину 3:

Таково в среднем отклонение вариантов признака от их средней величины. Это отклонение по сравнению со средней величиной при­знака небольшое. Оно отличается от средней на 9,694 кв. м. Это сви­детельствует о том, что данная совокупность в отношении нашего признака однородна, а средняя - типична.

Таким образом, среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности. Од­нако при его исчислении приходится допускать некорректные с точки зрения математики действия, нарушать законы алгебры. Математики и статистики искали иной способ оценки вариации для того, чтобы иметь дело только с положительными величинами. Был найден очень простой выход - возвести все отклонения во вторую степень. Это столь простое решение привело в последующем к большим научным ре­зультатам. Оказалось, что обобщающие показатели вариации, найден­ные с использованием вторых степеней отклонений, обладают заме­чательными свойствами; позднее на их основе были разработаны новые методы исследования, а также новые показатели количествен­ной характеристики большого класса явлений. Полученную меру ва­риации назвали дисперсией и обозначили D или о2.

Дисперсия. Дисперсия представляет собой средний квадрат откло­нений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой дисперсии (формула 7.14) и взвешенной дисперсии (формула 7.15);


(7.14)



(7.15)


Расчет дисперсии может быть упрощен. В случае равных интер­валов в вариационном ряду распределения используется способ от­счета от условного нуля (способ моментов). Для его понимания необ­ходимо знать математические свойства дисперсии:

1. Дисперсия постоянной величины равна нулю.

2. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:


(7.16)


Значит, средний квадрат отклонений можно вычислить не по за­данным значениям признака, а по их отклонениям от какого-то по­стоянного числа.

3. Уменьшение всех значений признака в k раз уменьшает дис­персию в А-2 раз, а среднее квадратическое отклонение - в k раз:


(7.17)


Значит, все значения признака можно разделить на какое-то по­стоянное число (скажем, на величину интервала ряда), исчислить сред­нее квадратическое отклонение, а затем умножить его на постоянное число:


(7.18)


4. Если исчислить средний квадрат отклонений от любой величи­ны Л, в той или иной степени отличающейся от средней арифмети­ческой (х), то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической:


(7.19)


Средний квадрат отклонений при этом будет больше на вполне определенную величину - на квадрат разности средней и этой услов­но взятой величины, т.е. на (х-А)1:

Или


(7.20)


Значит, дисперсия от средней всегда меньше дисперсий, исчис­ленных от любых других величин, т.е. она имеет свойство минималь­ности.

В случае когда А приравнивается нулю и, следовательно, откло­нения не вычисляются, формула принимает такой вид:

или


(7.21)


Значит, средний квадрат отклонений равен среднему квадрату зна­чений признака минус квадрат среднего значения признака.

На приведенных математических свойствах дисперсии основан Метод расчета дисперсии по способу моментов, или способу отсчета от условного нуля, который применялся при исчислении средней ве­личины. Расчет производится по формуле


(7.22)


где * А

ширина интервала;

условный нуль, в качестве которого удобноиспользовать середину интервала, обладающего наибольшей частотой;


_ Дисперсия есть средняя величина квадратов отклонений, а вари-| анты признака выражены в первой степени. ;

Среднее квадратическое отклонение (<т). Среднее квадратичео| кое отклонение равно корню квадратному из дисперсии. Оно может! быть простым (формула 7.23) или взвешенным (формула 7.24).


(7.23)


или


(7.24)1


Среднее квадратическое отклонение, как и среднее линейное от-' клонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (в метрах, тоннах, рублях и т.д.).


Среднее квадратическое отклонение часто используется в каче­стве единицы измерения отклонений от средней арифметической. В зарубежной литературе этот показатель называется нормированным, или стандартизованным, отклонением.

По свойству мажорантности средних величин (см. глава 6) сред­нее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака близко к нормальному или симметричному распределению, то между с и d существует взаимо­связь: ~а = 0,8о или ст = 1,25 ~а .

Среднее квадратическое отклонение играет важную роль в ана­лизе вариационных рядов распределения. В условиях нормального распределения существует следующая взаимосвязь между величиной среднего квадратического отклонения и количеством наблюдений:

• в пределах х ± 1о располагается 0,683, или 68,3% количества наблюдений;

• в пределах х ± 20 - 0,954, или 95,4%;

• в пределах х ± Зо - 0,997, или 99,7% количества наблюдений. В действительности на практике почти не встречаются отклоне­ния, которые превышают ±3ст. Отклонение 3(7 может считаться мак­симально возможным. Это положение называют правилом трех сигм.

Пример. Рассмотрим расчет дисперсии и среднего квадратичес­кого отклонения по данным табл. 7.6 о выпуске промышленной про­дукции фирмами отрасли.

Таблица 7.6

Вычисление о2 и а по несгруппированным данным


Алгоритм расчета следующий:

1. Определим среднюю величину по исходнымданным (графа 1) по формуле средней арифметической простой:

2. Найдем отклонения (^ - х) и запишем их в графе 2. Возведем отклонения во вторую степень и запишем в графе 3. Определим их сумму. Она равна 448.

3. Разделив эту сумму на число единиц совокупности, пол> дисперсию:

•1?> ,

а2»44^^. о

4. Извлечем из дисперсии корень второй степени ^/74,67 = 8,64 ] руб. и получим среднее квадратическое отклонение.

Степень вариации в данной совокупности невелика, таккак сред­няя величина равна 50 млн руб. Это говорит об однородности рас­сматриваемой нами совокупности.

Пример. Рассмотрим вычисление дисперсии и среднего квадра-тического отклонения по данным распределения сотрудников двух фирм по тарифному разряду (табл. 7.7).

Фирма А

Фирма Б

Среднее квадратическое отклонение в фирме Б более чем в два раза превышает среднее квадратическое отклонение фирмы А. До сих пор говорилось о показателях вариации, выраженных в абсолютных


W


величинах. Но для целей сравнения колеблемости различных призна­ков в одной и той же совокупности или же при сравнении колеблемо­сти одного и того же признака в нескольких совокупностях представ­ляют интерес показатели вариации, приведенные в относительных величинах. Базой для сравнения должна служить средняя арифмети­ческая. Эти показатели вычисляются как отношение размаха вариа­ции, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего они выражаются в процентах и определяют не только сравнительную оцен­ку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Разли­чают следующие относительные показатели вариации (V). Коэффициент осцилляции (V.):


(7.25)


Линейный коэффициент вариации (V-\.


1(7.26)


Или

Наиболее часто в практических расчетах применяется показатели относительной вариации - коэффициент вариации. ;

Коэффициент вариации (V ):


(7.27)



Пример. По данным,привешенным в табл. 7.7,рассчитаем коэф­фициенты вариации:

На основе полученных коэффициентов можно сделать вывод,чтопо тарифному разряду совокупности рабочих фирмы А и фирмы Б являются однородными. Однако вариация колеблемости тарифного разряда в фирме Б несколько выше, чем вариация в фирме А.

Характеристика степени вариации ряда может быть определена также по формуле квартального отклонения (0, предложенной анг­лийским биологом и антропологом Ф. Гальтоном:


(7.28)


где б, и б, - соответственно 1 -я и 3-я квартили распределения (см. раздел 7.6).

Эта формула дает абсолютный квартильный показатель вари­ации. В симметричных или умеренно асимметричных распределени­ях 0 = 2/3о. Так как на квартальное отклонение не влияют отклоне­ния всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднено или невозможно. В частности, этот показатель может быть рекомендован для рядов распределения с открытыми интервалами.

В целях сравнения вариации в различных рядах вычисляется от­носительный квартильный показатель вариации по формуле


(7.29)



Или

где Me - медиана ряда распределения.

7.4

ВАРИАЦИИ АЛЬТЕРНАТИВНОГО ПРИЗНАКА. ЭНТРОПИЯ РАСПРЕДЕЛЕНИЯ

В ряде случаев возникает необходимость в измерении дисперсии так называемых альтернативных признаков, тех, которыми облада­ют одни единицы совокупности и не обладают другие. Примером та­ких признаков являются: бракованная продукция, ученая степень пре­подавателя вуза, работа по полученной специальности и т.д. Вариация альтернативного признака количественно проявляется в значении нуля у единицы, которая этим признаком не обладает, или единицы у той, которая данный признак имеет.

Пусть/? - доля единиц в совокупности, обладающих данным при­знаком = min); q - доля единиц, не обладающих данным призна­ком, причем р+ q = 1. Альтернативный признак принимает всего два значения - 0 и 1 с весами соответственно q и р. Исчислим среднее значение альтернативного признака по формуле средней арифмети­ческой:


(7.30)


Дисперсия альтернативного признака определяется по формуле:


(7.31)



Таким образом, дисперсия альтернативного признака равна про­изведению доли на число, дополняющее эту долю до единицы. Ко­рень квадратный из этого показателя, т.е. ^[pq, соответствует сред­нему квадратическому отклонению альтернативного признака. Предельное значение дисперсии альтернативного признака равно 0,25 при/?= 0,5.

Показатели вариации альтернативных признаков широко исполь­зуются в статистике, в частности, при проектировании выбороч­ного наблюдения, обработке данных социологических обследова­ний, статистическом контроле качества продукции, в ряде других случаев.

Пример. В трех партиях готовой продукции, представленной на контроль качества, была обнаружена годная и бракованная продук­ция (табл. 7.8).

Таблица 7.8 Продукция, представленная на контроль качества

Партия   Готовая продукция, шт.   Из них продукция  
годная   бракованная  
  1200 '      
  .'дмй 1000      
  ".»•• 1100      

 

Определим в целом для всех партий следующие показатели:

1) средний процент годной продукции и средний процент брака;

2) дисперсию, среднее квадратическое отклонение, коэффициент вариации годной продукции.

Произведем расчет данных показателей на нашем примере. Средний процент годной продукции в трех партиях равен:


Средний процент бракованной продукции составш»:

/ q = 1-0,8 = 0,2 или 20%.

Дисперсия удельного веса годной продукции:


Среднее квадратическое отклонение удельного веса годной про­дукции;

о=7м=л/^16=0,4.

Коэффициент вариации удельного веса годной продукции в об­щем выпуске продукции:

Обобщенной характеристикой различий внутри рада может служить энтропия распределения. Применительно к статистике энтропия - это мера неопределенности данных наблюдения, которая может иметь раз­личные результаты. Энтропия зависит от числа градаций признака и от вероятности каждой из них. Энтропия показывает, имеется ли законо­мерность в концентрации отдельных градаций у наименьшего числа позиций или, напротив, заполненность распределения одинаковая. При этом сумма вероятностей всех возможных исходов равна единице. Эн­тропия измеряется в битах.

Показатель энтропии Я, представляет собой отрицательную сум­му произведения вероятностей различных значений случайной вели­чины (р) на логарифмы (при основании два) этих вероятностей:


(7.32)


Если все варианты равновероятны, то энтропия максимальна. Если же все варианты,за исключением одного, равны нулю, то энтропия равна нулю.


Энтропияальтернативного признака (я =2) при равновероят­ном распределении (р = 0,5)равна единице:


(7.33)


Пример. Расчет энтропии распределения можно показать на вы­пуске продукции различных сортов на одном из предприятий точного машиностроения (табл. 7.9).

Таблица 7.9 Вероятность выпуска различных сортов продукции

Сорт   1-й   2-й   3-й   Брак   Итого  
Вероятность, p^   0,90   0,04   0,05   0,01   1,00  

 


(7.34)


где р - вероятность любого возможного состояния сложной системы.

Показатель энтропии позволяет также измерять количество информации. Чем больше информации о случайном событии, тем определеннее его состояние. Чем больше вероятность случайного события ^, тем меньше информации несет его осуществление. В слу­чае р^= 1


(7.35)



Следовательно, данное испытание не содержит никакой инфор­мации. Аналогично и при/» =0.

Энтропия распределения интерпретируется как мера рассредото­ченное™ вариантов случайной переменной по ее возможным значени­ям, или как мера неопределенности значения реализации. Неопреде­ленность значений реализации случайной переменной предусматривает наличие некоторого наблюдателя, находящегося в том или ином отно­шении к источнику неопределенности. Очевидно, можно представить ситуацию, когда для двух наблюдений степени неопределенности ре­зультата одного и того же наблюдения со случайными исходами суще­ственно различаются. Например, различны результаты голосования при экспертных опросах для наблюдателя - участника голосования и на­блюдателя, не участвующего в голосовании.

В связи с тем что верхнего предела энтропия распределения не имеет, целесообразно вычислить наряду с абсолютной и относитель­ную величину неопределенности.

Относительная энтропия определяется как отношение ее фак­тической величины к максимальной, т.е.


(7.36)


Это отношение изменяется от 0 до 1 и может быть интерпретиро­вано. Чем меньше относительная энтропия, тем меньше неопреде­ленность и выше однородность.

7.5

ВИДЫ ДИСПЕРСИЙ В СОВОКУПНОСТИ, РАЗДЕЛЕННОЙ НА ГРУППЫ. ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ

Изучая вариацию по всей совокупности в целом и опираясь на общую среднюю в своих расчетах, мы не можем определить влияние отдельных факторов, характеризующих колеблемость индивидуаль­ных значений признака. Это можно сделать при помощи аналитичес­кой группировки, разделив изучаемую совокупность на однородные группы по признаку-фактору. При этом можно определить три пока­зателя колеблемости признака в совокупности: дисперсию общую, межгрупповую и среднюю из внутригрупповых дисперсий.


Общая дисперсия о2 измеряет вариацию признакаво всей сово­купности под влиянием всех факторов, обусловившихэту вариацию:


(7.37)


Межгрупповая дисперсия (52) характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникаю­щие под влиянием признака-фактора, положенного в основание груп­пировки. Она рассчитывается по формуле


(7.38)


где k - число групп;

я - число единиц ву-й группе;

х - частная средняя по j-тл группе;

'X - общая средняя по совокупности единиц.

Внутригрупповая дисперсия (ст2) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факто­ров и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:


(7.39)


По совокупности в целом вариация значений признака подвлия­нием прочих факторов характеризуется средней из внутригрупповых дисперсий2):

24)


(7.40)


Между общей дисперсией о2 0 средней из внутригрупповых дис­персий сигма ср2 и межгрупповой 52 дисперсией существует соотношение, определяемое правилам сложения дисперсий. Согласно этому прави­лу общая дисперсия равна сумме средней из внутригрупповых и меж­групповой дисперсий:


(7.41)


Согласно этому правилу, общая дисперсия, возникающая под дей­ствием всех факторов, равна сумме дисперсий, появляющихся под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или прове­рить правильность расчета третьего вида.

Правило сложения дисперсий позволяет выявить зависимость результата от определяющих факторов с помощью соотношения меж­групповой дисперсии и общей дисперсии. Это соотношение называ­ется эмпирическим коэффициентом детерминации (г|2):


(7.42)


Он показывает, какая доля в общей дисперсии приходится на дис­персию, обусловленную вариацией признака, положенного в основу группировки.

Корень квадратный из эмпирического коэффициента детермина­ции носит название эмпирического корреляционного отношения (Т():


(7.43)



Это отношение характеризует влияние признака, положенного в ос­нование группировки, на вариацию результативного признака. Эмпи­рическое корреляционное отношение изменяется в пределах от 0 до 1. Если Т} = 0, то группировочный признак не оказывает влияния на ре­зультативный. Если т) = 1, то результативный признак изменяется толь­ко в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным зна­чениям.

Пример. Рассмотрим правило сложения дисперсий. Имеются дан­ные об объеме выполненных работ проектао-изыскательными орга­низациями на предприятиях разных форм собственности (табл. 7.10).

Таблица 7.10

Организация   Объем выполненных работ на предприятиях, млн руб.  
государственных   коммерческих  
    3 980  
     
     
     
     
Итого      

 

Алгоритм решения следующий:

1. Определим среднийобъем выполненных работ на предприяти­ях двух форм собственности:

2. Определим средние объемы выполненных работ по предприя­тиям каждой формы собственности:


3. Рассчитаем внутригрупповые и общую дисперсии:

4. Рассчитаем среднюю из внутригрупповых и межгрупповую дис- Ц Персии по данным, представленным в табл. 7.11.

В


Таблица 7.11 Расчет о2 и У по предприятиям двух форм собственности

» Группы предприятий   Численность предприятий п!   Средний объем выполненных работ, млн руб. х!   Дисперсия объема выполненных работ ^  
Государственные предприятия Коммерческие предприятия   S   686 5794   32504 1 598 040  

 

Средняяиз внутригрупповых дисперсий:

межгрупповая дисперсия:


5. Найдем общую дисперсию по правилу сложения дисперсий:

с§=815 264+6 522 916 =7 338180.

Сопоставив межгрупповую дисперсию с общей дисперсией, рас­считаем коэффициент детерминации:




Коэффициент детерминации показывает, что дисперсия объема выполненных работ зависит от формы собственности предприятия на 88,9%. Остальные 11^1% определяются множеством других неуч­тенных факторов.

Извлекая квадратный корень из коэффициента детерминации, определим эмпирическое корреляционное отношение:

Полученное значение эмпирического корреляционного отноше­ния позволяет утверждать, что существует тесная связь между фор­мой собственности предприятия и объемом выполненных проектно-изыскательных работ.

Для проверки существенности связи между группировочным при­знаком и вариацией исследуемого признака часто используется дис­персионное отношение F (критерий Фишера).


(7.44)


где V, и v, - число степеней свободы для сравниваемых дисперсий, при этом

V,=m- I; v^=N-m;

т - число групп, N - число наблюдений.

Расчетное значения критерия Фишера (F ^) сравнивается с кри­тическим (F ), которое определяется по таблице приложения 4 в за­висимости от числа степеней свободы и уровня значимости. Если F>F, наличие связи доказано, так как проверяется нулевая гипо­теза об отсутствии взаимосвязи признаков, т.е. об отсутствии влия­ния группировочного признака на исследуемый признак. В нашем примере F ^=24, а F =10,13 при уровне значимости 0,05, т.е. это го­ворит о наличии связи между объемом выполненных проектно-изыс-кательных работ и формой собственности предприятий.

Правило сложения дисперсий для доли признака. Рассмотрен­ное правило сложения дисперсий распространяется и на дисперсии доли признака, т.е. доли единиц с определенным признаком в сово-


купности, разбитой на группы. При этом изучение вариации проис­ходит непосредственно при вычислении и анализе видов дисперсий для доли признака.

Внутригрупповая дисперсия доли определяется по формуле


(7.45)


где р, - доля изучаемого признака в отдельных группах.

Средняя из внутригрупповых дисперсий имеет следующий вид:


(7.46)


Формула межгрупповой дисперсии имеет следующий вид:


(7.47)


где я, - численность единиц в отдельных группах;

р - доля изучаемого признака во всей совокупности.

••J1' i-'

Доля признака в совокупности определяется по формуле средней арифметической взвешенной: •?-.


(7.48)


Общая дисперсия определяется по формуле


(7.49)



Три вида рассмотренных дисперсий связаны между собой следу­ющим образом:


(7.50)


Это соотношение дисперсий называется правилом сложения дис­персий доли признака.

Зная любые два вида дисперсий из трех, входящих в формулу (7.50), можно определить дисперсию третьего вида или проверить правиль­ность ее расчета.

Пример. Имеются следующие данные удельного веса основных рабочих в трех цехах фирмы (табл. 7.12).

Таблица 7.12









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.