Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Показатели, позволяющие оценить структурные сдвиги в пространстве и во времени, будут рассмотрены в соответствующей главе.





Продажа акций АО «Дока-хлеб» на торгах фондовой секции ТМБ «Гермес»

Сделка   Количество проданных акций, шт.   Курс продажи, руб.  
     
     
     

 

Определим по данному дискретному вариационному ряду средний курс продажи акции, используя следующее исходное соотношение:


Чтобы получить общую сумму сделок, необходимо по каждой сдел­ке курс продажи умножить на количество проданных акций и получен­ные произведения сложить. В конечном итоге результат следующий:

Расчет среднего курса продажи произведен по формуле средней арифметической взвешенной:


(6.4)


В отдельных случаях веса могут быть представлены не абсолют­ными величинами, а относительными (в процентах или долях едини­цы). Так, в приведенном выше примере количество проданных в ходе каждой сделки акций соответственно составляет 26,3% (0,263), 15,8% (0,158) и 57,9% (0,579) от их общего числа. Тогда с учетом несложно­го преобразования формулы (6.4) получим:


(6.5)


На практике наиболее часто встречающаяся при расчете средних ошибка заключается в игнорировании весов в тех случаях, когда эти веса в действительности необходимы. Предположим, имеются сле­дующие данные (табл. 6.3).

Таблица6.3

Заработная плата работников предприятия за май 2002 г.

Цех   Средняя заработная плата, руб.  
Т 2   4300 4100  

 


Можно ли по имеющимся данным определить среднюю заработ* ную плату по предприятию в целом? Можно, но только в том случае, если численность работников в 1 -м и 2-м цехах совпадает. Тогда сред­няя заработная плата по предприятию в целом составит 4 200 руб. (доказательство этого правила будет приведено ниже). Однако в цехе 1 может быть занято, к примеру, 10 человек, а в цехе 2-100. Поэтому для расчета средней заработной платы потребуется средняя арифметическая взвешенная:



Общий вывод заключается в следующем: использовать среднюю арифметическую невзвешенную можно только тогда, когда точно установлено отсутствие весов или их равенство.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят кихсерединам. Рассмотрим следующий пример (табл. 6.4).

Таблица 6.4 Распределение работников предприятия по возрасту

Возраст, лет-   Число работников, чел.  
До 25    
25-30    
30-40    
40-50    
50-60    
60 и более    
Итого    

 

Для определения среднего возраста работника найдем середины возрастных интервалов. При этом величины открытых интервалов (первого и последнего) условно приравниваются к величинам интер-


валов, примыкающих к ним (второго и предпоследнего).Согласновышеизложенному середины интервалов будут следующими:

22,5 27,5 35,0 45,0 55,0 65,0.

Используя среднюю арифметическую взвешенную, определим Средний возраст работника данного предприятия:

_ 22,5-7+27.5-13+35.38+45.42+55.16+65.5 ..

х = ——————-—————————————————— = 41 год.

7+13+38+42+16+5

Свойства средней арифметической. Средняя арифметическая обладает некоторыми математическими свойствами, более полно раскрывающими ее сущность и в ряде случаев используемыми при ее расчетах. Рассмотрим эти свойства.

1. Произведение средней на сумму частот равно сумме произве­дений отдельных вариантов на соответствующиеим частоты:

(6.6)

Действительно, если мы обратимся к приведенному выше при­меру расчета среднего курса продажи акций (см. табл. 6.2), то полу­чим следующее равенство (за счет округления среднего курса правая и левая части равенства в данном случае будут незначительно отли­чаться):

1112,9 • 1900 = 1080 • 500 + 1050 • 300 + 1145 • 1100.

2. Сумма отклонений индивидуальных значений признака от сред­ней арифметической равна нулю:


(6.7)



Для нашего примера:

(1080 - 1112,9) • 500 + (1050 - 1112,9) • 300 + +(1145-1112,9) 1106=0.


Математическое доказательство данного свойства сводится к сле­дующему:

Цх,-х).у;-=5д. .у;-5^. =&, •/.-Щ =0.

3. Сумма квадратов отклонений индивидуальных значений при­знака от средней арифметической меньше, чем сумма квадратовихотклонений от любой другой произвольной величины С:

I^Xi-O^fi^X.-X+X-O^f.^Xi^+Cx-C)]2-/,^

=z[(.(,-i)2+2•^,-;c).(;(-C)+(]c-C)2]•Л•= ^(Xi-xf-f^l-dc-CWxi-x)-/, +Кх-02 •fi ==t(x,-x)2•f,+2•(x-C)•0+i(x-C)2•f,.

Следовательно, сумма квадратов отклонений индивидуальных значений признака от произвольной величины С больше суммы квад­ратов их отклонений от своей средней на величину:


(6.8)


На использовании этого свойства базируется расчет центральных моментов, представляющих собой характеристики вариационного ряда при С =х '.

„,1^-^-Л * £/,

где k определяет порядок момента (центральный момент второго порядка пред­ставляет собой дисперсию).

4. Если все осредняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится или увеличится на ту же величину:

При С = 0 получают начальные момента (начальный момент Первого порядка -ередняя арифметическая и тд.).


(6.9)


Так, если все курсы продажи акций увеличить на 100 руб., то сред­ний курс также увеличится на 100 руб.:

5. Если все варианты значений признака уменьшить или увели­чить в А раз, то средняя также соответственно увеличится или умень­шится в А раз:


(6.10)


Предположим, курс продажи в каждом случае возрастет в 1,5 раза. Тогда и средний курс увеличится на 50%.

__1080-1.5-500+1050-1,5'300+1145-1,5-1100_

1900 =1112,9.1,5 =1669,4 руб.

б. Если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не изменится:


(6.11)


Так, в нашем примере удобнее было бы рассчитывать среднюю, предварительно поделив все веса на 100:

_ 10805+1050.3+1145-11 ,,,-.. -х=——————-^——————=1112,9 руб.

Исходя из данного свойства можно заключить, что в случае ра­венства всех весов между собой расчеты по средней арифметической взвешенной и средней арифметической простой приведут к одному и томуже результату.


6.6

ДРУГИЕ ВИДЫ СРЕДНИХ

При расчете статистических показателей помимо средней ариф­метической могут использоваться и другие виды средних. Однако в каждом конкретном случае в зависимости от характера имеющихся данных существует только одно истинное среднее значение показате­ля, являющееся следствием реализации его исходного соотношения.

Средняя гармоническая взвешенная. Рассмотрим вариант, когда известен числитель исходного соотношения средней, но неизвестен его знаменатель (табл. 6.5).

Таблица 6.5

Таблица 7.5 Обеспеченность населения города общей жилой площадью

Алгоритм расчета среднего линейного отклонения следующий:!

1. Найдем середину интервалов (х\) по исходным данным (гр^ фа А) и запишем в таблицу (графа 2).

2. Определим произведения значений середины интервалов (х[) на соответствующие им веса (^) (графа 3). В итоге получим 1 206. Рассчитаем среднюю величину по формуле средней арифметической взвешенной:


3. Для расчета линейного отклонения найдем абсолютные откло­нения середины интервалов, принятых нами в качестве вариантов признака (х,) от средней величины (х) (графа 4).

4. Наконец, вычислим произведения отклонений \х'i-х\ на их веса (Л и подсчитаем сумму их произведений. Она равна 236,6. Результа­ты записываем в графу 5.

Делим эту сумму на сумму весов, чтобы получитьискомую вели­чину 3:

Таково в среднем отклонение вариантов признака от их средней величины. Это отклонение по сравнению со средней величиной при­знака небольшое. Оно отличается от средней на 9,694 кв. м. Это сви­детельствует о том, что данная совокупность в отношении нашего признака однородна, а средняя - типична.

Таким образом, среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности. Од­нако при его исчислении приходится допускать некорректные с точки зрения математики действия, нарушать законы алгебры. Математики и статистики искали иной способ оценки вариации для того, чтобы иметь дело только с положительными величинами. Был найден очень простой выход - возвести все отклонения во вторую степень. Это столь простое решение привело в последующем к большим научным ре­зультатам. Оказалось, что обобщающие показатели вариации, найден­ные с использованием вторых степеней отклонений, обладают заме­чательными свойствами; позднее на их основе были разработаны новые методы исследования, а также новые показатели количествен­ной характеристики большого класса явлений. Полученную меру ва­риации назвали дисперсией и обозначили D или о2.

Дисперсия. Дисперсия представляет собой средний квадрат откло­нений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой дисперсии (формула 7.14) и взвешенной дисперсии (формула 7.15);


(7.14)



(7.15)


Расчет дисперсии может быть упрощен. В случае равных интер­валов в вариационном ряду распределения используется способ от­счета от условного нуля (способ моментов). Для его понимания необ­ходимо знать математические свойства дисперсии:

1. Дисперсия постоянной величины равна нулю.

2. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:


(7.16)


Значит, средний квадрат отклонений можно вычислить не по за­данным значениям признака, а по их отклонениям от какого-то по­стоянного числа.

3. Уменьшение всех значений признака в k раз уменьшает дис­персию в А-2 раз, а среднее квадратическое отклонение - в k раз:


(7.17)


Значит, все значения признака можно разделить на какое-то по­стоянное число (скажем, на величину интервала ряда), исчислить сред­нее квадратическое отклонение, а затем умножить его на постоянное число:


(7.18)


4. Если исчислить средний квадрат отклонений от любой величи­ны Л, в той или иной степени отличающейся от средней арифмети­ческой (х), то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической:


(7.19)


Средний квадрат отклонений при этом будет больше на вполне определенную величину - на квадрат разности средней и этой услов­но взятой величины, т.е. на (х-А)1:

Или


(7.20)


Значит, дисперсия от средней всегда меньше дисперсий, исчис­ленных от любых других величин, т.е. она имеет свойство минималь­ности.

В случае когда А приравнивается нулю и, следовательно, откло­нения не вычисляются, формула принимает такой вид:

или


(7.21)


Значит, средний квадрат отклонений равен среднему квадрату зна­чений признака минус квадрат среднего значения признака.

На приведенных математических свойствах дисперсии основан Метод расчета дисперсии по способу моментов, или способу отсчета от условного нуля, который применялся при исчислении средней ве­личины. Расчет производится по формуле


(7.22)


где * А

ширина интервала;

условный нуль, в качестве которого удобноиспользовать середину интервала, обладающего наибольшей частотой;


_ Дисперсия есть средняя величина квадратов отклонений, а вари-| анты признака выражены в первой степени. ;

Среднее квадратическое отклонение (<т). Среднее квадратичео| кое отклонение равно корню квадратному из дисперсии. Оно может! быть простым (формула 7.23) или взвешенным (формула 7.24).


(7.23)


или


(7.24)1


Среднее квадратическое отклонение, как и среднее линейное от-' клонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (в метрах, тоннах, рублях и т.д.).


Среднее квадратическое отклонение часто используется в каче­стве единицы измерения отклонений от средней арифметической. В зарубежной литературе этот показатель называется нормированным, или стандартизованным, отклонением.

По свойству мажорантности средних величин (см. глава 6) сред­нее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака близко к нормальному или симметричному распределению, то между с и d существует взаимо­связь: ~а = 0,8о или ст = 1,25 ~а .

Среднее квадратическое отклонение играет важную роль в ана­лизе вариационных рядов распределения. В условиях нормального распределения существует следующая взаимосвязь между величиной среднего квадратического отклонения и количеством наблюдений:

• в пределах х ± 1о располагается 0,683, или 68,3% количества наблюдений;

• в пределах х ± 20 - 0,954, или 95,4%;

• в пределах х ± Зо - 0,997, или 99,7% количества наблюдений. В действительности на практике почти не встречаются отклоне­ния, которые превышают ±3ст. Отклонение 3(7 может считаться мак­симально возможным. Это положение называют правилом трех сигм.

Пример. Рассмотрим расчет дисперсии и среднего квадратичес­кого отклонения по данным табл. 7.6 о выпуске промышленной про­дукции фирмами отрасли.

Таблица 7.6

Вычисление о2 и а по несгруппированным данным


Алгоритм расчета следующий:

1. Определим среднюю величину по исходнымданным (графа 1) по формуле средней арифметической простой:

2. Найдем отклонения (^ - х) и запишем их в графе 2. Возведем отклонения во вторую степень и запишем в графе 3. Определим их сумму. Она равна 448.

3. Разделив эту сумму на число единиц совокупности, пол> дисперсию:

•1?> ,

а2»44^^. о

4. Извлечем из дисперсии корень второй степени ^/74,67 = 8,64 ] руб. и получим среднее квадратическое отклонение.

Степень вариации в данной совокупности невелика, таккак сред­няя величина равна 50 млн руб. Это говорит об однородности рас­сматриваемой нами совокупности.

Пример. Рассмотрим вычисление дисперсии и среднего квадра-тического отклонения по данным распределения сотрудников двух фирм по тарифному разряду (табл. 7.7).

Фирма А

Фирма Б

Среднее квадратическое отклонение в фирме Б более чем в два раза превышает среднее квадратическое отклонение фирмы А. До сих пор говорилось о показателях вариации, выраженных в абсолютных


W


величинах. Но для целей сравнения колеблемости различных призна­ков в одной и той же совокупности или же при сравнении колеблемо­сти одного и того же признака в нескольких совокупностях представ­ляют интерес показатели вариации, приведенные в относительных величинах. Базой для сравнения должна служить средняя арифмети­ческая. Эти показатели вычисляются как отношение размаха вариа­ции, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего они выражаются в процентах и определяют не только сравнительную оцен­ку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Разли­чают следующие относительные показатели вариации (V). Коэффициент осцилляции (V.):


(7.25)


Линейный коэффициент вариации (V-\.


1(7.26)


Или

Наиболее часто в практических расчетах применяется показатели относительной вариации - коэффициент вариации. ;

Коэффициент вариации (V ):


(7.27)



Пример. По данным,привешенным в табл. 7.7,рассчитаем коэф­фициенты вариации:

На основе полученных коэффициентов можно сделать вывод,чтопо тарифному разряду совокупности рабочих фирмы А и фирмы Б являются однородными. Однако вариация колеблемости тарифного разряда в фирме Б несколько выше, чем вариация в фирме А.

Характеристика степени вариации ряда может быть определена также по формуле квартального отклонения (0, предложенной анг­лийским биологом и антропологом Ф. Гальтоном:


(7.28)


где б, и б, - соответственно 1 -я и 3-я квартили распределения (см. раздел 7.6).

Эта формула дает абсолютный квартильный показатель вари­ации. В симметричных или умеренно асимметричных распределени­ях 0 = 2/3о. Так как на квартальное отклонение не влияют отклоне­ния всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднено или невозможно. В частности, этот показатель может быть рекомендован для рядов распределения с открытыми интервалами.

В целях сравнения вариации в различных рядах вычисляется от­носительный квартильный показатель вариации по формуле


(7.29)



Или

где Me - медиана ряда распределения.

7.4

ВАРИАЦИИ АЛЬТЕРНАТИВНОГО ПРИЗНАКА. ЭНТРОПИЯ РАСПРЕДЕЛЕНИЯ

В ряде случаев возникает необходимость в измерении дисперсии так называемых альтернативных признаков, тех, которыми облада­ют одни единицы совокупности и не обладают другие. Примером та­ких признаков являются: бракованная продукция, ученая степень пре­подавателя вуза, работа по полученной специальности и т.д. Вариация альтернативного признака количественно проявляется в значении нуля у единицы, которая этим признаком не обладает, или единицы у той, которая данный признак имеет.

Пусть/? - доля единиц в совокупности, обладающих данным при­знаком = min); q - доля единиц, не обладающих данным призна­ком, причем р+ q = 1. Альтернативный признак принимает всего два значения - 0 и 1 с весами соответственно q и р. Исчислим среднее значение альтернативного признака по формуле средней арифмети­ческой:


(7.30)


Дисперсия альтернативного признака определяется по формуле:


(7.31)



Таким образом, дисперсия альтернативного признака равна про­изведению доли на число, дополняющее эту долю до единицы. Ко­рень квадратный из этого показателя, т.е. ^[pq, соответствует сред­нему квадратическому отклонению альтернативного признака. Предельное значение дисперсии альтернативного признака равно 0,25 при/?= 0,5.

Показатели вариации альтернативных признаков широко исполь­зуются в статистике, в частности, при проектировании выбороч­ного наблюдения, обработке данных социологических обследова­ний, статистическом контроле качества продукции, в ряде других случаев.

Пример. В трех партиях готовой продукции, представленной на контроль качества, была обнаружена годная и бракованная продук­ция (табл. 7.8).

Таблица 7.8 Продукция, представленная на контроль качества

Партия   Готовая продукция, шт.   Из них продукция  
годная   бракованная  
  1200 '      
  .'дмй 1000      
  ".»•• 1100      

 

Определим в целом для всех партий следующие показатели:

1) средний процент годной продукции и средний процент брака;

2) дисперсию, среднее квадратическое отклонение, коэффициент вариации годной продукции.

Произведем расчет данных показателей на нашем примере. Средний процент годной продукции в трех партиях равен:


Средний процент бракованной продукции составш»:

/ q = 1-0,8 = 0,2 или 20%.

Дисперсия удельного веса годной продукции:


Среднее квадратическое отклонение удельного веса годной про­дукции;

о=7м=л/^16=0,4.

Коэффициент вариации удельного веса годной продукции в об­щем выпуске продукции:

Обобщенной характеристикой различий внутри рада может служить энтропия распределения. Применительно к статистике энтропия - это мера неопределенности данных наблюдения, которая может иметь раз­личные результаты. Энтропия зависит от числа градаций признака и от вероятности каждой из них. Энтропия показывает, имеется ли законо­мерность в концентрации отдельных градаций у наименьшего числа позиций или, напротив, заполненность распределения одинаковая. При этом сумма вероятностей всех возможных исходов равна единице. Эн­тропия измеряется в битах.

Показатель энтропии Я, представляет собой отрицательную сум­му произведения вероятностей различных значений случайной вели­чины (р) на логарифмы (при основании два) этих вероятностей:


(7.32)


Если все варианты равновероятны, то энтропия максимальна. Если же все варианты,за исключением одного, равны нулю, то энтропия равна нулю.


Энтропияальтернативного признака (я =2) при равновероят­ном распределении (р = 0,5)равна единице:


(7.33)


Пример. Расчет энтропии распределения можно показать на вы­пуске продукции различных сортов на одном из предприятий точного машиностроения (табл. 7.9).

Таблица 7.9 Вероятность выпуска различных сортов продукции

Сорт   1-й   2-й   3-й   Брак   Итого  
Вероятность, p^   0,90   0,04   0,05   0,01   1,00  

 


(7.34)


где р - вероятность любого возможного состояния сложной системы.

Показатель энтропии позволяет также измерять количество информации. Чем больше информации о случайном событии, тем определеннее его состояние. Чем больше вероятность случайного события ^, тем меньше информации несет его осуществление. В слу­чае р^= 1


(7.35)



Следовательно, данное испытание не содержит никакой инфор­мации. Аналогично и при/» =0.

Энтропия распределения интерпретируется как мера рассредото­ченное™ вариантов случайной переменной по ее возможным значени­ям, или как мера неопределенности значения реализации. Неопреде­ленность значений реализации случайной переменной предусматривает наличие некоторого наблюдателя, находящегося в том или ином отно­шении к источнику неопределенности. Очевидно, можно представить ситуацию, когда для двух наблюдений степени неопределенности ре­зультата одного и того же наблюдения со случайными исходами суще­ственно различаются. Например, различны результаты голосования при экспертных опросах для наблюдателя - участника голосования и на­блюдателя, не участвующего в голосовании.

В связи с тем что верхнего предела энтропия распределения не имеет, целесообразно вычислить наряду с абсолютной и относитель­ную величину неопределенности.

Относительная энтропия определяется как отношение ее фак­тической величины к максимальной, т.е.


(7.36)


Это отношение изменяется от 0 до 1 и может быть интерпретиро­вано. Чем меньше относительная энтропия, тем меньше неопреде­ленность и выше однородность.

7.5

ВИДЫ ДИСПЕРСИЙ В СОВОКУПНОСТИ, РАЗДЕЛЕННОЙ НА ГРУППЫ. ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ

Изучая вариацию по всей совокупности в целом и опираясь на общую среднюю в своих расчетах, мы не можем определить влияние отдельных факторов, характеризующих колеблемость индивидуаль­ных значений признака. Это можно сделать при помощи аналитичес­кой группировки, разделив изучаемую совокупность на однородные группы по признаку-фактору. При этом можно определить три пока­зателя колеблемости признака в совокупности: дисперсию общую, межгрупповую и среднюю из внутригрупповых дисперсий.


Общая дисперсия о2 измеряет вариацию признакаво всей сово­купности под влиянием всех факторов, обусловившихэту вариацию:


(7.37)


Межгрупповая дисперсия (52) характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникаю­щие под влиянием признака-фактора, положенного в основание груп­пировки. Она рассчитывается по формуле


(7.38)


где k - число групп;

я - число единиц ву-й группе;

х - частная средняя по j-тл группе;

'X - общая средняя по совокупности единиц.

Внутригрупповая дисперсия (ст2) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факто­ров и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:


(7.39)


По совокупности в целом вариация значений признака подвлия­нием прочих факторов характеризуется средней из внутригрупповых дисперсий2):

24)


(7.40)


Между общей дисперсией о2 0 средней из внутригрупповых дис­персий сигма ср2 и межгрупповой 52 дисперсией существует соотношение, определяемое правилам сложения дисперсий. Согласно этому прави­лу общая дисперсия равна сумме средней из внутригрупповых и меж­групповой дисперсий:


(7.41)


Согласно этому правилу, общая дисперсия, возникающая под дей­ствием всех факторов, равна сумме дисперсий, появляющихся под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или прове­рить правильность расчета третьего вида.

Правило сложения дисперсий позволяет выявить зависимость результата от определяющих факторов с помощью соотношения меж­групповой дисперсии и общей дисперсии. Это соотношение называ­ется эмпирическим коэффициентом детерминации (г|2):


(7.42)


Он показывает, какая доля в общей дисперсии приходится на дис­персию, обусловленную вариацией признака, положенного в основу группировки.

Корень квадратный из эмпирического коэффициента детермина­ции носит название эмпирического корреляционного отношения (Т():


(7.43)



Это отношение характеризует влияние признака, положенного в ос­нование группировки, на вариацию результативного признака. Эмпи­рическое корреляционное отношение изменяется в пределах от 0 до 1. Если Т} = 0, то группировочный признак не оказывает влияния на ре­зультативный. Если т) = 1, то результативный признак изменяется толь­ко в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным зна­чениям.

Пример. Рассмотрим правило сложения дисперсий. Имеются дан­ные об объеме выполненных работ проектао-изыскательными орга­низациями на предприятиях разных форм собственности (табл. 7.10).

Таблица 7.10

Организация   Объем выполненных работ на предприятиях, млн руб.  
государственных   коммерческих  
    3 980  
     
     
     
     
Итого      

 

Алгоритм решения следующий:

1. Определим среднийобъем выполненных работ на предприяти­ях двух форм собственности:

2. Определим средние объемы выполненных работ по предприя­тиям каждой формы собственности:


3. Рассчитаем внутригрупповые и общую дисперсии:

4. Рассчитаем среднюю из внутригрупповых и межгрупповую дис- Ц Персии по данным, представленным в табл. 7.11.

В


Таблица 7.11 Расчет о2 и У по предприятиям двух форм собственности

» Группы предприятий   Численность предприятий п!   Средний объем выполненных работ, млн руб. х!   Дисперсия объема выполненных работ ^  
Государственные предприятия Коммерческие предприятия   S   686 5794   32504 1 598 040  

 

Средняяиз внутригрупповых дисперсий:

межгрупповая дисперсия:


5. Найдем общую дисперсию по правилу сложения дисперсий:

с§=815 264+6 522 916 =7 338180.

Сопоставив межгрупповую дисперсию с общей дисперсией, рас­считаем коэффициент детерминации:




Коэффициент детерминации показывает, что дисперсия объема выполненных работ зависит от формы собственности предприятия на 88,9%. Остальные 11^1% определяются множеством других неуч­тенных факторов.

Извлекая квадратный корень из коэффициента детерминации, определим эмпирическое корреляционное отношение:

Полученное значение эмпирического корреляционного отноше­ния позволяет утверждать, что существует тесная связь между фор­мой собственности предприятия и объемом выполненных проектно-изыскательных работ.

Для проверки существенности связи между группировочным при­знаком и вариацией исследуемого признака часто используется дис­персионное отношение F (критерий Фишера).


(7.44)


где V, и v, - число степеней свободы для сравниваемых дисперсий, при этом

V,=m- I; v^=N-m;

т - число групп, N - число наблюдений.

Расчетное значения критерия Фишера (F ^) сравнивается с кри­тическим (F ), которое определяется по таблице приложения 4 в за­висимости от числа степеней свободы и уровня значимости. Если F>F, наличие связи доказано, так как проверяется нулевая гипо­теза об отсутствии взаимосвязи признаков, т.е. об отсутствии влия­ния группировочного признака на исследуемый признак. В нашем примере F ^=24, а F =10,13 при уровне значимости 0,05, т.е. это го­ворит о наличии связи между объемом выполненных проектно-изыс-кательных работ и формой собственности предприятий.

Правило сложения дисперсий для доли признака. Рассмотрен­ное правило сложения дисперсий распространяется и на дисперсии доли признака, т.е. доли единиц с определенным признаком в сово-


купности, разбитой на группы. При этом изучение вариации проис­ходит непосредственно при вычислении и анализе видов дисперсий для доли признака.

Внутригрупповая дисперсия доли определяется по формуле


(7.45)


где р, - доля изучаемого признака в отдельных группах.

Средняя из внутригрупповых дисперсий имеет следующий вид:









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.