Показатели, позволяющие оценить структурные сдвиги в пространстве и во времени, будут рассмотрены в соответствующей главе.

Продажа акций АО «Дока-хлеб» на торгах фондовой секции ТМБ «Гермес»

Определим по данному дискретному вариационному ряду средний курс продажи акции, используя следующее исходное соотношение:

Чтобы получить общую сумму сделок, необходимо по каждой сделке курс продажи умножить на количество проданных акций и полученные произведения сложить. В конечном итоге результат следующий:

Расчет среднего курса продажи произведен по формуле средней арифметической взвешенной:

В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными (в процентах или долях единицы). Так, в приведенном выше примере количество проданных в ходе каждой сделки акций соответственно составляет 26,3% (0,263), 15,8% (0,158) и 57,9% (0,579) от их общего числа. Тогда с учетом несложного преобразования формулы (6.4) получим:

На практике наиболее часто встречающаяся при расчете средних ошибка заключается в игнорировании весов в тех случаях, когда эти веса в действительности необходимы. Предположим, имеются следующие данные (табл. 6.3).

Заработная плата работников предприятия за май 2002 г.

Можно ли по имеющимся данным определить среднюю заработ* ную плату по предприятию в целом? Можно, но только в том случае, если численность работников в 1 -м и 2-м цехах совпадает. Тогда средняя заработная плата по предприятию в целом составит 4 200 руб. (доказательство этого правила будет приведено ниже). Однако в цехе 1 может быть занято, к примеру, 10 человек, а в цехе 2-100. Поэтому для расчета средней заработной платы потребуется средняя арифметическая взвешенная:

Общий вывод заключается в следующем: использовать среднюю арифметическую невзвешенную можно только тогда, когда точно установлено отсутствие весов или их равенство.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. Рассмотрим следующий пример (табл. 6.4).

Таблица 6.4 Распределение работников предприятия по возрасту

Для определения среднего возраста работника найдем середины возрастных интервалов. При этом величины открытых интервалов (первого и последнего) условно приравниваются к величинам интер-

валов, примыкающих к ним (второго и предпоследнего). Согласно вышеизложенному середины интервалов будут следующими:

Используя среднюю арифметическую взвешенную, определим Средний возраст работника данного предприятия:

х = —————— - —————————————————— = 41 год.

Свойства средней арифметической. Средняя арифметическая обладает некоторыми математическими свойствами, более полно раскрывающими ее сущность и в ряде случаев используемыми при ее расчетах. Рассмотрим эти свойства.

1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты:

Действительно, если мы обратимся к приведенному выше примеру расчета среднего курса продажи акций (см. табл. 6.2), то получим следующее равенство (за счет округления среднего курса правая и левая части равенства в данном случае будут незначительно отличаться):

2. Сумма отклонений индивидуальных значений признака от средней арифметической равна нулю:

Математическое доказательство данного свойства сводится к следующему:

3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем сумма квадратов их отклонений от любой другой произвольной величины С:

=z[(.(,-i)²+2•^,-;c).(;(-C)+(]c-C)²]•Л•= ^(Xi-xf-f^l-dc-CWxi-x)-/, +Кх-0² •fi = =t(x,-x)²•f,+2•(x-C)•0+i(x-C)²•f,.

Следовательно, сумма квадратов отклонений индивидуальных значений признака от произвольной величины С больше суммы квадратов их отклонений от своей средней на величину:

На использовании этого свойства базируется расчет центральных моментов, представляющих собой характеристики вариационного ряда при С =х '.

где k определяет порядок момента (центральный момент второго порядка представляет собой дисперсию).

4. Если все осредняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится или увеличится на ту же величину:

При С = 0 получают начальные момента (начальный момент Первого порядка -ередняя арифметическая и тд.).

Так, если все курсы продажи акций увеличить на 100 руб., то средний курс также увеличится на 100 руб.:

5. Если все варианты значений признака уменьшить или увеличить в А раз, то средняя также соответственно увеличится или уменьшится в А раз:

Предположим, курс продажи в каждом случае возрастет в 1,5 раза. Тогда и средний курс увеличится на 50%.

б. Если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не изменится:

Так, в нашем примере удобнее было бы рассчитывать среднюю, предварительно поделив все веса на 100:

_ 10805+1050.3+1145-11,,,-.. - х=——————-^—————— =1112,9 руб.

Исходя из данного свойства можно заключить, что в случае равенства всех весов между собой расчеты по средней арифметической взвешенной и средней арифметической простой приведут к одному и тому же результату.

При расчете статистических показателей помимо средней арифметической могут использоваться и другие виды средних. Однако в каждом конкретном случае в зависимости от характера имеющихся данных существует только одно истинное среднее значение показателя, являющееся следствием реализации его исходного соотношения.

Средняя гармоническая взвешенная. Рассмотрим вариант, когда известен числитель исходного соотношения средней, но неизвестен его знаменатель (табл. 6.5).

Таблица 7.5 Обеспеченность населения города общей жилой площадью

Алгоритм расчета среднего линейного отклонения следующий:!

1. Найдем середину интервалов (х\) по исходным данным (гр^ фа А) и запишем в таблицу (графа 2).

2. Определим произведения значений середины интервалов (х[) на соответствующие им веса (^) (графа 3). В итоге получим 1 206. Рассчитаем среднюю величину по формуле средней арифметической взвешенной:

3. Для расчета линейного отклонения найдем абсолютные отклонения середины интервалов, принятых нами в качестве вариантов признака (х,) от средней величины (х) (графа 4).

4. Наконец, вычислим произведения отклонений \х'i-х\ на их веса (Л и подсчитаем сумму их произведений. Она равна 236,6. Результаты записываем в графу 5.

Делим эту сумму на сумму весов, чтобы получить искомую величину 3:

Таково в среднем отклонение вариантов признака от их средней величины. Это отклонение по сравнению со средней величиной признака небольшое. Оно отличается от средней на 9,694 кв. м. Это свидетельствует о том, что данная совокупность в отношении нашего признака однородна, а средняя - типична.

Таким образом, среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности. Однако при его исчислении приходится допускать некорректные с точки зрения математики действия, нарушать законы алгебры. Математики и статистики искали иной способ оценки вариации для того, чтобы иметь дело только с положительными величинами. Был найден очень простой выход - возвести все отклонения во вторую степень. Это столь простое решение привело в последующем к большим научным результатам. Оказалось, что обобщающие показатели вариации, найденные с использованием вторых степеней отклонений, обладают замечательными свойствами; позднее на их основе были разработаны новые методы исследования, а также новые показатели количественной характеристики большого класса явлений. Полученную меру вариации назвали дисперсией и обозначили D или о².

Дисперсия. Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам простой дисперсии (формула 7.14) и взвешенной дисперсии (формула 7.15);

Расчет дисперсии может быть упрощен. В случае равных интервалов в вариационном ряду распределения используется способ отсчета от условного нуля (способ моментов). Для его понимания необходимо знать математические свойства дисперсии:

1. Дисперсия постоянной величины равна нулю.

2. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:

Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по их отклонениям от какого-то постоянного числа.

3. Уменьшение всех значений признака в k раз уменьшает дисперсию в А-² раз, а среднее квадратическое отклонение - в k раз:

Значит, все значения признака можно разделить на какое-то постоянное число (скажем, на величину интервала ряда), исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число:

4. Если исчислить средний квадрат отклонений от любой величины Л, в той или иной степени отличающейся от средней арифметической (х), то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической:

Средний квадрат отклонений при этом будет больше на вполне определенную величину - на квадрат разности средней и этой условно взятой величины, т.е. на (х-А)¹:

Значит, дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин, т.е. она имеет свойство минимальности.

В случае когда А приравнивается нулю и, следовательно, отклонения не вычисляются, формула принимает такой вид:

Значит, средний квадрат отклонений равен среднему квадрату значений признака минус квадрат среднего значения признака.

На приведенных математических свойствах дисперсии основан Метод расчета дисперсии по способу моментов, или способу отсчета от условного нуля, который применялся при исчислении средней величины. Расчет производится по формуле

условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;

_ Дисперсия есть средняя величина квадратов отклонений, а вари-| анты признака выражены в первой степени.;

Среднее квадратическое отклонение (<т). Среднее квадратичео| кое отклонение равно корню квадратному из дисперсии. Оно может! быть простым (формула 7.23) или взвешенным (формула 7.24).

Среднее квадратическое отклонение, как и среднее линейное от-' клонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (в метрах, тоннах, рублях и т.д.).

Среднее квадратическое отклонение часто используется в качестве единицы измерения отклонений от средней арифметической. В зарубежной литературе этот показатель называется нормированным, или стандартизованным, отклонением.

По свойству мажорантности средних величин (см. глава 6) среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака близко к нормальному или симметричному распределению, то между с и d существует взаимосвязь: ~а = 0,8о или ст = 1,25 ~а.

Среднее квадратическое отклонение играет важную роль в анализе вариационных рядов распределения. В условиях нормального распределения существует следующая взаимосвязь между величиной среднего квадратического отклонения и количеством наблюдений:

• в пределах х ± 1о располагается 0,683, или 68,3% количества наблюдений;

• в пределах х ± Зо - 0,997, или 99,7% количества наблюдений. В действительности на практике почти не встречаются отклонения, которые превышают ±3ст. Отклонение 3(7 может считаться максимально возможным. Это положение называют правилом трех сигм.

Пример. Рассмотрим расчет дисперсии и среднего квадратического отклонения по данным табл. 7.6 о выпуске промышленной продукции фирмами отрасли.

Вычисление о² и а по несгруппированным данным

1. Определим среднюю величину по исходным данным (графа 1) по формуле средней арифметической простой:

2. Найдем отклонения (^ - х) и запишем их в графе 2. Возведем отклонения во вторую степень и запишем в графе 3. Определим их сумму. Она равна 448.

3. Разделив эту сумму на число единиц совокупности, пол> дисперсию:

4. Извлечем из дисперсии корень второй степени ^/74,67 = 8,64 ] руб. и получим среднее квадратическое отклонение.

Степень вариации в данной совокупности невелика, так как средняя величина равна 50 млн руб. Это говорит об однородности рассматриваемой нами совокупности.

Пример. Рассмотрим вычисление дисперсии и среднего квадра-тического отклонения по данным распределения сотрудников двух фирм по тарифному разряду (табл. 7.7).

Среднее квадратическое отклонение в фирме Б более чем в два раза превышает среднее квадратическое отклонение фирмы А. До сих пор говорилось о показателях вариации, выраженных в абсолютных

величинах. Но для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, приведенные в относительных величинах. Базой для сравнения должна служить средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации (V). Коэффициент осцилляции (V.):

Наиболее часто в практических расчетах применяется показатели относительной вариации - коэффициент вариации.;

Пример. По данным, привешенным в табл. 7.7, рассчитаем коэффициенты вариации:

На основе полученных коэффициентов можно сделать вывод, что по тарифному разряду совокупности рабочих фирмы А и фирмы Б являются однородными. Однако вариация колеблемости тарифного разряда в фирме Б несколько выше, чем вариация в фирме А.

Характеристика степени вариации ряда может быть определена также по формуле квартального отклонения (0, предложенной английским биологом и антропологом Ф. Гальтоном:

где б, и б, - соответственно 1 -я и 3-я квартили распределения (см. раздел 7.6).

Эта формула дает абсолютный квартильный показатель вариации. В симметричных или умеренно асимметричных распределениях 0 = 2/3о. Так как на квартальное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднено или невозможно. В частности, этот показатель может быть рекомендован для рядов распределения с открытыми интервалами.

В целях сравнения вариации в различных рядах вычисляется относительный квартильный показатель вариации по формуле

ВАРИАЦИИ АЛЬТЕРНАТИВНОГО ПРИЗНАКА. ЭНТРОПИЯ РАСПРЕДЕЛЕНИЯ

В ряде случаев возникает необходимость в измерении дисперсии так называемых альтернативных признаков, тех, которыми обладают одни единицы совокупности и не обладают другие. Примером таких признаков являются: бракованная продукция, ученая степень преподавателя вуза, работа по полученной специальности и т.д. Вариация альтернативного признака количественно проявляется в значении нуля у единицы, которая этим признаком не обладает, или единицы у той, которая данный признак имеет.

Пусть/? - доля единиц в совокупности, обладающих данным признаком (р = min); q - доля единиц, не обладающих данным признаком, причем р+ q = 1. Альтернативный признак принимает всего два значения - 0 и 1 с весами соответственно q и р. Исчислим среднее значение альтернативного признака по формуле средней арифметической:

Дисперсия альтернативного признака определяется по формуле:

Таким образом, дисперсия альтернативного признака равна произведению доли на число, дополняющее эту долю до единицы. Корень квадратный из этого показателя, т.е. ^[pq, соответствует среднему квадратическому отклонению альтернативного признака. Предельное значение дисперсии альтернативного признака равно 0,25 при/?= 0,5.

Показатели вариации альтернативных признаков широко используются в статистике, в частности, при проектировании выборочного наблюдения, обработке данных социологических обследований, статистическом контроле качества продукции, в ряде других случаев.

Пример. В трех партиях готовой продукции, представленной на контроль качества, была обнаружена годная и бракованная продукция (табл. 7.8).

Таблица 7.8 Продукция, представленная на контроль качества

Определим в целом для всех партий следующие показатели:

1) средний процент годной продукции и средний процент брака;

2) дисперсию, среднее квадратическое отклонение, коэффициент вариации годной продукции.

Произведем расчет данных показателей на нашем примере. Средний процент годной продукции в трех партиях равен:

Средний процент бракованной продукции составш»:

Среднее квадратическое отклонение удельного веса годной продукции;

Коэффициент вариации удельного веса годной продукции в общем выпуске продукции:

Обобщенной характеристикой различий внутри рада может служить энтропия распределения. Применительно к статистике энтропия - это мера неопределенности данных наблюдения, которая может иметь различные результаты. Энтропия зависит от числа градаций признака и от вероятности каждой из них. Энтропия показывает, имеется ли закономерность в концентрации отдельных градаций у наименьшего числа позиций или, напротив, заполненность распределения одинаковая. При этом сумма вероятностей всех возможных исходов равна единице. Энтропия измеряется в битах.

Показатель энтропии Я, представляет собой отрицательную сумму произведения вероятностей различных значений случайной величины (р) на логарифмы (при основании два) этих вероятностей:

Если все варианты равновероятны, то энтропия максимальна. Если же все варианты, за исключением одного, равны нулю, то энтропия равна нулю.

Энтропия альтернативного признака (я =2) при равновероятном распределении (р = 0,5) равна единице:

Пример. Расчет энтропии распределения можно показать на выпуске продукции различных сортов на одном из предприятий точного машиностроения (табл. 7.9).

Таблица 7.9 Вероятность выпуска различных сортов продукции

где р - вероятность любого возможного состояния сложной системы.

Показатель энтропии позволяет также измерять количество информации. Чем больше информации о случайном событии, тем определеннее его состояние. Чем больше вероятность случайного события ^, тем меньше информации несет его осуществление. В случае р^= 1

Следовательно, данное испытание не содержит никакой информации. Аналогично и при/» =0.

Энтропия распределения интерпретируется как мера рассредоточенное™ вариантов случайной переменной по ее возможным значениям, или как мера неопределенности значения реализации. Неопределенность значений реализации случайной переменной предусматривает наличие некоторого наблюдателя, находящегося в том или ином отношении к источнику неопределенности. Очевидно, можно представить ситуацию, когда для двух наблюдений степени неопределенности результата одного и того же наблюдения со случайными исходами существенно различаются. Например, различны результаты голосования при экспертных опросах для наблюдателя - участника голосования и наблюдателя, не участвующего в голосовании.

В связи с тем что верхнего предела энтропия распределения не имеет, целесообразно вычислить наряду с абсолютной и относительную величину неопределенности.

Относительная энтропия определяется как отношение ее фактической величины к максимальной, т.е.

Это отношение изменяется от 0 до 1 и может быть интерпретировано. Чем меньше относительная энтропия, тем меньше неопределенность и выше однородность.

ВИДЫ ДИСПЕРСИЙ В СОВОКУПНОСТИ, РАЗДЕЛЕННОЙ НА ГРУППЫ. ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ

Изучая вариацию по всей совокупности в целом и опираясь на общую среднюю в своих расчетах, мы не можем определить влияние отдельных факторов, характеризующих колеблемость индивидуальных значений признака. Это можно сделать при помощи аналитической группировки, разделив изучаемую совокупность на однородные группы по признаку-фактору. При этом можно определить три показателя колеблемости признака в совокупности: дисперсию общую, межгрупповую и среднюю из внутригрупповых дисперсий.

Общая дисперсия о² измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

Межгрупповая дисперсия (5²) характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле

Внутригрупповая дисперсия (ст²) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

По совокупности в целом вариация значений признака под влиянием прочих факторов характеризуется средней из внутригрупповых дисперсий (о²):

Между общей дисперсией о²₀ средней из внутригрупповых дисперсий сигма ср² и межгрупповой 5² дисперсией существует соотношение, определяемое правилам сложения дисперсий. Согласно этому правилу общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Согласно этому правилу, общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсий, появляющихся под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида.

Правило сложения дисперсий позволяет выявить зависимость результата от определяющих факторов с помощью соотношения межгрупповой дисперсии и общей дисперсии. Это соотношение называется эмпирическим коэффициентом детерминации (г|²):

Он показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.

Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения (Т():

Это отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если Т} = 0, то группировочный признак не оказывает влияния на результативный. Если т) = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.

Пример. Рассмотрим правило сложения дисперсий. Имеются данные об объеме выполненных работ проектао-изыскательными организациями на предприятиях разных форм собственности (табл. 7.10).

1. Определим средний объем выполненных работ на предприятиях двух форм собственности:

2. Определим средние объемы выполненных работ по предприятиям каждой формы собственности:

3. Рассчитаем внутригрупповые и общую дисперсии:

4. Рассчитаем среднюю из внутригрупповых и межгрупповую дис- Ц Персии по данным, представленным в табл. 7.11.

Таблица 7.11 Расчет о² и У по предприятиям двух форм собственности

5. Найдем общую дисперсию по правилу сложения дисперсий:

Сопоставив межгрупповую дисперсию с общей дисперсией, рассчитаем коэффициент детерминации:

Коэффициент детерминации показывает, что дисперсия объема выполненных работ зависит от формы собственности предприятия на 88,9%. Остальные 11^1% определяются множеством других неучтенных факторов.

Извлекая квадратный корень из коэффициента детерминации, определим эмпирическое корреляционное отношение:

Полученное значение эмпирического корреляционного отношения позволяет утверждать, что существует тесная связь между формой собственности предприятия и объемом выполненных проектно-изыскательных работ.

Для проверки существенности связи между группировочным признаком и вариацией исследуемого признака часто используется дисперсионное отношение F (критерий Фишера).

где V, и v, - число степеней свободы для сравниваемых дисперсий, при этом

Расчетное значения критерия Фишера (F ^) сравнивается с критическим (F), которое определяется по таблице приложения 4 в зависимости от числа степеней свободы и уровня значимости. Если F>F, наличие связи доказано, так как проверяется нулевая гипотеза об отсутствии взаимосвязи признаков, т.е. об отсутствии влияния группировочного признака на исследуемый признак. В нашем примере F ^=24, а F =10,13 при уровне значимости 0,05, т.е. это говорит о наличии связи между объемом выполненных проектно-изыс-кательных работ и формой собственности предприятий.

Правило сложения дисперсий для доли признака. Рассмотренное правило сложения дисперсий распространяется и на дисперсии доли признака, т.е. доли единиц с определенным признаком в сово-

купности, разбитой на группы. При этом изучение вариации происходит непосредственно при вычислении и анализе видов дисперсий для доли признака.

Внутригрупповая дисперсия доли определяется по формуле

где р, - доля изучаемого признака в отдельных группах.

Средняя из внутригрупповых дисперсий имеет следующий вид:

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: