Тема 10. Корреляционно-регрессионный анализ
Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Тема 10. Корреляционно-регрессионный анализ





10.1. Виды связи и их особенности. Задачи корреляционно-регрессионного анализа

10.2. Парная регрессия. Оценка тесноты корреляционной связи

10.3. Множественная регрессия

10.1. Одной из основных задач статистики является выявление взаимосвязи между изучаемыми социально-экономическими явлениями.

Различают два основных вида связи: функциональную и стохастическую. При функциональной связи, каждому значению признака соответствует одно единственное значение признака . При стохастической связи, каждому значению признака соответствует множество значений признака . Частным случаем стохастической связи является корреляционная связь, при которой, каждому значению признака соответствует одно единственное среднее значение признака . При этом называют факторным признаком, а результативным признаком.

В теории статистики изучаются в основном стохастические и корреляционные зависимости между признаками. Корреляционный анализ предусматривает определение тесноты связи между двумя или более признаками с помощью специальных коэффициентов. Регрессионный анализ позволяет установить зависимость (форму связи) между рассматриваемыми признаками на основе построения регрессионной модели (уравнения регрессии).

В зависимости от количества факторных признаков, учитываемых в регрессионной модели, исследуется однофакторная (парная) или многофакторная (множественная) регрессия.

10.2. Количественной характеристикой корреляционной связи является линия регрессии. Линия регрессии представляет собой функцию, устанавливающую зависимость результативного признака от факторного признака . По форме линия регрессии бывает линейной и нелинейной (криволинейной), а по направлению связи − прямой и обратной. При прямой связи с увеличением значения признака увеличивается значение признака и, наоборот. При обратной связи с увеличением значения признака значение признака уменьшается и, наоборот.



Как и любую функцию, линию регрессии можно представить аналитически, т.е. в виде уравнения. В статистике наиболее часто используется линейная форма представления линии регрессии. Линейное уравнение регрессии при парной корреляции имеет вид:

,

где - теоретическое значение результативного признака;

- значение факторного признака;

, - коэффициенты уравнения регрессии, значения которых определяются по методу наименьших квадратов из системы двух уравнений следующего вида:

.

Коэффициент регрессии определяет, на какую величину изменится значение результативного признака при изменении значения факторного признака на единицу.

Для определения, насколько процентов изменится результативный признак при изменении факторного на 1 %, рассчитывают коэффициент эластичности по формуле:

.

Построив уравнение регрессии, можно для каждого значения факторного признака определить соответствующее ему значение результативного признака .

Для моделирования на основе однофакторной модели (уравнения регрессии), необходимо проверить насколько точно она отражает линейную зависимость результативного признака от факторного признака , т.е. определить тесноту линейной связи между признаками.

Для определения тесноты связи между признаками необходимо рассчитать ряд показателей, одним из которых является коэффициент детерминации. Коэффициент детерминации рассчитывается по формуле:

,

где - теоретическая дисперсия;

- эмпирическая дисперсия, т.е. дисперсия признака полученного экспериментальным (опытным) путем.

Коэффициент детерминации принимает значения в интервале от 0 до 1. Чем ближе значение коэффициента детерминации к единице, тем более точно построенное уравнение регрессии описывает линейную корреляционную связь между признаками, и, наоборот, чем ближе значение коэффициента детерминации к нулю, тем менее точно уравнение регрессии описывает линейную корреляционную связь. Коэффициент детерминации, принимающий значение равное нулю, свидетельствует о полном отсутствии линейной корреляционной зависимости между признаками. Коэффициент детерминации, принимающий значение равное единице, соответствует ситуации, при которой наблюдается функциональная линейная зависимость между признаками.

Тесноту линейной связи между признаками можно проверить, рассчитав линейный коэффициент корреляции по формуле:

или ,

где , - среднее квадратическое отклонение соответственно признаков и .

Линейный коэффициент корреляции принимает значение в интервале от -1 до +1 и, в отличие от коэффициента детерминации, характеризует не только тесноту линейной связи между признаками, но и ее направление. Если значение коэффициента положительное, то связь прямая, а если − отрицательное, то связь обратная. Линейный коэффициент корреляции равный нулю характеризует ситуацию, при которой полностью отсутствует линейная связь между признаками, а равный по модулю единице соответствует функциональной линейной связи признаков.

Пример 10.1. По данным о среднегодовой стоимости основных средств и объеме валовой продукции, построить уравнение регрессии и рассчитать показатели, характеризующие тесноту связи.

Среднегодовая стоимость основных средств, млн.руб. Объем валовой продукции, млн.руб.

Решение.

Сначала необходимо выделить факторный и результативный признаки. В рассматриваемом примере факторным признаком будет «Среднегодовая стоимость основных средств» , а результативным – «Объем валовой продукции» .

Для построения уравнения регрессии заполняется вспомогательная таблица:

194,35 250,05 305,75 361,45 417,15 472,85 528,55 584,25 639,95 695,65

Для однофакторной модели уравнение регрессии имеет вид:

.

Коэффициенты регрессии и определяются из системы уравнений:

.

Тогда .

Используя полученное уравнение регрессии, находятся теоретические значения результативного признака (последний столбец таблицы).

Определяется коэффициент эластичности:

.

Для выявления тесноты линейной связи между результативным и факторным признаками рассчитываются следующие показатели:

- коэффициент детерминации:

Учитывая, что , а .

Получаем:

,

.

Тогда:

;

- линейный коэффициент корреляции:

Учитывая, что , а .

Получаем:

.

Тогда:

или

.

10.3. При изучении различных социально-экономических явлений, как правило, на результативный признак оказывает влияние ни один фактор, а множество факторных признаков . В этом случае наблюдается множественная регрессия. Для ее аналитического описания используется модель множественной регрессии. В общем виде линейное уравнение множественной регрессии можно записать:

,

где - теоретическое значение результативного признака;

, ,..., - набор значений факторных признаков;

, , ,..., - коэффициенты уравнения регрессии, значения которых определяются по методу наименьших квадратов из системы, включающей уравнение, следующего вида:

.

Коэффициент регрессии определяет, на какую величину изменится значение результативного признака при изменении значения факторного признака на единицу при условии, что все другие факторные признаки не изменяются.

Построив уравнение регрессии, можно для любого набора значений факторных признаков определить соответствующее им значение результативного признака .

Для моделирования на основе многофакторной модели (уравнения множественной регрессии), необходимо проверить, насколько точно она отражает линейную зависимость результативного признака от факторных признаков , т.е. определить тесноту линейной связи между признаками.

Для определения тесноты связи между признаками необходимо рассчитать ряд показателей, одним из которых является коэффициент детерминации . Коэффициент детерминации рассчитывается по формуле:

,

где - теоретическая дисперсия;

- эмпирическая дисперсия, т.е. дисперсия признака полученного экспериментальным (опытным) путем.

Коэффициент детерминации принимает значения от 0 до 1. Чем ближе значение коэффициента детерминации к единице, тем более точно построенное уравнение регрессии описывает линейную корреляционную связь между признаками и, наоборот, чем ближе значение коэффициента детерминации к нулю, тем менее точно уравнение регрессии описывает линейную корреляционную связь. Коэффициент детерминации, принимающий значение равное нулю, свидетельствует о полном отсутствии линейной корреляционной зависимости между признаками. Если коэффициент детерминации принимает значение равное единице, то наблюдается функциональная линейная зависимость между признаками.

Тесноту линейной связи между признаками можно проверить, рассчитав множественный коэффициент корреляции. Для двухфакторной модели множественный коэффициент корреляции определяется по формуле:

,

где - парные коэффициенты корреляции. Например, определяется по одной из двух формул:

или ,[*]

где , - среднее квадратическое отклонение соответственно результативного признака и факторного признака ;

- коэффициент регрессии для однофакторной модели, в которой, - факторный признак, а - результативный признак.

Наряду с множественным коэффициентом корреляции определяются частные коэффициенты корреляции. Для двухфакторной модели частных коэффициентов корреляции будет два, и они рассчитываются по формулам:

, .

Пример 10.2. Взаимосвязь между среднегодовой стоимостью основных средств, относительным уровнем затрат на реализацию продукции и стоимостью реализованной продукции характеризуется следующими данными:

Номер предприятия Среднегодовая стоимость основных средств, млн.руб. Уровень затрат на реализацию, % Объем реализованной продукции, млн.руб.

Построить уравнение регрессии, рассчитать показатели, характеризующие тесноту связи.

Решение.

Сначала необходимо выделить факторные и результативный признаки. В рассматриваемом примере факторными признаками будут «Среднегодовая стоимость основных средств» и «Уровень затрат на реализацию» , а результативным – «Объем реализованной продукции» .

Для построения уравнения регрессии заполняется вспомогательная таблица:

№ п/п
202,01 202,836 256,236 281,284 303,854 275,502 328,902 356,428 353,124 379,824
 

Для двухфакторной модели уравнение регрессии имеет вид:

.

Коэффициенты регрессии , , определяются из системы уравнений:

,

,

.

Тогда .

Используя полученное уравнение регрессии, находятся теоретические значения результативного признака (последний столбец таблицы).

Для выявления тесноты линейной связи между результативным и факторными признаками, рассчитываются следующие показатели:

- коэффициент детерминации:

Учитывая, что , а .

Получаем:

,

.

Тогда:

;

- множественный коэффициент корреляции:

Сначала определяются парные коэффициенты корреляции , , , учитывая, что , а и .

Получаем:

.

.

Тогда:

,

,

.

Парные коэффициенты корреляции также можно определить, используя значение из построенной однофакторной модели, по формуле:

, , ,

.

, , ,

.

, , ,

.

;

- частные коэффициенты корреляции:

,

.


[*]Примечание:

- вывод первой формулы:

;

- вывод второй формулы:

,

так как , то , а ,

где - коэффициент регрессии для однофакторной модели, в которой - результативный признак, а - факторный признак.









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.