Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Элементы корреляционного и регрессионного анализа





Функциональная, статистическая и корреляционная зависимость.При функциональной зависимости между двумя переменными величинами каждому значению одной из них соответствует единственное значение другой: Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными (например, зависимость скорости свободного падения от высоты и т.п.), так и между случайными величинами (например, зависимость стоимости проданных изделий от их числа и т.п.).

Однако часто приходится иметь дело с более сложной зависимостью, чем функциональная. Такая зависимость возникает, если одна из величин зависит не только от другой, но и от ряда прочих меняющихся факторов, среди которых могут быть и общие факторы для обеих величин.

Так, например, с увеличением высоты дерева увеличивается и его диаметр. Представьте себе ситуацию: в городе разбивают новую аллею, высаживают одинаковые саженцы (по высоте, возрасту и породе дерева). Через несколько лет мы увидим, что деревья разные по высоте, по диаметру ствола. Может оказаться, что более высокие деревья тоньше, чем деревья с меньшей высотой. Это объясняется тем, что толщина дерева зависит не только от высоты, но и от других факторов (от свойств почвы, освещенности, количества влаги и т.д.).

В данном случае имеет место зависимость, когда каждому значению одной переменной соответствует множество возможных значений другой переменной. Такая зависимость называется статистической или вероятностной. В этом случае каждому значению одной переменной соответствует определённое (условное) распределение другой переменной.

Определение. Статистическая зависимость между величинами Х и Y называется корреляционной, если каждому значению одной из них соответствует определённое среднее значение другой.



Статистические связи между переменными изучают методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы зависимости между переменными, оценка функции регрессии, прогноз значений зависимой переменной. Основной задачей корреляционного анализа – выявление связи между случайными переменными и оценка её тесноты.

Линейная парная регрессия. Пусть в результате некоторого опыта получено n пар чисел . Изобразим полученную зависимость графически точками на координатной плоскости (рисунок 2.1). Такое изображение статистической зависимости называется корреляционным полем (или полем корреляции).

Рисунок 2.1.

По виду корреляционного поля можно сделать предположение о характере связи между величинами Хи Y.

Связь между величинами Хи Y называется прямой, если при росте одной величины растёт и вторая. Связь называется обратной, если при росте одной величины другая убывает.

Рисунок 2.1аиллюстрирует наличие тесной стохастической зависимости между переменными (точки близки друг к другу). Если говорить точнее, то связь прямая, близкая к линейной. На рисунке 2.1 б показан случай слабой обратной связи, на рисунке 2.1впредставлена диаграмма квадратичной зависимости, и, наконец, на рисунке 2.1гпредставлена диаграмма рассеяния при отсутствии связи между величинами Хи Y.


 

Рассмотрим в качестве примера зависимость между производительностью труда (Y) и уровнем механизации работ (Х) для 14 промышленных предприятий региона (таблица 2.2).

Таблица 2.2.
Номер предприятия xi, % yi,   Номер предприятия xi, % yi,
 
        Итого

Для предварительного установления зависимости между Y и Х построим корреляционное поле (рисунок 2.2).

Рисунок 2.2

Из рисунка 2.2 видно, что точки корреляционного поля расположены вдоль некоторой прямой, которая называется линией регрессии:

. (2.1)

Для нахождения а и bприменим метод наименьших квадратов, согласно которому неизвестные параметры а и b выбираются таким образом, чтобы сумма квадратов отклонений экспериментальных значений от значений , вычисленных по уравнению регрессии (2.1), была минимальной:

Рисунок 2.2

 

Находим частные производные и приравниваем их нулю:

Вводим обозначения:

, , ,

Тогда получаем систему двух линейных уравнений для нахождения а и b:

(2.2)

Подставляя

(2.3)

из первого уравнения системы в уравнение регрессии, получим , или

. (2.4)

Уравнение (2.4) называется уравнением регрессии Y на Х. Коэффициент ав этом уравнении называется коэффициентом регрессии Y на Х..

Коэффициент регрессии Y на Х показывает, на сколько единиц в среднем изменится переменная Y при увеличении переменной Хна одну единицу.

Решая систему (2.2), найдём

, (2.5)

Для установления тесноты корреляционной связи между величинами Y на Х вычисляют выборочный коэффициент линейной корреляции:

, (2.6)

где – средние квадратичные отклонения и соответственно.

Пределы изменения коэффициента корреляции . Если rблизок к , то связь между исследуемыми величинами близка к линейной. Положительное значение коэффициента корреляции свидетельствует о прямой связи между и , при отрицательном значении связь обратная. Если , то связь между величинами и практически отсутствует.

Квадрат коэффициента линейной корреляции дает коэффициент детерминации , который измеряет долю вариации Y, объясняемую влиянием Х, и наоборот.

Пример 1.6. По данным таблицы 2.2 установить зависимость между производительностью труда (Y) и уровнем механизации работ (Х).

Решение. По виду корреляционного поля (рисунок 2.2) уже установлено, что связь между исследуемыми величинами прямая линейная. Выполним необходимые вычисления:

,

(т/ч),

Уравнение регрессии Y на Х: или

.

Из уравнения регрессии Yна Х (его график показан на рисунке 2.2) следует, что производительность труда в среднем возрастает на 0,5435 т/ч, если коэффициент механизации работ увеличится на один процент.

Для установления тесноты корреляционной связи между величинами Y на Х вычислим коэффициент линейной корреляции по формуле: .

Величина r близка к единице. Следовательно, между величинами Х и Yсуществует прямая линейная корреляционная зависимость. Проверим это при уровне значимости a=0,05.









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.