|
Элементы корреляционного и регрессионного анализа ⇐ ПредыдущаяСтр 5 из 5 Функциональная, статистическая и корреляционная зависимость. При функциональной зависимости между двумя переменными величинами каждому значению одной из них соответствует единственное значение другой: Однако часто приходится иметь дело с более сложной зависимостью, чем функциональная. Такая зависимость возникает, если одна из величин зависит не только от другой, но и от ряда прочих меняющихся факторов, среди которых могут быть и общие факторы для обеих величин. Так, например, с увеличением высоты дерева увеличивается и его диаметр. Представьте себе ситуацию: в городе разбивают новую аллею, высаживают одинаковые саженцы (по высоте, возрасту и породе дерева). Через несколько лет мы увидим, что деревья разные по высоте, по диаметру ствола. Может оказаться, что более высокие деревья тоньше, чем деревья с меньшей высотой. Это объясняется тем, что толщина дерева зависит не только от высоты, но и от других факторов (от свойств почвы, освещенности, количества влаги и т.д.). В данном случае имеет место зависимость, когда каждому значению одной переменной соответствует множество возможных значений другой переменной. Такая зависимость называется статистической или вероятностной. В этом случае каждому значению одной переменной соответствует определённое (условное) распределение другой переменной. Определение. Статистическая зависимость между величинами Х и Y называется корреляционной, если каждому значению одной из них соответствует определённое среднее значение другой. Статистические связи между переменными изучают методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы зависимости между переменными, оценка функции регрессии, прогноз значений зависимой переменной. Основной задачей корреляционного анализа – выявление связи между случайными переменными и оценка её тесноты. Линейная парная регрессия. Пусть в результате некоторого опыта получено n пар чисел
Рисунок 2.1. По виду корреляционного поля можно сделать предположение о характере связи между величинами Х и Y. Связь между величинами Х и Y называется прямой, если при росте одной величины растёт и вторая. Связь называется обратной, если при росте одной величины другая убывает. Рисунок 2.1 а иллюстрирует наличие тесной стохастической зависимости между переменными (точки близки друг к другу). Если говорить точнее, то связь прямая, близкая к линейной. На рисунке 2.1 б показан случай слабой обратной связи, на рисунке 2.1 в представлена диаграмма квадратичной зависимости, и, наконец, на рисунке 2.1 г представлена диаграмма рассеяния при отсутствии связи между величинами Х и Y.
Рассмотрим в качестве примера зависимость между производительностью труда (Y) и уровнем механизации работ (Х) для 14 промышленных предприятий региона (таблица 2.2).
Для предварительного установления зависимости между Y и Х построим корреляционное поле (рисунок 2.2). Рисунок 2.2 Из рисунка 2.2 видно, что точки корреляционного поля расположены вдоль некоторой прямой, которая называется линией регрессии:
Для нахождения а и b применим метод наименьших квадратов, согласно которому неизвестные параметры а и b выбираются таким образом, чтобы сумма квадратов отклонений
Находим частные производные и приравниваем их нулю: Вводим обозначения:
Тогда получаем систему двух линейных уравнений для нахождения а и b:
Подставляя
из первого уравнения системы в уравнение регрессии, получим
Уравнение (2.4) называется уравнением регрессии Y на Х. Коэффициент а в этом уравнении называется коэффициентом регрессии Y на Х.. Коэффициент регрессии Y на Х показывает, на сколько единиц в среднем изменится переменная Y при увеличении переменной Х на одну единицу. Решая систему (2.2), найдём
Для установления тесноты корреляционной связи между величинами Y на Х вычисляют выборочный коэффициент линейной корреляции:
где Пределы изменения коэффициента корреляции Квадрат коэффициента линейной корреляции дает коэффициент детерминации Пример 1.6. По данным таблицы 2.2 установить зависимость между производительностью труда (Y) и уровнем механизации работ (Х). Решение. По виду корреляционного поля (рисунок 2.2) уже установлено, что связь между исследуемыми величинами прямая линейная. Выполним необходимые вычисления:
Уравнение регрессии Y на Х:
Из уравнения регрессии Y на Х (его график показан на рисунке 2.2) следует, что производительность труда в среднем возрастает на 0,5435 т/ч, если коэффициент механизации работ увеличится на один процент. Для установления тесноты корреляционной связи между величинами Y на Х вычислим коэффициент линейной корреляции по формуле:
Величина r близка к единице. Следовательно, между величинами Х и Y существует прямая линейная корреляционная зависимость. Проверим это при уровне значимости a=0,05. ![]() ![]() Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)... ![]() Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право... ![]() ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между... ![]() Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|