|
Элементы корреляционного и регрессионного анализа ⇐ ПредыдущаяСтр 5 из 5 Функциональная, статистическая и корреляционная зависимость. При функциональной зависимости между двумя переменными величинами каждому значению одной из них соответствует единственное значение другой: Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными (например, зависимость скорости свободного падения от высоты и т.п.), так и между случайными величинами (например, зависимость стоимости проданных изделий от их числа и т.п.). Однако часто приходится иметь дело с более сложной зависимостью, чем функциональная. Такая зависимость возникает, если одна из величин зависит не только от другой, но и от ряда прочих меняющихся факторов, среди которых могут быть и общие факторы для обеих величин. Так, например, с увеличением высоты дерева увеличивается и его диаметр. Представьте себе ситуацию: в городе разбивают новую аллею, высаживают одинаковые саженцы (по высоте, возрасту и породе дерева). Через несколько лет мы увидим, что деревья разные по высоте, по диаметру ствола. Может оказаться, что более высокие деревья тоньше, чем деревья с меньшей высотой. Это объясняется тем, что толщина дерева зависит не только от высоты, но и от других факторов (от свойств почвы, освещенности, количества влаги и т.д.). В данном случае имеет место зависимость, когда каждому значению одной переменной соответствует множество возможных значений другой переменной. Такая зависимость называется статистической или вероятностной. В этом случае каждому значению одной переменной соответствует определённое (условное) распределение другой переменной. Определение. Статистическая зависимость между величинами Х и Y называется корреляционной, если каждому значению одной из них соответствует определённое среднее значение другой. Статистические связи между переменными изучают методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы зависимости между переменными, оценка функции регрессии, прогноз значений зависимой переменной. Основной задачей корреляционного анализа – выявление связи между случайными переменными и оценка её тесноты. Линейная парная регрессия. Пусть в результате некоторого опыта получено n пар чисел . Изобразим полученную зависимость графически точками на координатной плоскости (рисунок 2.1). Такое изображение статистической зависимости называется корреляционным полем (или полем корреляции).
Рисунок 2.1. По виду корреляционного поля можно сделать предположение о характере связи между величинами Х и Y. Связь между величинами Х и Y называется прямой, если при росте одной величины растёт и вторая. Связь называется обратной, если при росте одной величины другая убывает. Рисунок 2.1 а иллюстрирует наличие тесной стохастической зависимости между переменными (точки близки друг к другу). Если говорить точнее, то связь прямая, близкая к линейной. На рисунке 2.1 б показан случай слабой обратной связи, на рисунке 2.1 в представлена диаграмма квадратичной зависимости, и, наконец, на рисунке 2.1 г представлена диаграмма рассеяния при отсутствии связи между величинами Х и Y.
Рассмотрим в качестве примера зависимость между производительностью труда (Y) и уровнем механизации работ (Х) для 14 промышленных предприятий региона (таблица 2.2).
Для предварительного установления зависимости между Y и Х построим корреляционное поле (рисунок 2.2). Рисунок 2.2 Из рисунка 2.2 видно, что точки корреляционного поля расположены вдоль некоторой прямой, которая называется линией регрессии: . (2.1) Для нахождения а и b применим метод наименьших квадратов, согласно которому неизвестные параметры а и b выбираются таким образом, чтобы сумма квадратов отклонений экспериментальных значений от значений , вычисленных по уравнению регрессии (2.1), была минимальной:
Находим частные производные и приравниваем их нулю: Вводим обозначения: , , , Тогда получаем систему двух линейных уравнений для нахождения а и b: (2.2) Подставляя (2.3) из первого уравнения системы в уравнение регрессии, получим , или . (2.4) Уравнение (2.4) называется уравнением регрессии Y на Х. Коэффициент а в этом уравнении называется коэффициентом регрессии Y на Х.. Коэффициент регрессии Y на Х показывает, на сколько единиц в среднем изменится переменная Y при увеличении переменной Х на одну единицу. Решая систему (2.2), найдём , (2.5) Для установления тесноты корреляционной связи между величинами Y на Х вычисляют выборочный коэффициент линейной корреляции: , (2.6) где – средние квадратичные отклонения и соответственно. Пределы изменения коэффициента корреляции . Если r близок к , то связь между исследуемыми величинами близка к линейной. Положительное значение коэффициента корреляции свидетельствует о прямой связи между и , при отрицательном значении связь обратная. Если , то связь между величинами и практически отсутствует. Квадрат коэффициента линейной корреляции дает коэффициент детерминации , который измеряет долю вариации Y, объясняемую влиянием Х, и наоборот. Пример 1.6. По данным таблицы 2.2 установить зависимость между производительностью труда (Y) и уровнем механизации работ (Х). Решение. По виду корреляционного поля (рисунок 2.2) уже установлено, что связь между исследуемыми величинами прямая линейная. Выполним необходимые вычисления: , (т/ч), Уравнение регрессии Y на Х: или . Из уравнения регрессии Y на Х (его график показан на рисунке 2.2) следует, что производительность труда в среднем возрастает на 0,5435 т/ч, если коэффициент механизации работ увеличится на один процент. Для установления тесноты корреляционной связи между величинами Y на Х вычислим коэффициент линейной корреляции по формуле: .
Величина r близка к единице. Следовательно, между величинами Х и Y существует прямая линейная корреляционная зависимость. Проверим это при уровне значимости a=0,05. ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования... Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)... Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|