Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Тема 2: Коэффициент корреляции





Коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами и и он вычисляется по формуле:

.

Связь тем теснее, чем ближе к единице (). Применяется таблица Чеддока для характеристики тесноты связи между случайными величинами и :

 

Диапазон измерения выборочного Характер тесноты
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99 слабая умеренная заметная высокая линейная

 

Если , то при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если , то при возрастании одной случайной величины другая имеет тенденцию в среднем убывать.

Если , то линейная корреляционная связь отсутствует, и случайные величины называются некоррелированными. Выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессии . Знак коэффициента корреляции совпадает со знаком коэффициентов регрессий.

Чтобы сделать обоснованные выводы о тесноте зависимости между случайными величинами и по опытным данным, нужно установить значимость коэффициента корреляции, т. е. проверить нулевую гипотезу о том, что . Поиск критических значений осуществляется с помощью t-критерия Стьюдента.

По опытным данным вычисляют критерий проверки

. [3, стр.237]

При заданном уровне значимости и числу степеней свободы находят критическое значение для двусторонней критической области по таблице Стьюдента.

Если , то выдвинутую гипотезу принимают, т. е. выборочный коэффициент незначим, а случайные величины и некоррелированные.

Если - гипотезу отвергают, т. е. выборочный коэффициент корреляции значимо отличается от нуля, а случайные величины коррелированны.

Для предыдущего примера определим тесноту связи и вычислим коэффициент корреляции, для чего используем расчетную таблицу.

 

Таким образом можно сделать вывод что связь между заработной платой и текучестью раб силы очень тесная и обратная, т.е. полученный коэффициент корреляции отрицательный, это говорит о том, что чем меньше заработная плата () тем больше увольнений.

Рассчитаем уровень значимости коэффициента корреляции с помощью t-критерия Стьюдента.

По таблице 16 приложения 1 для t-критерия Стьюдента находим критические значения число степеней свободы ; [3, стр. 492]

Строим ось значимости

 

 


Величина попала в зону значимости, поэтому принимается гипотеза , т.е. коэффициент корреляции значимо отличается от нуля. Можно сделать вывод о том, что чем меньше заработная плата, тем больше увольнений рабочих.

Коэффициент детерминации

Число называется коэффициентом детерминации Y на X. Он показывает, какая часть изменения величины Y может быть объяснена изменением величины X.

Коэффициенты детерминации может принимать значения от 0 до 1. Чем больше этот показатель, тем больше влияние изучаемого фактора на дисперсию зависимой переменной.

Выясним, какая часть вариации у обусловлена корреляцией х. Вычислим коэффициент детерминации т.е. вариация текучести рабочей силы () на 92% обусловлена вариацией заработной платы ().

Тема 3: Линейная многофакторная регрессионная модель

Постановка задачи

Исследовать зависимость одной зависимой переменной (Y) от нескольких объясняющих переменных (Х , Х ,...,Х ) в условиях конкретного места и конкретного времени.

Эту задачу можно решить с помощью множественного или многофакторного регрессионного анализа.

Уравнение линейной множественной регрессии записывается в виде

Y = а + а X X +…+ а X .

Объясняющие переменные Х , Х ,...,Х оказывают совместное одновременное влияние на зависимую переменную У. Так как всех причин влияющих на результативный показатель (У) охватить нельзя, (ограничившись, только важными объясняющими переменными), то в выражение функции регрессии вводят возмущающую переменную, дающую суммарный эффект от воздействия всех неучтенных факторов и случайностей, тогда эмпирические значения У можно представить

У= Y +U.

Рассмотрим функцию линейной множественной регрессии с двумя объясняющими переменными

Y= а + а X X .

Исходные данные запишем в матричном виде

У= , Х= .

Задача состоит в оценке параметров а , а регрессии по результатам выборочных наблюдений над переменными, включенными в анализ. Поставим условие, согласно которому регрессия должна по возможности хорошо согласовываться с эмпирическими данными. Поэтому выдвигаем требование, по которому сумма квадратов отклонений всех наблюдаемых значений зависимой переменной от значений, вычисленных по уравнению регрессии (т.е. сумма квадратов остатков) должна быть минимальной.

S (а , а ) = = min.

Находим частные производные по а , а и приравниваем к нулю. Т. о. будет получена стандартная форма системы нормальных уравнений:

= а n + a x + a x

x = а x + a x + a x x

 

x = а x + a x x +a x

Коэффициенты системы нормальных уравнений перед переменными а , а представляют собой XX .Найдем произведение двух матриц Х и Х

 

Х = X =

X X= .

Найдем произведение X У= .

Т.о. систему нормальных уравнений можно записать

X X = X У

Если матрица X X обратима, то, умножив слева на (X X) получим = (X X) (X У).

 

Вычислив X X, (X X) ,(X У), (X X) (X У), найдем значения а , а .

Выражение X X можно записать для любого числа объясняющих переменных.







ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.