Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ИДЕИ МЕТОДА





Исходным положением линейного МРА является возможность представ­ления значений «зависимой» переменной У через значения «независимых» переменных хь х2,..., хР в виде линейного уравнения:

У= Ь + Ьххх + Ь2х2 +... +Ьрхр + е,

где Ъ — свободный член (1п1егсер1), Ь,,..., ЬР — Ь — коэффициенты регрессии

(ШзШпйагсНгей Сое/раеМз), е — ошибка оценки (КезШиаI). Коэффициенты рег­рессии вычисляются методом наименьших квадратов при решении системы из линейных уравнений, с минимизацией ошибки е.

После вычисления регрессионных коэффициентов по значениям незави­симых переменных для каждого из объектов могут быть вычислены оценки зависимой переменной У(РгесИс(ес1 Уа1иез)\

У= Ь + Ьххх + Ь2х2 +...+ЬРхР. (15.2)

Сопоставление значений зависимой переменной У1 с их оценками У( по вы­борке испытуемых, для которых значения У1 известны, называется анализом остатков или ошибок (гезШиа1 апа/узи). Он позволяет оценить возможные по­грешности предсказания. Значения оценок У( могут быть вычислены и для испы­туемых, истинные значения зависимой переменной для которых неизвестны.

Далее можно вычислить коэффициент корреляции Пирсона между извест­ными значениями «зависимой» переменной и ее оценками. Это один из спо­собов получения коэффициента множественной корреляции (КМК) между «зависимой» и «независимыми» переменными. Коэффициент множественной корреляции — это мера линейной связи одной переменной с множеством дру­гих переменных; принимает положительные значения от 0 (отсутствие связи) до 1 (строгая прямая связь). КМК наряду с разностями между исходными и оцененными значениями «зависимой» переменной (ошибки е) — основные показатели качества модели множественной регрессии.

Если «зависимая» и «независимые» переменные представлены в ^значе­ниях, то уравнение регрессии принимает вид:

Гг1х, + р2х2+... +$рХр+е, (15.3)

где Р/,— стандартные коэффициенты регрессии, или р-коэффициенты (8Шпйагй1гей Сое$1аеМ5).

Стандартные коэффициенты регрессии связаны с исходными корреляци­ями следующим уравнением (в матричной форме):

В=К~[17]А, (15.4)

где В — вектор-столбец стандартных коэффициентов регрессии, К~{ — мат­рица, обратная корреляционной матрице «независимых» переменных, А — вектор-столбец корреляций «независимых» переменных с «зависимой» пере­менной. На практике регрессионный анализ начинается именно с вычисле­ния стандартных коэффициентов регрессии.

Напомним, что в случае двумерной регрессии — при наличии всего одной независимой переменной, уравнение 15.3 имеет вид:

V- = г •х

^ I Ху I '

то есть стандартный коэффициент регрессии равен коэффициенту корреля­ции зависимой и независимой переменных. При наличии двух и более неза­висимых переменных:

1Рх1 < К\

и р-коэффициент зависит не только от корреляции данной независимой и зависимой переменных, но и от того, коррелирует ли эта независимая пе­ременная с другими независимыми переменными. Знак р-коэффициента соответствует знаку коэффициента корреляции данной «независимой» и «за­висимой» переменной. Абсолютная величина Р-коэффициента является максимальной — равна коэффициенту корреляции с зависимой переменной, если данная независимая переменная не коррелирует ни с одной из других независимых переменных. Чем сильнее данная независимая переменная свя­зана с другими независимыми переменными, тем меньше р-коэффициент.

Произведение коэффициента р, на коэффициент корреляции г этой пе­ременной с «зависимой» переменной — это вклад данной переменной в дис­персию «зависимой» переменной. Ясно, что вклад переменной выше, если ее корреляция с зависимой переменной выше, а с другими независимыми пере­менными — ниже. Поэтому ценность независимой переменной для множе­ственной регрессии определяется не только ее корреляцией с зависимой пе­ременной (как в двумерной регрессии), но и ее «уникальностью» — слабой связью с другими независимыми переменными.

Если «зависимая» переменная представлена в г-значениях (дисперсия рав­на 1), то эта единичная дисперсия «зависимой» переменной Бу может быть выражена формулой:

Часть дисперсии «зависимой» переменной, обусловленная влиянием «не­зависимых» переменных, — это коэффициент множественной детерминации (КМД), который равен коэффициенту множественной корреляции в квадра­те или К1:

р

1СМД = 2 = = 1- А-

Соответственно, второй способ вычленить КМК:


 

Интерпретация КМД очевидна: это та часть дисперсии «зависимой» пере­менной, которая определяется «независимыми» переменными. Следователь­но, (1 - КМД) — это дисперсия ошибки оценки. Например, если КМК = 0,8, то КМД = (КМК)2 = 0,64. Это означает, что 64% дисперсии «зависимой» пе­ременной определяется исходными переменными, а 36% ее дисперсии отно­сится к ошибке оценки.

Таким образом, основной показатель МРА — коэффициент множественной корреляции (К), который, подобно парному коэффициенту корреляции Пирсо­на, является мерой линейной взаимосвязи одной переменной с совокупностью других переменных. КМК «зависимой» переменной с набором «независимых» переменных, как и КМД, принимает только положительные значения, изме­няясь в пределах от 0 до 1. Статистическая значимость КМК определяется по критерию /^-Фишера для соответствующих степеней свободы.

Таким образом, основными целями МРА являются:

1. Определение того, в какой мере «зависимая» переменная связана с со­вокупностью «независимых» переменных, какова статистическая значимость этой взаимосвязи. Показатель — коэффициент множественной корреляции (КМК) и его статистическая значимость по критерию ^-Фишера.

2. Определение существенности вклада каждой «независимой» перемен­ной в оценку «зависимой» переменной, отсев несущественных для предска­зания «независимых» переменных. Показатели — регрессионные коэффици­енты их статистическая значимость по критерию /-Стыодента.

3. Анализ точности предсказания и вероятных ошибок оценки «зависи­мой» переменной. Показатель — квадрат КМК, интерпретируемый как доля дисперсии «зависимой» переменной, объясняемая совокупностью «незави­симых» переменных. Вероятные ошибки предсказания анализируются по рас­хождению (разности) действительных значений «зависимой» переменной и оцененных при помощи модели МРА.

4. Оценка (предсказание) неизвестных значений «зависимой» переменной по известным значениям «независимых» переменных. Осуществляется по вычисленным параметрам множественной регрессии.







Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.