Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Оценка точности линейного множественного регрессионного анализа





Результаты различных выборок имеют различное рассеяние. Поэтому может случится, что построенная регрессионная зависимость одного итого же смысла по данным двух выборок из одной и той же генеральной совокупности приведет к различным уравнениям. Степень соответствия уравнений опытным данным может быть различна, поэтому для оценки степени соответствия регрессии имеющимся эмпирическим данным можно выбрать коэффициент детерминации. Коэффициент детерминации отражает, в какой мере функция регрессии определяется объясняющими переменными, содержащимися в ней.

Коэффициент множественной детерминации В - показывает какая часть общей дисперсии может быть объяснена зависимостью переменной Y от объясняющих переменных х ,…,х .

В = .

Свойства коэффициента множественной детерминации

1. 1. 0 В 1

2. 2. Если В = 1, то y = у .

3. 3. Если В = 0, то y = отсутствует линейная зависимость.


Проверка значимости коэффициента множественной детерминации

При выполнении процедуры (проверки значимости коэффициента детерминации) выдвигается нулевая гипотеза H и альтернативная H .

H : существенного различия между выборочным коэффициентом детерминации и коэффициентом детерминации генеральной совокупности B=0 нет.

Эта гипотеза равносильна тому, что

a = a = a =…= a =0,

т.е. ни одна из объясняющих переменных, включенных в регрессию, не оказывает существенного влияния на зависимую переменную.

H : выборочный коэффициент детерминации существенно больше коэффициента детерминации генеральной совокупности B=0. Гипотеза H означает, что, по крайней мере, одна из m объясняющих переменных, включенных в регрессию, оказывает существенное влияние на переменную Y.

Оценка значимости коэффициента множественной детерминации производится с помощью F статистики

 

F= (1)

Которая имеет F- распределения Фишера с f =m и f =n-m-1 степенями свободы, где n – число наблюдений, m-количество объясняющих переменных включенных в модель. Вычисленное значение F статистики (1) по эмпирическим данным сравнивается с табличным F при заданном уровне значимости =0.05 или =0.01и соответствующем числе степеней свободы.

Если F F то вычисленный коэффициент детерминации значимо отличается от нуля. Этот вывод обеспечивается с вероятностью 1- .

Рассмотрим пример

1. Построить зависимость жизненной ёмкости лёгких в литрах (у) от роста в метрах (х) и возраста в годах (z) для группы мужчин:

  5,2 1,80  
  5,4 1,75  
  4,9 1,78  
  5,1 1,72  
  4,7 1,76  
  4,6 1,74  
  5,2 1,85  
  5,5 1,82  
  4,8 1,74  
  4,5 1,70  
49,9 17,66  

 

2. Построить регрессионную модель для предсказания значения жизненной ёмкости лёгких для мужчины возраста 20 лет и роста 180 сантиметров.

Ёмкость лёгких в литрах - , рост в метрах - и возраст в годах - для группы из 10-ти мужчин.

Линейная регрессия выражается уравнением с двумя независимыми переменными величинами и и имеет вид

, где - свободный член, и - параметры уравнения.

Уравнение может решаться относительно переменной и .

;

,

Для определения коэффициентов , , уравнения запишем стандартную систему нормальных уравнений и составим расчётную таблицу.

  5,2 1,80   27,04 3,24   9,36 98,8 34,2
  5,4 1,75   29,16 3,0625   9,45 129,6  
  4,9 1,78   24,01 3,1684   8,722 107,8 39,16
  5,1 1,72   26,01 2,9584   8,772   34,4
  4,7 1,76   22,06 3,0976   8,272 89,3 33,44
  4,6 1,74   21,16 3,0276   8,004 82,8 31,32
  5,2 1,85   27,04 3,4225   9,62 119,6 42,55
  5,5 1,82   30,25 3,3124   10,01   43,68
  4,8 1,74   23,04 3,0276   8,352 100,8 36,54
  4,5 1,70   20,25 2,89   7,65    
49,9 17,66   250,05 31,207   88,212 1052,7 353,29

В систему

подставим данные из расчетной таблицы и получим:

(1)

Чтобы решить систему относительно параметров , , , разделим каждое из уравнений системы на коэффициент при параметре , т.е. первое уравнение разделим на 10, второе – на 17,66, третье – на 210.

Получим систему уравнений:

(2)

Затем вычтем из второго первое, из второго третье. Получим:

(3)

Разделив каждое уравнение, полученной системы на коэффициент при . Для первого уравнения на 0,0011, для второго на 0,0848. Получим следующую систему:

(4)

Вычтем из первого второе и получим:

Подставляя полученное значение в первое уравнение системы получим:

Подставляя полученные значения и в уравнение (2) получим:

Уравнение регрессии будет выглядеть так:

Определим должное значение жизненной ёмкости лёгких для мужчины возраста 20 лет и роста 180 сантиметров из полученного регрессионного уравнения.

Жизненная ёмкость лёгких мужчины равна 5,031 литра.

Решение задач множественной линейной регрессии рекомендуется выполнять с помощью пакетов STADIA, SPSS, STATISTICA.

[3, стр. 229-236], [3, стр. 350 - 358], [3, стр. 362 - 373].








ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.