Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Линейная корреляция и уравнение линейной регрессии





 

Статистическая зависимость. При изучении взаимосвязей между разнообразными явлениями часто выясняется, что каждому значению одной переменной отвечает несколько значений другой, которые встречаются не одинаково часто.

Определение. Если одному значению переменной отвечает множество значений переменной , причем указанное множество значений не остается постоянным, то говорят, что между переменными и существует статистическая зависимость.

Этапы количественного изучения корреляционной связи:

1. Определение тесноты (силы) связи.

2. Построение теоретической линии регрессии (установление форм связи).

3. Определение значимости параметров связи.

Условным средним называют среднее арифметическое значений признака , соответствующих значению .

Корреляционной зависимостью от называют зависимость условной средней от :

Это уравнение регрессии на , – регрессия на , график – линия регрессии на . Наиболее простой формой взаимосвязи является линейная корреляционная зависимость. Пусть над признаками и проведено наблюдений, среди которых значение встречается раз, значение раз, пара чисел наблюдалось раз. Поэтому данные наблюдений удобно представить в сгруппированном виде – в виде корреляционной таблицы.

Уравнение прямой линии регрессии на имеет вид:

,

где – среднее признака , – средняя произведения,

– среднее признака , – средняя произведения,

– среднее квадратическое отклонение признака ,

– среднее квадратическое отклонение признака ,

 

Величина называется коэффициентом корреляции

.

Свойства коэффициента корреляции:

1о Абсолютна величина коэффициента корреляции не превышает единицы .
2о Если , то и не связаны линейной корреляционной зависимостью.
3о С увеличением абсолютной величины коэффициента корреляции линейная корреляционная зависимость становится более тесной и при превращается в функциональную зависимость.

 

Коэффициент корреляции характеризует степень линейной зависимости между признаками, т.е. тесноту линейной корреляционной связи.

Если , то между и практически отсутствует линейная корреляционная зависимость.

Если , то между и существует слабая линейная корреляционная зависимость.

Если , то между и существует заметная линейная корреляционная зависимость.

Если , то между и существенная линейная корреляционная зависимость.

Если , то между и существует тесная линейная корреляционная зависимость.

Если , то между и существует очень тесная линейная корреляционная зависимость.

Если данные наблюдений над признаками и заданы в виде корреляционной таблицы с равноотстоящими вариантами, то для нахождения уравнения целесообразно использовать упрощенную схему расчета. Идея упрощения заключается в переходе к более простым значениям переменных и выполнения для них основных вычислений. Более детально указанную идею реализуем на примере.

 

Пример 19. Найти уравнение прямой линии регрессии на по сгруппированным данным корреляционной таблицы.

 

           
               
               
               
               
               
             

 

1. Объем выборки . Значения показателей и достаточно большие, равноотстоят, можно перейти к более простым, условным вариантам и .

а) Выбирают наибольшую частоту в корреляционной таблице – это 35. Соответствующие этой частоте значения показателей обозначают через и :

.

б) Шаг изменения значений показателей обозначают через и :

(на эту величину отличаются значения ), (шаг для ).

 

в) Определяют условные варианты по формулам:

 

После этого составляют корреляционную таблицу в условных вариантах, сохраняя частоты.

 

– 3 – 2 – 1      
– 2              
– 1              
               
               
               
             

 

2. Проводят вычисления на основе условных вариант.

а) для :

,

.

 

б) для :

,

,

.

 

в) для и

Найдем коэффициент корреляции:

.

Данное значение свидетельствует о высокой степени взаимосвязи показателей и , а значит и .

 

3. Возвращаемся к старым переменным и составляем уравнение регрессии.

,

– искомое уравнение регрессии.

Сравним условные средние, найденные по уравнению (расчетные значения) и по данным корреляционной таблицы (фактические значения).

Расчетные условные средние:

Фактические условные средние

 

Составим таблицу

 

  17,59   0,41
  25,24 23,71 1,53
  32,89 34,67 1,78
  40,54 40,92 0,38
  48,19 46,57 1,62
  55,84   2,16

 

Согласование расчетных и фактических условных средних удовлетворительное.

 

 







Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.