Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Числовые характеристики двумерных случайных величин





1. Корреляционным моментом (ковариацией) случайных величин X и Y называют математическое ожидание произведения отклонений этих величин от своих математических ожиданий: .

Для вычисления корреляционного момента дискретных случайных величин используют формулу .

Для непрерывных случайных величин:

.

Корреляционный момент служит для характеристики связи между величинами X и Y. Если X и Y независимы, корреляционный момент равен 0, иначе корреляционный момент отличен от нуля.

2. Коэффициентом корреляции ( ) случайных величин X и Y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин: .

Напомним, что коэффициент корреляции – безразмерная величина, причем | |≤1. Он служит для оценки тесноты линейной связи между Х и У: чем ближе абсолютная величина коэффициента корреляции к единице, тем связь сильнее; чем ближе абсолютная величина коэффициента корреляции к нулю, тем связь слабее. Коррелированными называют две случайные величины, если их корреляционный момент отличен от нуля. Некоррелированныминазывают две случайные величины, если их корреляционный момент равен нулю. Из независимости двух случайных величин следует их некоррелированность, обратное, вообще говоря, неверно.

Точечные оценки ковариации и коэффициента корреляции

Пусть имеется выборка реализаций двумерной случайной величины (X, Y), т.е. n пар чисел (Xi, Yi), i = 1, …, n.

Выборочную характеристику называют корреляционным моментом, или выборочной ковариацией. Величина является точечной оценкой ковариации случайных величин X и Y.

Выборочную характеристику называют выборочным коэффициентом корреляции. Величина является точечной оценкой - коэффициента корреляции случайных величин X и Y.



Замечание.Точечные оценки математического ожидания = xi и = yi (выборочные средние) и точечные оценки дисперсии и (выборочные дисперсии) рассматривались на занятии 1.

Вычисление точечных оценок ковариации и коэффициента

Корреляции в Excel

А) По формулам.Рассмотрим две выборки размера . X - общие коэффициенты рождаемости и Y - среднедушевые денежные доходы населения в регионах Центральной России (данные взяты с сайта федеральной службы государственной статистики www.gks.ru). Покажем, как с помощью указанных выше формул вычислить в Excel ковариацию и коэффициент корреляции.

Введём исходные данные в электронную таблицу Excel (столбцы A, B и C на рис. 8.1). Вычислим в столбцах D и E выборочные средние и для X и Yсоответственно: =СУММ(B2:B11)/10и =СУММ(C2:C11)/10. Далее в столбцах F и G находим отклонение вариант и от выборочных средних и , а в столбце H - их произведение. Тогда выборочную ковариацию в столбце I можно вычислить как: =СУММ(H2:H11)/10. Для определения выборочного коэффициента корреляции вычислим сначала в столбцах J и K средние квадратические отклонения величин X и Y,воспользовавшись функцией СТАНДОТКЛОНП, то есть: =СТАНДОТКЛОНП(B2:B11) для нахождения и =СТАНДОТКЛОНП(C2:C11) для нахождения . И тогда вычисляем в столбце L как: =I2/(J2*K2).

Рис. 8.1

Найденное значение выборочного коэффициента близко к нулю, таким образом, между общим коэффициентом рождаемости (выборка X) и среднедушевым денежным доходом (выборка Y) в регионах Центральной России существует лишь слабая корреляция, что может показаться странным на первый взгляд.

Б) С помощью статистических функций.Как было сказано в занятии 1, в Excel представлен широкий набор встроенных статистических функций. Так, для вычисления точечных оценок ковариации и коэффициента корреляции выборок X и Y можно воспользоваться функциями КОВАР и КОРРЕЛ соответственно. В качестве аргументов в обоих случаях следует задавать массивы из выборок, например, для предыдущего примера (рис. 8.1) это реализуется так: =КОВАР(B2:B11;C2:C11)и=КОРРЕЛ(B2:B11;C2:C11).

Заметим, что если в качестве аргументов функции КОВАР задать один и тот же массив данных, то мы получим значение дисперсии этой случайной величины, обычно вычисляемой в Excel с помощью функции ДИСПР.

В) С помощью пакета Анализ данных. Использовать надстройку «Пакет анализа» при проведении ковариационного или корреляционного анализа имеет смысл, если рассматривается более двух случайных величин. Дополним наши данные выборкой Z- долей сельского населения в регионах (столбец D на рис. 8.3).

Приступим к ковариационному анализу: Данные → Анализ данных → Ковариация → ОК(рис. 8.2).

Рис. 8.2

В появившемся диалоговом окне в качестве входного интервала выбираем диапазон смежных столбцов, содержащих анализируемые данные, а в качестве выходного интервала вводим ссылку на левую верхнюю ячейку ковариационной таблицы (или можно выбрать новый рабочий лист) и нажимаем ОК. Результат ковариационного анализа представлен на рис. 8.3.

Рис. 8.3

Таким образом, ковариационный анализ в пакете Анализ данных вычисляет значение функции ковариации для всех возможных пар случайных величин, при этом элементы, находящиеся на диагонали ковариационной таблицы, не что иное, как дисперсии величин X, Y и Z.

Аналогичным образом проводится и корреляционный анализ: Данные → Анализ данных → Корреляция → ОК. Результаты представлены на рис. 8.4.

Рис. 8.4

Попробуйте самостоятельно прокомментировать результаты корреляционного анализа.









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.