Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Парная корреляция и множественная корреляция.





Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы:

В основу группировки положены два изучаемых во взаимосвязи признака — X и У. Частоты f показывают количество соответствующих сочетаний X и У. Если f.. расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания тц допустимо утверждать о связи между X и У. При этом, если f.. концентрируются около одной из двух диагоналей, имеет место прямая или обратная линейная связь.

Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения X, по оси ординат — У, а точками показывается сочетание X и У. По расположению точек, и* концентрации в определенном направлении можно судить о наличии связи.

В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения — одно по X, другое по У. Рассчитаем для каждого Х; среднее значение У, т. е. У,, как

Последовательность точек (X, У,) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, — эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X.

По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов.

Практически для количественной оценки тесноты связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных X и У, то он вычисляется по формуле

Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета.

Коэффициент корреляции принимает значения в интервале от - 1 до + 1. Принято считать, что если | г | < 0,30, то связь слабая; при | г | = (0,3 ч- 0,7) — средняя; при | г | > 0,70 — сильная, или тесная. Когда | г | = 1 — связь функциональная. Если же г = 0, то это дает основание говорить об отсутствии линейной связи между У и X.

Множественная корреляция

Оценки тесноты связи (корреляции) могут играть двоякую роль. Это — самостоятельные характеристики, дающие представление и о взаимодействии изучаемых факторов, и об аппроксимации фактических данных аналитической функцией. Поэтому расчет показателей множественной корреляции предполагает оценку уравнений регрессии.

При оценке линейной множественной связи рассчитывают коэффициент множественной корреляции. По смыслу он отражает тесноту связи между вариацией зависимой переменной и вариациями всех включенных в анализ независимых переменных. Обычно сначала строится линейная множественная регрессия, а затем оценивается сам коэффициент.

Наиболее общие формулы для его определения имеют следующий вид: где о2 — общая дисперсия фактических данных результативного признака (дисперсия У);

о2ост —остаточная дисперсия, характеризующая вариацию У за счет факторов, не включенных в уравнение регрессии.

Коэффициент множественной корреляции изменяется от О до 1. Чем ближе R к 1, тем более сильная связь между у и множеством X. Эта же оценка R используется и как мера точности аппроксимации фактических данных выравненным. Если R. незначительно по величине (как правило, R =< 0,3), то можно утверждать, что либо не все важнейшие факторы взаимосвязи учтены, либо выбрана неподходящая форма уравнения. В этом случае следует пересмотреть список переменных модели, а возможно, и сам ее вид.

Для нелинейной множественной связи рассчитывают индекс корреляции. Форма и процедура его вычисления аналогичны указанным выше, только взаимодействие факторов аппрок­симируется нелинейной функцией. Он также изменяется в пределах от 0 до 1. На практике, как правило, используется одно название — коэффициент множественной корреляции.

Квадрат R равен так называемому коэффициенту детерминации (D или R2). Он показывает, какая часть вариации зависимого признака объясняется включенными в модель факторами.







Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.