Корреляционный и регрессионный анализ

Для оценки степени связи двух характеристик в корреляционном анализе используется коэффициент корреляции. Оценка коэффициента корреляции по наблюдениям

рассчитывается по формуле:

Значимость оценки определяется с помощью критерия Стьюдента: если

то оценка значима, и не значима в противном случае.

Величина

выбирается из таблицы распределения Стьюдента [6] и отвечает уровню значимости а. (Для

Для оценки характера связи в регрессионном анализе используется понятие функции регрессии. Оценка функции регрессии в нормальном случае производится по n наблюдениям

по формуле

Доверительная область для линии регрессии r(х) определяется как:

К_a определяется по уровню значимости a(для

В многомерном случае степень связи случайных величин

, Y определяется с помощью множественного коэффициента корреляции

Его оценка по n наблюдениям

определяется как:

где

– оценка функции множественной регрессии Y пo

Оценка множественной регрессии в виде линейной функции

находится методом наименьших квадратов:

Значимость оценок коэффициентов определяется из условий:

Оценка коэффициента является значимой, если значение соответствующей статистики превосходит табличное значение, отвечающее заданному уровню значимости.

Многие «наилучшие» оценки в статистике (например, наиболее распространенная на практике оценка среднего значения случайной величины

) обладают тем дефектом, что они являются наилучшими лишь в случае, если выборка наблюдений получена из нормально распределенной совокупности данных и быстро теряют свои оптимальные свойства по мере отклонения распределения от нормального, то есть являются неустойчивыми к отклонениям от нормального распределения. В качестве характеристики устойчивости оценки можно предложить понятие робастности.

Определение робастности оценки. Пусть случайная величина X имеет плотность распределения вероятностей

, где вид функции f известен, а q – неизвестный параметр (может быть величиной векторной). Оценка параметра

производится по n наблюдениям

. В классической статистике качество оценки

определяется ее дисперсией D_f

вычисленной в предположении, что выборка получена из генеральной совокупности с плотностью распределения вероятностей

Определим понятие e-окрестности распределения f:

где

– произвольная плотность распределения вероятностей.

Назовем оценку

робастной, если для нее имеет место

То есть робастная оценка – это такая оценка, которая в наихудшем случае (когда достигается max

) имеет наименьшую дисперсию. Нахождение робастной оценки отвечает решению, как говорят в математике, минимаксной задачи. Минимаксное значение

есть гарантированный верхний порог дисперсии оценки для любого распределения f из e-окрестности.

Минимаксная стратегия широко распространена в таком разделе теории операций как теория игр. В определенном смысле робастная процедура – это «игра» исследователя с природой.

Робастная оценка среднего значения. Если параметр T играет роль центра распределения (среднего значения), то

. Робастная оценка параметра qв этом случае находится по п наблюдениям

решением следующей задачи:

Если

– плотность вероятностей нормального распределения, то:

Робастная оценка в этом случае представляет собой некий гибрид оценки средней арифметической

и выборочной медианы

. Она совмещает в себе эффективность первой оценки и устойчивость второй. Их соотношение определяется величиной степени засорения е

через величину

. Если

, то оценка близка к среднему арифметическому. Если

, то оценка близка к выборочной медиане.

где

– вариационный ряд выборочных значений;

. Значения

можно найти в таблице 2 [6].

Робастная регрессия. Уравнение регрессии, получаемое методом наименьших квадратов, имеет существенный дефект, заключающийся в том, что при наличии грубых ошибок в данных оценки его коэффициентов сильно искажаются, то есть являются неустойчивыми к отклонениям от обычного предположения в регрессионном анализе, что ошибки

в модели регрессии

имеют нормальное распределение.

Коэффициенты робастной регрессии вычисляются решением задачи:

Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)...

ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...

Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: