|
Корреляционный и регрессионный анализ
Для оценки степени связи двух характеристик в корреляционном анализе используется коэффициент корреляции. Оценка коэффициента корреляции по наблюдениям рассчитывается по формуле:
где
Значимость оценки определяется с помощью критерия Стьюдента: если
то оценка значима, и не значима в противном случае. Величина выбирается из таблицы распределения Стьюдента [6] и отвечает уровню значимости а. (Для ). Для оценки характера связи в регрессионном анализе используется понятие функции регрессии. Оценка функции регрессии в нормальном случае производится по n наблюдениям по формуле
где
Доверительная область для линии регрессии r(х) определяется как:
где
Кa определяется по уровню значимости a(для ). В многомерном случае степень связи случайных величин , Y определяется с помощью множественного коэффициента корреляции Его оценка по n наблюдениям определяется как:
где – оценка функции множественной регрессии Y пo
Оценка множественной регрессии в виде линейной функции находится методом наименьших квадратов:
Значимость оценок коэффициентов определяется из условий: • имеет распределение Стьюдента • имеет распределение Стьюдента • имеет распределение Оценка коэффициента является значимой, если значение соответствующей статистики превосходит табличное значение, отвечающее заданному уровню значимости.
Робастные методы и процедуры
Многие «наилучшие» оценки в статистике (например, наиболее распространенная на практике оценка среднего значения случайной величины ) обладают тем дефектом, что они являются наилучшими лишь в случае, если выборка наблюдений получена из нормально распределенной совокупности данных и быстро теряют свои оптимальные свойства по мере отклонения распределения от нормального, то есть являются неустойчивыми к отклонениям от нормального распределения. В качестве характеристики устойчивости оценки можно предложить понятие робастности. Определение робастности оценки. Пусть случайная величина X имеет плотность распределения вероятностей , где вид функции f известен, а q – неизвестный параметр (может быть величиной векторной). Оценка параметра производится по n наблюдениям . В классической статистике качество оценки определяется ее дисперсией Df вычисленной в предположении, что выборка получена из генеральной совокупности с плотностью распределения вероятностей Определим понятие e-окрестности распределения f:
где – произвольная плотность распределения вероятностей.
Назовем оценку робастной, если для нее имеет место
То есть робастная оценка – это такая оценка, которая в наихудшем случае (когда достигается max ) имеет наименьшую дисперсию. Нахождение робастной оценки отвечает решению, как говорят в математике, минимаксной задачи. Минимаксное значение есть гарантированный верхний порог дисперсии оценки для любого распределения f из e-окрестности. Минимаксная стратегия широко распространена в таком разделе теории операций как теория игр. В определенном смысле робастная процедура – это «игра» исследователя с природой. Робастная оценка среднего значения. Если параметр T играет роль центра распределения (среднего значения), то . Робастная оценка параметра qв этом случае находится по п наблюдениям решением следующей задачи:
Если – плотность вероятностей нормального распределения, то:
Робастная оценка в этом случае представляет собой некий гибрид оценки средней арифметической и выборочной медианы . Она совмещает в себе эффективность первой оценки и устойчивость второй. Их соотношение определяется величиной степени засорения е через величину . Если , то оценка близка к среднему арифметическому. Если , то оценка близка к выборочной медиане. Робастная оценка имеет вид:
где – вариационный ряд выборочных значений; . Значения можно найти в таблице 2 [6].
Таблица 2 Значения уровня урезания a =a(e)
Робастная регрессия. Уравнение регрессии, получаемое методом наименьших квадратов, имеет существенный дефект, заключающийся в том, что при наличии грубых ошибок в данных оценки его коэффициентов сильно искажаются, то есть являются неустойчивыми к отклонениям от обычного предположения в регрессионном анализе, что ошибки в модели регрессии имеют нормальное распределение. Коэффициенты робастной регрессии вычисляются решением задачи:
где r (t) имеет вид (8.29).
ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры... Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем... ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|