Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Вопрос №11.Проверка гипотез о значимости параметров регрессии и уравнение регрессии в целом.





При помощи способа меньших квадратов мы получили только оценки характеристик уравнения регрессии. Чтоб проверить, значимы ли эти характеристики (т. е. значимо ли они отличаются от нуля в «истинном» уравнении регрессе y =b0 + b1∙x + u), употребляют статистические способы проверки гипотез. При помощи статистических способов проверки гипотез можно также проверить значимость коэффициента парной линейной корреляции (т. е. значимо ли он отличается от нуля в генеральной совокупы).

В качестве основной догадки (H0) выдвигают догадку о незначимом отличии от нуля «истинного» параметра регрессии либо коэффициента корреляции. Кандидатурой догадкой (Н1) при всем этом является догадка оборотная, т.е. о неравенстве нулю «истинного» параметра либо коэффициента корреляции. Мы заинтересованы в том, чтоб основная догадка была отвергнута. Для проверки этой догадки; употребляется t-статистика аспекта проверки догадки, имеющая рассредотачивание Стьюдента.

Отысканное по данным наблюдений значение t-статистики (его еще именуют наблюдаемым либо фактическим) сравнивается с критичным значением t -статистики, определяемым по таблицам рассредотачивания Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике либо эконометрике). Критичное значение определяется зависимо от уровня значимости () и числа степеней свободы, которое равно (n – h), n — число наблюдений, h — число оцениваемых характеристик в уравнении регрессии. В случае линейной парной регрессии h= 2, а число степеней свободы равно (n – 2). Критичное значение может быть также вычислено на компьютере при помощи интегрированной функции СТЬЮДРАСПОБР пакета Ехcеl.

Если фактическое значение t-статистики, взятое по модулю, больше критичного, то основную догадку отторгают и считают, что с вероятностью () «истинный» параметр регрессии (или коэффициент корреляции) значимо отличается от нуля.

Если фактическое значение t-статистики (по модулю) меньше критичного, то нет оснований отторгать основную догадку, т. е. «истинный» параметр регрессии (или коэффициент корреляции) незначимо отличается от нуля при уровне значимости.

Для проверки догадки: b1=0 статистика аспекта проверки имеет вид:

где — оценка коэффициента регрессии b1 приобретенная по наблюдаемым данным;

— стандартная ошибка оценки коэффициента регрессии.

Для линейного парного уравнения регрессий стандартная ошибка коэффициента рассчитывается по формуле:

.

Числитель в этой формуле может быть просто рассчитан через коэффициент детерминации и общую дисперсию признака-результата:

.

Для проверки догадки: b0=0 статистика аспекта проверки догадки имеет вид:

,

где — оценка параметра регрессии b0, приобретенная по наблюдаемым данным;

— стандартная ошибка оценки параметра.

Для линейного парного уравнения регрессии:

.

Для проверки догадки о незначимом отличии от нуля «истинного» коэффициента линейной парной корреляции употребляют статистику аспекта:

– оценка коэффициента корреляции, приобретенная по наблюдаемым данным (выборочный коэффициент корреляции);

 

– стандартная ошибка выборочного коэффициента корреляции.

Для линейного парного уравнения регрессии:

В парной линейной регрессии меж наблюдаемыми значениями статистик критериев существует связь:.

Рассмотренная формула статистики аспекта проверки догадки о незначимом отличии от нуля коэффициента корреляции рекомендуется к применению, если:

1) число наблюдений (n) огромное;

2) величина не близка к единице.

Если же величина выборочного коэффициента корреляции по модулю близка к 1, то рассредотачивание его оценок отличается от рассредотачивания Стьюдента. В этом случае употребляют подход, предложенный Р. Фишером, а конкретно, для оценки значимости линейного парного коэффициента корреляции r вводится вспомогательная величина z, связанная c данным коэффициентом последующим отношением:

.

Величину z можно не рассчитывать, а пользоваться готовыми таблицами z-преобразования, в каких приведены значения z для соответственных значений.

При изменении от –1 до +1 величина z меняется от –¥ до +¥, что соответствует нормальному рассредотачиванию. Математический анализ обосновывает, что рассредотачивание величины z не много отличается от обычного даже при близких к единице значениях коэффициента корреляции.

Тогда догадка о том, что «истинный» коэффициент корреляции незначимо отличается от нуля, сводится к догадке о незначимом отличии от нуля величины z. Для проверки данной догадки употребляют статистику аспекта:. Стандартная ошибка определяется по формуле:

,

где п — число наблюдений.

Критичное значение t-статистики — tкрнаходят по таблицам стандартного обычного рассредотачивания по доверительной вероятности (). Основную догадку отторгают, если.

Оценка значимости уравнения регрессии делается для того, чтоб выяснить, применимо уравнение регрессии для практического использования (к примеру, для прогноза) илинет. При всем этом выдвигают основную догадку о незначимости уравнения в целом, которая формально сводится к догадке о равенстве нулю характеристик регрессии, либо, что тоже самое, о равенстве нулю коэффициента детерминации R2=0. Другая ей догадка о значимости уравнения – догадка о неравенстве нулю характеристик регрессии либо о неравенстве нулю коэффициента детерминации:

Для ее проверки употребляют F-статистику аспекта проверки догадки:, где n –число наблюдений; h – число оцениваемых характеристик. Данная статистика имеет рассредотачивание Фишера-Снедоккора.

По таблицам рассредотачивания Фишера-Снедоккора находят критичное значение F-критерия зависимо от уровня значимости (обычно его берут равным 0,05) и 2-ух чисел степеней свободы k1=h – 1 и k2 = n – h.

Ассоциируют значение F-критерия, рассчитанное по данным подборки — Fнабл с критичным значением. Если, то догадку о незначимости уравнения регрессии не отторгают. Если, то выдвинутую догадку отторгают и принимают альтернативную догадку о статистической значимости уравнения регрессии.

Вопрос №12.Интервальная оценка параметров модели множественной регрессии.

    1. Интервальная оценка функции регрессии и ее параметров


В прогнозных расчетах по уравнению регрессии определяется предсказываемое (ур) значение как точечный прогноз ŷx при хрк, то есть путем подстановки в уравнение регрессии ŷx=a+b*x соответствующего значения х12. однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки ŷx, то есть mŷx, и соответственно интервальной оценкой прогнозного значения (у*)

ŷx- mŷx≤ у*≤ ŷx+mŷx

что бы понять, как строится формула для определения величины стандартной ошибки ŷx, обратимся к уравнению линейной регрессии: ŷx=a+b*x. Подставим в это уравнение выражение параметра а: a=y-b*x, тогда уравнение регрессии примет вид: ŷx= y-b*x+b*x=у+ b(x-x).

Отсюда вытекает, что стандартная ошибка mŷx зависит от ошибки у и ошибки коэффициента регрессии b, то есть:

mŷx2=my2+mb2(x-x)2

Из теории выборки известно, что my2= σ2/n. Используя в качестве оценки σ2 остаточную дисперсию на одну степень свободы S2, получим формулу расчета ошибки среднего значения переменной у:

my2= S2/n.

Считая, что прогнозное значение фактора хзк, получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, то есть mŷx:

mŷx2= S2/n+ S2/∑(x-x)2*(хк-х)2= S2*(1/n+((xk-x)2/(∑(x-x)2)))

Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении xk характеризует ошибку положения линии регрессии. Величина стандартной ошибки mŷx, как видно из формулы, достигает минимума при хк=х, и возрастает по мере того, как «удаляется» от х в любом направлении. Иными словами, чем больше разность между хк и х, тем больше ошибка mŷx с которой предсказывается среднее значение у для заданного значения хк. Можно ожидать наилучшие результаты прогноза, если признак-фактор х находится в центре области наблюдений х и нельзя ожидать хороших результатов прогноза при удалении хк от х. Если же значение хк оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько хк отклоняется от области наблюдаемых значений фактора х.

Фактические значения у варьируются около среднего значения ŷx. Индивидуальные значения у могут отклоняться от ŷx на величину случайной ошибки ε, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S2. Поэтому ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку mŷx, но и случайную ошибку S.







Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.