Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Проверка аномальных наблюдений во временном ряду





Анализ информации временных рядов начинают с выявления аномальных, или нехарактерных наблюдений которые могут возникать по двум причинам:

- при подготовке и передаче информации, по другим техническим причинам; аномальные наблюдения, возникшие по этим причинам, называются ошибками I рода и подлежат устранению;

- вследствие объективных причин (стихийные бедствия, социальные взрывы и т. д.), которые воздействуют на процесс, но свои экстремальные свойства проявляют крайне редко; аномальные наблюдения, возникшие по этим причинам, называются ошибками II рода и устранению естественным путем не подлежат.

Для выявления аномальных наблюдений используется метод Ирвина, алгоритм которого приведен ниже:

1) для каждого наблюдения начиная со второго, вычисляется , где и наблюдения во временном ряду; -среднеквадратическое отклонение экономического показателя :

;

2) каждое значение , сравнивается с табличным , которое зависит от длины временного ряда и вероятности расчетов:

n        
1,5 1,3 1,2 1,1

Если > , то наблюдение считается аномальным, и не аномальным в противном случае.

 

ПРИМЕР. Проверить наличие аномальных наблюдений в заданном временном ряду (табл.1) =88,7; =1,5; =19,38.

Таблица 1 – Проверка аномальных наблюдений

t
    36,3 1317,69  
    29,3 858,449 0,36
    4,3 18,49 1,29
    3,3 10,89 0,05
    -2,7 7,29 0,31
    -4,7 22,09 0,21
    -11,7 136,89 0,36
    -13,7 187,69 0,21
    -18,7 349,69 0,26
    -21,7 470,89 0,15

 

Вывод: так как все < , то в данном ряду аномальных наблюдений нет.

 

Если исходный временной ряд содержит аномальные наблюдения I рода, которые можно устранить естественным путем, то полученная информация о динамике развития СЭП (объекта) перепроверяется и по уточненным данным строится временной ряд, который снова проверяется на наличие аномальных наблюдений. Если временной ряд содержит аномальные наблюдения II рода, которые не устраняются естественным путем, то к такому ряду применяют процедуру сглаживания, позволяющую избавиться от резких перепадов значений наблюдений.

Приведем пример временного ряда, содержащего аномальные наблюдения II рода.

ПРИМЕР. Проверить наличие аномальных наблюдений в следующем временном ряду:

t                    
                     
  - 0.75 0.25 1.38 0.63 1.63 0.5 0.88 0.25 1.38

=24; =7,99; =1.5; =1,63>1.5 наблюдение y6 является аномальным. Так как природа исследуемого процесса неизвестна, поэтому определить причину возникновения аномального наблюдения невозможно; предположим, что оно возникло вследствие объективных причин, т.е. ошибка второго рода. Для устранения этой ошибки можно заменить аномальное наблюдение средним арифметическим значением соседних уровней временного ряда: =(y5+y7)/2=(17+34)/2=25.5. Вывод: данный временной ряд содержит аномальное наблюдение, которое необходимо устранить. Для устранения аномального наблюдения можно заменить его средним арифметическим соседних уровней временного ряда или (особенно, если аномальных наблюдений несколько) воспользоваться одним из методов сглаживания временных рядов. Выбор метода сглаживания зависит от графического отображения временного ряда.

Контрольные вопросы:

1 Какие наблюдения называются аномальными?

2 Вследствие каких причин могут возникать аномальные наблюдения во временном ряду?

3 Как можно определить наличие аномальных наблюдений во временном ряду?

4 Как можно избавиться от аномальных наблюдений?

Контрольное задание: проверить исходный временной ряд на наличие аномальных наблюдений и, если таковые есть, определить их природу и способ устранения.

Сглаживание временного ряда

После выявления аномальных наблюдений приступают к сглаживанию временного ряда, которое позволит более четко выявить тенденцию развития исследуемых процессов и подготовит информационный ряд для построения модели прогнозирования. Для сглаживания временных рядов часто используются методы простой, взвешенной скользящей средней, экспоненциального сглаживания. Рассмотрим эти методы. Алгоритм метода простой скользящей средней (МПСС) состоит из следующих этапов:

1) Определяется количество наблюдений входящих в интервал сглаживания. При этом используют правило: если необходимо сгладить мелкие, беспорядочные колебания, то интервал сглаживания берут по возможности большим, и, наоборот, интервал сглаживания уменьшают, когда нужно сохранить более мелкие волны и освободиться от периодически повторяющихся колебаний, возникающих, например, из-за автокорреляций уровней;

2) Вычисляется среднее значение наблюдений, образующих интервал
сглаживания, которое одновременно является сглаживающим значением уровня, находящегося в центре интервала сглаживания, при условии, что m - нечетное число, по формуле

, (1)

где m – количество наблюдений, входящих в интервал сглаживания, при нечетном значение параметра m значение параметра р вычисляют следующим образом: p=(m-1)/2;

- среднее значение наблюдения yt, которое одновременно является сглаженным значением наблюдения, находящегося в центре интервала сглаживания при нечетном m;

р - количество наблюдений, стоящих по разные стороны от сглаживаемого;

первым сглаженным будет наблюдение , где t=p+1;

3) Интервал сглаживания сдвигается на один член вправо и по формуле (1) находится сглаженное значение для (t+1) наблюдения. Затем снова производят сдвиг и т. д. Процедура продолжается до тех пор, пока в интервал сглаживания не войдет последнее наблюдение временного ряда

ПРИМЕР. Сгладить исходный временной ряд с помощью метода простой скользящей средней.

Количество наблюдений в интервале сглаживания т =5; ;

Сглаженное значение каждого наблюдения, начиная с 3-гo, вычисляется

по формуле и заносится в таблицу 2

.

Таблица 2 – Метод простой скользящей средней

Номер наблюдения, t Исходное значение Сглаженное значение
     
     
    102,8
    94,6
    86,4
    82,8
    78,4
    74,6
     
     

Недостатком метода является невключение в процедуру сглаживания первых и последних р наблюдений временного ряда.

Метод простой скользящей средней возможно использовать, если графическое изображение ряда напоминает прямую линию. В этом случае не искажается динамика развития исследуемого процесса. Однако, когда тренд выравниваемого ряда имеет изгибы и к тому же желательно сохранить мелкие волны, использовать для сглаживания ряда метод простой скользящей средней нецелесообразно, поскольку при этом:

· выравниваются и выпуклые, и вогнутые линии,

· происходит сдвиг волны вдоль ряда,

· изменяется знак волны, то есть на кривой, соединяющей сглаженные точки, вместо выпуклого участка образуется вогнутый и наоборот. Последнее имеет место в случаях, когда интервал сглаживания в полтора раза превышает длину волны.

Таким образом, если развитие процесса носит нелинейный характер, то применение метода простой скользящей средней может привести к значительным искажениям исследуемого процесса. В таких случаях более надежным является использование других методов сглаживания, например метода взвешенной скользящей средней (МВСС). Этот метод отличается от предыдущего тем, что сглаживание внутри интервала производится не по прямой, а по кривой более высокого порядка. Это обусловлено тем, что суммирование членов ряда, входящих в интервал сглаживания, производится с определенными весами, рассчитанными по методу наименьших квадратов.

Если сглаживание производится с помощью полинома (многочлена) второго или третьего порядка, то веса берутся следующие:

для m=5 –веса ;

для m=7– веса ;

Особенности весов - симметричны относительно центрального члена, сумма весов с учетом общего множителя равна 1.

Недостаток метода - первые и последние р наблюдений ряда остаются несглаженными.

ПРИМЕР. Сгладить исходный временной ряд с помощью метода взвешенной скользящей средней.

Число наблюдений в интервале сглаживания m=5; веса для 2-го и 3-го порядка сглаживания:

.

Сглаженное значение наблюдений, начиная с (p+1)-го, вычисляется по формуле:

.

Результаты вычислений сведем в таблицу 3.

 

Таблица 3 –Метод взвешенной скользящей средней

Номер наблюдения, t Исходное значение Сглаженное значение
     
     
    99 1
  .92 88,7
    87,5
    82,4
    78,5
    73,9
     
     

 

Рассмотренные методы простой и взвешенной скользящей средней не дают возможности сгладить первые и последние p наблюдений временного ряда. Отсутствие сглаженных первых наблюдений не так важно по сравнению с последними, особенно, если целью исследования является прогнозирование развития процесса. Есть методы, позволяющие получить сглаженные значения последних уровней так же, как и всех остальных. К их числу относится метод экспоненциального сглаживания (МЭС).

Особенность этого метода заключена в том, что в процедуре выравнивания каждого наблюдения используются только значения предыдущих уровней, взятых с определенным весом. Вес каждого наблюдения уменьшается по мере его удаления от момента, для которого определяется сглаживаемое значение. Сглаженное значение наблюдения ряда St на момент времени t определяется по формуле:

, (2)

где - сглаживающий параметр, характеризующий вес выравниваемого наблюдения, причем 0< <1.

Величину St-1 в формуле (2) можно представить в виде суммы фактического значения уровня yt-1 и сглаженного значения предшествующего ему наблюдения St-2, взятых с соответствующими весами. Процесс такого разложения можно продолжить для членов St-2, St-3 и т.д. В результате получится следующее выражение:

 

(3)

в котором среднее сглаженное значение является комбинацией всех предшествующих уровней ряда. Величина характеризует начало условия процесса. Формулу (3) можно переписать короче через знак суммы:

, (4)

где - число периодов отставания от момента t.

Относительный вес каждого предшествующего уровня снижается по экспоненте по мере его удаления от момента, для которого вычисляется сглаженное значение (отсюда произошло название этого метода сглаживания).

При практическом использовании метода экспоненциального сглаживания возникают следующие затруднения - выбор сглаживающего параметра и определение начального условия . От численного значения и параметра зависит, насколько быстро будет уменьшаться вес предшествующих наблюдений и в соответствии с этим степень их влияния на сглаживаемый уровень. Чем больше значение параметра , тем меньше сказывается влияние предшествующих уровней и соответственно меньшим оказывается сглаживающее воздействие экспоненциальной средней.

Задачу выбора параметра , определяющего начальные условия, предлагается решать следующим образом: если есть данные о развитии процесса в прошлом, то их среднее значение можно принять в качестве , если таких сведений нет, то в качестве используют исходное (первое) значение наблюдения временного ряда .

ПРИМЕР. Сгладить исходный временной ряд с помощью метода экспоненциального сглаживания.

Пусть , ,

,

,

и т. д.

Результаты вычислений сведем в таблицу 4.

 

Таблица 4 – Метод экспоненциального сглаживания

Номер наблюдения, t Исходное значение Сглаженное значение
     
    120.1
    101.1
  92. 94.7
    88.6
    85.4
    79.5
    76.4
    71.9
    68.5

Контрольные вопросы:

1. Что понимают под сглаживанием временного ряда?

2. Для чего необходимо сгладить исходный временной ряд?

3. Какими методами можно сгладить временной ряд?

4. Что общего и какие недостатки и преимущества этих методов?

Контрольное задание: сгладить исходный временной ряд с помощью приведенных методов и построить графики данного и сглаженных рядов на однойкоординатной плоскости. Провести сравнительный анализ.

Определение тренда

Тренд - это систематическое устойчивое изменение процесса в течение продолжительного периода времени. Для определения наличия тренда используют метод Знаковый критерий Кокса и Стюарта.

Согласно этому методу весь временной ряд разбивается на три равных или почти равных части. Если количество наблюдений во временном ряду на 3 не делится, то первая и третья части берутся одинаковыми, а вторая - на одно или два наблюдения меньше. Из значений наблюдений первой части вычитают соответствующие значения наблюдений третьей части и фиксируют знак разности. Определяют значение S, исходя из следующих условий задачи:

· Если ставится задача определить наличие положительного (отрицательного) тренда, то в качестве величины берется сумма отрицательных (положительных) знаков.

· Если ставится задача просто определить наличие тренда, то в качестве величины S берется большее количество одинаковых знаков.

Вычисляют величину Z по одной из формул в зависимости от длины
временного ряда:

, если n ,

или

, если ,

где n - длина временного ряда.

Вычисленное значение Z сравнивают с табличным в зависимости от
выбранного критерия: Zтабл (односторонний) = 1.64,

Zтабл (двусторонний) =1.96.

Если расчетное Z > Zтабл., то тренд с выбранной вероятностью в данном временном ряду существует. (указанные табличные значения выбраны для вероятности 0,95, или 0,5 уровня значимости.) Выбор одностороннего или двустороннего критерия зависит от
следующих причин:

· Если ставится задача определить наличие положительного
(отрицательного) тренда, то в качестве величины S берется сумма отрицательных (положительных) знаков и сравнение производится с односторонним критерием.

· Если ставится задача просто определить наличие тренда, то в качестве величины S берется большее количество одинаковых знаков и сравнение производят с двусторонним критерием.

ПРИМЕР.Определить наличие тренда в заданном временном ряду.

Весь ряд разбиваем на три части, так как 10 (количество наблюдений в ряду) на три не делится без остатка, то в первую и третью части включаем по 4 наблюдения, а во вторую войдут два. Из значений наблюдений первой части вычитаем соответствующие значения наблюдений третьей части и фиксируем знак разности

у17 =125-77 (+), у28=118-75 (+),

уЗ9 = 93-70 (+), у410=92-67 (+)

Так как ставилась задача просто определить наличие тренда в заданном временном ряду, то в качестве величины S берем большее количество одинаковых знаков (это знаки «плюс») и сравнение производим с двусторонним критерием; S=4; т.к. n =10, то Z вычисляем по первой формуле: Z=2,01; Zдвустор. =1,96, тогда Z=2,01 > Zдвустор. (1,96). Следовательно, тренд с вероятностью 0,95 существует в данном временном ряду. Поскольку фиксировались знаки «ПЛЮС», то тренд считается отрицательным, или убывающим.







ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.