Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ АНАЛИЗА ДАННЫХ





Прогнозирование

Назначение информационной технологии «Прогнозирование» - определение значений для исходного числового ряда, характеризующего поведение анализируемой величины, на будущие периоды времени по имеющимся данным этого ряда.

Все методы прогнозирования можно разделить на два больших класса: трендовое прогнозирование и прогнозирование методом авторегрессии. Для каждого из них существуют общестатистические рекомендации по их настройке, но для каждого конкретного варианта исходных данных необходим исследовательский подход по выбору лучшей ситуации. Наиболее обобщающим критерием выбора лучшего прогноза из ряда построенных можно указать следующий: лучшим является прогноз, построенный по описывающей линии наиболее приближенной к исходному временному ряду. Степень близости рекомендуется оценивать как их среднее линейное отклонение на всех временных периодах.

Сущность трендового прогнозирования заключается в аппроксимация исходного ряда каким-либо несложным математическим уравнением и последующем продлении линии аппроксимации на любое количество периодов будущего.

Если базовая линия (график исходных данных) имеет небольшие колебания и ее вид в целом не имеет явно выраженных изгибов и переломов, то лучшей аппроксимацией будет выступать линейный тренд (полином первой степени).

Очень часто вид базовой линии имеет один явно выраженный изгиб, что соответствует в реальности выходу компании на предел своих возможностей на данном этапе и отсутствию значительного роста (выпуклость графика), или же прогрессирующему росту основных показателей деятельности (вогнутость графика). В этом случае подходящими аппроксимациями выступают следующие ряды: степенной; показательный; экспонециальный; логарифмический или же полиномиальный второй степени (парабола).



В случае более протяженного вида базовой линии, имеющей сразу как участок подьема, так и участок насыщения, наиболее подходящим для аппроксимации является логистический ряд. А в общем случае применим также и полиномиальный ряд третьей степени.

В самом общем случае, когда в исходных данных проявлено несколько (более двух) изгибов, что, как правило, соответствует проявлению сезонной компоненты в деятельности компании, для аппроксимации используется полином иальный ряд. Причем степень аппроксимирующего полинома определяется по простому правилу: степень должна как минимум на единицу превосходить количество изгибов в базовой линии.

Прогнозирование методом авторегрессии основано на определении только прогнозного значения на основе линейной комбинации нескольких предыдущих фактических значений. Эти методы реализуют алгоритмы самонастройки, или слежения за изменением хода базовой линии. Поэтому, как правило, они позволяют построить более достоверные прогнозы по сравнению с трендовыми подходами. В качестве недостатка авторегрессионного метода можно указать построение прогноза только на один период будущего, но, с другой стороны, к долговременным прогнозам обычно снижается уровень доверия за счет действия непредсказуемых факторов.

В качестве примеров авторегрессионных методов прогнозирования можно привести прогнозирование методом скользящего среднего и экспонециального сглаживания, реализованные в табличном процессоре Excel.

Статистический анализ

Для характеристики поведения анализируемых величин, изменяющихся случайным образом, используют множество статистических показателей. Причем случайная величина уже, как правило, не отражает временную зависимость поведения какого-либо показателя, а представляет собой выборочное значение из какой-либо генеральной совокупности значений, например – ответы респондентов на вопросы анкеты. Основными статистическими показателями являются следующие.

Характеристики центра: математическое ожидание (среднее значение случайной величины; медиана (значение случайной величины, расположенной посередине упорядоченного ряда ее значений); мода (наиболее часто встречающееся значение случайной величины). Причем для случайной величины, имеющей нормальное распределение, эти характеристики совпадают.

Характеристики изменчивости (относительно центра – математического ожидания): среднее линейное отклонение; стандартное отклонение (среднеквадратичное отклонение). В эту группу также относят: минимум; максимум; размах. А также относительные характеристики: коэффициент вариабельности (отношение стандартного отклонения к математическому ожиданию, в процентах) и коэффициент осцилляции (отношение размаха случайной величины к математическому ожиданию, в процентах).

Порядковые характеристики (значение случайной величины, расположенной на определенном месте в упорядоченном ряду всех ее значений): верхний и нижний квантили; децили; процентили.

Характеристики закона распределения (оценивают близость закона распределения случайной величины к наиболее популярной математической абстракции – закону нормального распределения, имеющего колоколообразный вид): асимметрия (неодинаковость нисходящих ветвей относительно вериткальной линии, проходящей через “купол” закона распределения); эксцесс (островершинность или же тупоконечность реального закона распределения по отношению к нормальному закону).

Регрессионный анализ

Сущность метода заключается в получении линейного регрессионного уравнения, связывающего зависимую переменную Y с несколькими независимыми, и ее дальнейшее использование в прогнозировании значений зависимой переменной:

Y (x1,x2,…, xk) =a0+a1*x1+a2*x2+…+a k*xk

В табличном процессоре Excel возможно строить только простые модели, связывающие зависимую переменную с только одной независимой. Но и эта возможность обычно дает хорошие результаты в исследовании связей между случайными величинами.

В профессиональных аналитических программах реализуются возможности построения более сложных моделей: простых / множественных; линейных / нелинейных; без учета временных сдвигов / с учетом временных сдвигов. В случае возможности построения нескольких моделей регрессии, характеризующих исследуемую ситуацию, выбор лучшей модели осуществляется по коэффициенту детерминации (для двух величин – это квадрат коэффициента корреляции), соответствующему каждой построенной модели. Физический смысл числового значения коэффициента детерминации – это процент изменчивости зависимой величины Y, объясняемый построенным уравнением регрессии.

В общем случае для анализа связей между случайными величинами рекомендуется следующий пошагово уточняющий алгоритм:

предварительная оценка силы связи случайных величин предполагает качественную оценку силы связи исходя из синхронности поведения графиков их значений;

количественная характеристика силы связи предполагает расчет коэффициентов корреляции для всех анализируемых пар случайных величин;

построение модели связи – уравнения регрессии с помощью линейной аппроксимации графика зависимости Y=f(х) в виде точечной диаграммы с отражением величины достоверности аппроксимации R2. Численное значение квадрата коэффициента корреляции характеризует качество полученной модели, а именно: показывает процент изменчивости зависимой переменной, обьясняемый построенной моделью;

применение модели связи для прогнозирования значений зависимой переменной по предполагаемым значениям независимой.

 

 









Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)...

Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2021 zdamsam.ru Размещенные материалы защищены законодательством РФ.