Методы прогнозирования по временным рядам из журналов. Определение базового уровня и тренда

Транскрипт

1 Лабораторная работа 10. Прогнозирование временных рядов. Цель работы: Построение прогноза временного ряда несколькими способами и выбор лучшей модели прогнозирования. Нужно сделать Взять 2 временных ряда -- один в виде отдельного файла, другой из документа Excel Провести корреляционный анализ каждого временного ряда построить его график, рассчитать АКФ, построить график АКФ, определить свойства ряда Построить прогнозы заданных временных рядов несколькими различными способами. Модели временных рядов выбирать из текста лекции. Оценить ошибки прогнозирования и на основании рассчитанных ошибок выбрать наилучшую модель прогнозирования. К отчету Документ Mathematica с отчетами. Анализ и прогнозирование временных рядов Введение Прогнозирование одна из самых востребованных задач бизнес-аналитики. Продажи, поставки, заказы это процессы, распределенные во времени, следовательно, прогнозирование в области продаж, сбыта и спроса, управления материальными запасами и потоками обычно связано именно с анализом временных рядов. Временной ряд последовательность наблюдений за изменениями во времени значений параметров некоторого объекта или процесса. Временные отсчеты значения, зафиксированные в некоторые, обычно равноотстоящие моменты времени. В задачах анализа временных рядов мы имеем дело с дискретным временем, когда каждое наблюдение за параметром образует временной отсчет. Все временные отсчеты нумеруются в порядке возрастания. Тогда временной ряд будет представлен в виде X={x 1,x 2,x n }. Одномерные временные ряды содержат наблюдения за изменением только одного параметра исследуемого процесса или объекта, а многомерные за двумя параметрами или более. Например, трехмерный временной ряд, содержащий наблюдения за тремя параметрами X,Y,Z процесса F можно записать в следующем виде Цели и задачи анализа временных рядов F={(x 1,y 1,z 1), (x 2,y 2,z 2),(x n,y n,z n)} Описание характеристик и закономерностей ряда Моделирование построение модели исследуемого процесса Прогнозирование предсказание будущих значений временного ряда

2 Управление. Зная свойства временных рядов, можно выработать воздействия на соответствующие бизнес-процессы для управления ими методы Детерминированная и случайная составляющая временного ряда Закономерная (детерминированная) составляющая временного ряда последовательность значений, элементы которой могут быть вычислены в соответствии с определенной функцией. Закономерная составляющая временного ряда отражает действие известных факторов и величин. Зная функцию, описывающую закономерность, в соответствии с которой развивается исследуемый процесс, мы можем вычислить значение детерминированной составляющей в любой момент времени. Случайная (стохастическая) составляющая временного ряда последовательность значений, которая является результатом воздействия на исследуемый процесс случайных факторов. Случайная составляющая и ее влияние на временной ряд могут быть оценены только с помощью статистических методов. Случайная составляющая проявляется как результат воздействия набора случайных факторов на исследуемый процесс и обычно выражается в повышенной изменчивости временного ряда, а также в отклонении значений детерминированной составляющей. Результирующее значение временного ряда это результат взаимодействия детерминированной и случайной составляющих. Простейший вид такого взаимодействия случай, когда, каждое значение временного ряда можно рассматривать как сумму (разность) двух значений, одно из которых обусловлено детерминированной составляющей, а другое случайной, т.е. x i =d i +p i. Модели временных рядов Наблюдаемые значения временного ряда представляют собой результат взаимодействия детерминированной и случайной составляющих. Различают два вида такого взаимодействия: Аддитивное значения временного ряда получаются как результат сложения детерминированной и случайной составляющих Мультипликативное значения временного ряда получаются как результат умножения детерминированной и случайной составляющих Соответственно, аддитивная модель имеет вид x i =d i +p i, мультипликативная модель имеет вид x i =d i p i. Компоненты временного ряда Типовые структуры, которые можно выделить во временном ряду тренд, сезонная компонента, циклическая компонента. Тогда детерминированная составляющая может быть записана в виде: d i =t i +s i +c i, где t i тренд, s i сезонная компонента, c i циклическая компонента.

3 Тренд Тренд медленно меняющаяся компонента временного ряд, которая описывает влияние на временной ряд долговременно действующих факторов, вызывающих плавные и длительные изменения ряда. Чтобы представить характер тренда, обычно достаточно взглянуть на график временного ряда. Наиболее популярные модели для описания тренда: Простая линейная модель: t i =a+b i Полиномиальная модель: t i =a+b 1 i+ b 2 i b n i n. В большинстве реальных задач степень полинома не превышает 5 Экспоненциальная модель: t i =exp(a+b i). Используется в случаях, когда процесс характеризуется равномерным увеличением темпов роста Логистическая модель t i =a./(1+b e - k i), где k константа, управляющая крутизной логистической функции. Такого типа кривые, имеющие S-образную форму, часто называют сигмоидами. Они хорошо описывают процессы с непостоянными темпами роста. Сезонная компонента Многим процессам свойственна повторяемость во времени, причем периодичность таких повторений может изменяться в очень широком диапазоне. Очевидно, что для описания таких периодических изменений, присутствующих во временных рядах, тренд непригоден. Сезонная компонента составляющая временного ряда, описывающая регулярные изменения его значений в пределах некоторого периода и представляющая сосбой последовательность почти повторяющихся циклов. Сезонная компонента может быть привязана к определенному календарному временному интервалу: дню, неделе, месяцу либо к какому-либо событию, которое пямо не соотносится с конкретными календарными интервалами. Сезонную компоненту с изменяющимся периодом иногда называют плавающей. Циклическая компонента Часто временные ряды содержат изменения, слишком плавные и заметные для случайной составляющей. В то же время такие изменения нельзя отнести ни к тренду, поскольку они не являются достаточно протяженными, ни к сезонной компоненте, поскольку они не являются регулярными. Подобные изменения называются циклической компонентой временного ряда. Циклическая компонента временного ряда интервалы подъема или спада, которые имеют различную протяженность, а также различную амплитуду расположенных в них значений. Изучение циклической компоненты часто оказывается полезным для прогнозирования, особенно краткосрочного.

4 Т.о., временной ряд можно представить как композицию, состоящую из двух составляющих случайной и детерминированной. Детерминированная составляющая, в свою очередь, содержит три компоненты тренд, сезонную и циклическую. Исследование временных рядов и автокорреляция Цель анализа временного ряда построение его математической модели, с помощью которой можно обнаружить закономерности поведения ряда, а также построить прогноз его дальнейшего развития. Временной ряд называется стационарным, если его статистические свойства (мат.ожидание и дисперсия) одинаковы на всем протяжении ряда. В противном случае ряд называется нестационарным. Прежде чем приступить к построению модели ряда, его стараются привести к стационарному. При исследовании временного ряда ищут ответы на несколько вопросов. Является ли ряд случайным? Содержит ля временной ряд тренд и сезонную компоненту? Является ли временной ряд стационарным? Для ответа используется аппарат корреляционного анализа. Корреляция характеризует степень статистической взаимосвязи между элементами данных. Если взаимосвязь между элементами присутствует, то данные называются коррелированными. Когда определяется степень статистической взаимосвязи между значениями одного временного ряда, имеет место автокорреляция. В этом случае вычисляется корреляция между временным рядом и его копией, сдвинутой на один или несколько временных отсчетов. Смысл корреляционного анализа заключается в следующем. Детерминированная составляющая характеризуется плавными изменениями значений ряда, т.е. соседние значения ряда не должны сильно отличаться, и, следовательно, между ними присутствует сильная зависимость. Если значения ряда в большей степени обусловлены случайной составляющей и соседние значения могут существенно отличаться друг от друга, то корреляция будет меньше. Пример. Пусть дан ряд, который содержит последовательность ежемесячных наблюдений за продажами. Месяц Продажи Январь 125 Февраль 130 Март 140 Апрель 132 Май 145 Июнь 150 Июль 148 Август 155 Сентябрь 157 Октябрь 160 Ноябрь 158 Декабрь 165

5 Для того, чтобы вычислить автокорреляцию ряда, будем использовать его копию, сдвинутую в сторону запаздывания на определенное количество отсчетов. X X i X i X i-n 125 Для определения степени взаимной зависимости элементов ряда используется коэффициент автокорреляции r k, где k количество отсчетов, на которое был сдвинут временной ряд при вычислении данного коэффициента. r k = n i= k+ 1 (x i x)(x (n k) σ i k 2 x x) где x i значение i-го отсчета, x i-k наблюдение x i со сдвигом на k временных отсчетов, x - - среднее значение ряда, σ -- дисперсия ряда. 2 x Коэффициент корреляции изменяется в диапазоне [-1,1], где r k =1 указывает на полную корреляцию Если рассчитать коэффициенты корреляции для каждого сдвига, получим последовательность коэффициентов, называемую автокорреляционной функцией (АКФ). Результаты расчета АКФ для ряда X. k r k Автокорреляционная функция временного ряда Значение коэффициента автокорреляции при нулевом сдвиге равно 1, поскольку ряд полностью коррелирован с самим собой. Также наблюдается высокая степень корреляции r k >0.8 при сдвиге менее чем на 4 временных отсчета и умеренная при r k для 5-7 отсчетов. Затем корреляция быстро падает. Т.о., можно сделать вывод о высокой степени зависимости между соседними значениями данного временного ряда. Данный вывод подтверждается визуальным исследованием ряда: в нем присутствует небольшой линейный положительный тренд, отсутствует сезонная компонента, а достаточно высокая гладкость позволяет выдвинуть предположение о малой величине случайной

6 составляющей. Все это хорошо согласуется с выводами, сделанными на основе корреляционного анализа. Для произвольного временного ряда, корреляционный анализ позволяет придти к следующим заключениям: Если ряд содержит тренд, то коэффициент автокорреляции значителен для первых нескольких сдвигов ряда, а в дальнейшем убывает до нуля Если действие случайной компоненты велико, то коэффициенты автокорреляции для любого значения сдвига будут близки к нулю. Случайный ряд и его АКФ Если ряд содержит сезонную компоненту, то коэффициент автокорреляции будет большим для значений сдвига, равных периоду сезонной составляющей или кратных ему. Ряд с сезонной компонентой и его АКФ

7 Таким образом, корреляционный анализ позволяет выявить в ряду тренд и сезонную компоненту, а также определять, насколько поведение ряда обусловлено его случайной компонентой. Знание данных свойств временного ряда помогает строить более адекватные модели и выбирать методы прогнозирования Модели прогнозирования Главный инструмент прогнозирования в современной бизнес-аналитике прогностические модели. Обобщенная модель прогноза Набор входных переменных x i (i=1,n) исходные данные для прогноза. Набор выходных переменных y j (j=1,m) набор прогнозируемых величин, n>m. Когда решается задача прогнозирования временного ряда, описывающего динамику изменения некоторого бизнес-процесса, входные значения наблюдения за развитием процесса в прошлом, а выходные прогнозируемые значения процесса в будущем. При этом временные интервала прошлых наблюдений и временные интервалы, по которым требуется получить прогноз, должны соответствовать друг другу. «Наивная» модель прогнозирования Предполагает, что последний период прогнозируемого временного ряда лучше всего описывает будущее этого ряда. Простейшая модель y(t+1)=x(t), где x(t) последнее наблюдаемое значение, y(t+1) прогноз. Чтобы модель учитывала наличие возможных трендов, ее можно несколько усложнить, например преобразовав к виду y(t+1)=x(t)+ или y(t+1)=x(t). При необходимости учета сезонных колебаний модель модифицируется следующим образом: y(t+1)=x(t-s), где s показатель, учитывающий сезонные изменения прогнозируемого временного ряда. Экстраполяция Если значения функции f(x) известны в некотором интервале , то целью экстраполяции является определение наиболее вероятного значения в точке x n+1. Экстраполяция применима только в тех случаях, когда функция f(x), а соответственно и описываемый ей временной ряд, достаточно стабильна и не подвержена резким изменениям.

8 Наиболее популярный метод экстраполяции в настоящее время экспоненциальное сглаживание. Основной его принцип заключается в том, чтобы учесть в прогнозе все наблюдения, но с экспоненциально убывающими весами. Метод позволяет принять во внимание сезонные колебания ряда и предсказать поведение трендовой составляющей. Например, в случае ряда с «нулевым» трендом, можно выбрать следующую модель экспоненциального сглаживания y(t+1)= λ y(t)+(1-λ) x(t), \где x(t) последнее наблюдаемое значение, y(t) прогноз на момент времени t, y(t+1) прогноз на момент времени t+1. 0< λ<1 параметр сглаживания или параметр адаптации, характеризующий меру обесценивания наблюдения за единицу времени. Инструментом прогноза является модель, первоначальная оценка параметра λ производится по нескольким первым наблюдениям. На ее основе делается прогноз, который сравнивается с фактическими наблюдениями. Далее модель корректируется в соответствии с величиной ошибки прогноза и вновь используется для прогнозирования следующего уровня, вплоть до исчерпания всех наблюдений. Таким образом, она постоянно «впитывает» новую информацию, приспосабливается к ней, и к концу периода наблюдения отображает тенденцию, сложившуюся на текущий момент. Прогноз получается как экстраполяция последней тенденции. Прогнозирование методом среднего и скользящего среднего Наиболее простая модель этой группы обычное усреднение набора наблюдений прогнозируемого ряда y(t+1)=(x(t)+x(t-1)+x(t-2)+ +x(1))/t. При усреднении сглаживаются резкие изменения и выбросы данных, что делает результаты прогноза более устойчивыми к изменчивости ряда, но в целом эта модель прогноза так же примитивна как «наивная». В формуле прогноза на основе среднего предполагается, что ряд усредняется по всем наблюдениям, но старые значения временного ряда могли формироваться на основе иных закономерностей и утратить актуальность. Чтобы повысить точность прогноза, можно использовать «скользящее среднее» y(t+1)=(x(t)+x(t-1)+x(t-2)+ +x(t-t))/(t+1), т.е. модель «видит» прошлое на Т отсчетов времени и прогноз строится только на этих наблюдениях. Иногда метод скользящего среднего оказывается даже эффективнее чем методы, основанные на долговременных наблюдениях. Регрессионные модели Один из методов прогнозирования временных рядов определение факторов, которые влияют на каждое значение временного ряда. Для этого выделяется каждая компонента временного ряда, вычисляется ее вклад в общую

9 составляющую, а затем на его основе прогнозируются будущие значения временного ряда. Данный метод получил название декомпозиции временного ряда. Исходный временной ряд представляется как композиция тренда, сезонной и циклической компоненты. Для построения прогноза выполняется выделение этих компонент из ряда, т.е. разложение ряда по компонентам. Рассмотрим прогнозирование методом декомпозиции с помощью тренда. Если тренд линейный, что типично для многих реальных временных рядов, то он представляет собой прямую линию, описываемую уравнением y=a+b t, где y значение ряда, a и b коэффициенты, определяющие расположение и наклон линии тренда, t время. Если уравнение линии тренда известно, то с его помощью можно рассчитать значение тренда в любой момент времени y t+k =a+b(t +k), где t начало прогноза, k горизонт прогноза. При использовании сезонности для прогнозирования методом декомпозиции сначала из временного ряда убирается тренд и сглаживается возможная циклическая компонента. Тогда можно считать, что оставшиеся данные будут обусловлены в основном сезонными колебаниями. На основе этих данных вычисляются так называемые сезонные индексы, которые характеризуют изменения временного ряда во времени. Например, временной ряд содержит наблюдения по месяцам в течение года. Сезонный индекс, равный 1, будет установлен для месяца, ожидаемое значение в котором составляет 1/12 от общей суммы по месяцам. Если для некоторого месяца устанавливается индекс 1.2, то ожидаемое значение для этого месяца составляет 1/12+20%, а если 0.8 то 1/12-20% и т.д. Ясно, что сумма сезонных индексов за год должны равняться 12. Использовать сезонность для прогнозирования можно тогда, когда сезонные колебания имеют хорошую повторяемость.


ПРАКТИЧЕСКАЯ РАБОТА 2 ИСПОЛЬЗОВАНИЕ МЕТОДА СКОЛЬЗЯЩЕЙ СРЕДНЕЙ В ПРОГНОЗИРОВАНИИ Цель работы: научиться строить тренд временного ряда на основе метода скользящей средней. Содержание работы: 1. Суть метода

ЛЕКЦИЯ 7 ДИНАМИЧЕСКИЕ МОДЕЛИ ОЦЕНИВАНИЕ МОДЕЛЕЙ С РАСПРЕДЕЛЕННЫМИ ЛАГАМИ ВРЕМЕННЫЕ РЯДЫ (ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ) Эконометрические модели, которые в качестве регрессоров включают лаговые переменные, относятся

Лекция 12. Введение в анализ временных рядов Виды временных рядов. Требования, предъявляемые к исходной информации Статистическое описание развития экономических процессов во времени осуществляется с помощью

РАЗДЕЛ. ВРЕМЕННЫЕ РЯДЫ. АНАЛИЗ И ПРОГНОЗ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ ПО ИХ ВРЕМЕННЫМ РЯДАМ... ВРЕМЕННОЙ РЯД (ОПРЕДЕЛЕНИЯ, ПРИМЕРЫ, ФОРМУЛИРОВКА ОСНОВНЫХ ЗАДАЧ... СТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ И ИХ ОСНОВНЫЕ

ТЕМА 4. АВТОКОРРЕЛЯЦИЯ УРОВНЕЙ ВРЕМЕННОГО РЯДА И ВЫЯВЛЕНИЕ ЕГО СТРУКТУРЫ При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих.

1. Общий анализ временного ряда. 1.1. Проверка гипотезы о случайности временного ряда. График временного ряда изучаемого показателя «Среднедушевые денежные доходы» изображен на рис. «Доходы населения».

Методология Box Jenkins (BJ) или модели AR(I)MA. Модель авторегрессии AR(p). Модель скользящего среднего MA(q). Модель авторегрессии AR(p) Целью эконометрического моделирования часто является так называемое

Эконометрическое моделирование Лабораторная работа 8 Анализ временных рядов Оглавление Понятие и виды временных рядов... 3 Прогнозирование экономических показателей на основе экстраполяции тренда... 3

Методология Box Jenkins (BJ) или модели AR(I)MA. Модель авторегрессии AR(p). Модель авторегрессии MA(q). Целью эконометрического моделирования часто является так называемое ou-of-sample предсказание, т.е.

Тема 10. Ряды динамики и их применение в анализе социально-экономических явлений. Изменение социально-экономических явлений во времени изучается статистикой методом построения и анализа динамических рядов.

МВДубатовская Теория вероятностей и математическая статистика Лекция 4 Регрессионный анализ Функциональная статистическая и корреляционная зависимости Во многих прикладных (в том числе экономических) задачах

УДК 338.4 ПРОГНОЗИРОВАНИЕ ОБЪЕМОВ ПРОДАЖ В МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ 8 Ю.С. Чуйкова, Б.А. Горлач Ключевые слова: товарные запасы, управление запасами, прогноз продаж, сезонность, тренд, сезонная волна,

АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА ПРИ ПРАВИТЕЛЬСТВЕ РФ Институт Бизнеса и Делового Администрирования Примеры использования дополнительных надстроек MS Excel Анализ модельных временных рядов с помощью надстройки

Абдиев Б.А. «Эконометрика» Предназначено для студентов специальности: Финансы, вечернее отделение (2 курс 4г.о.) Учебный год: 2015-2016 Текст вопроса 1 Парная регрессия у=а+вх+е представляет собой регрессию

55 3 РЕГРЕССИОННЫЙ АНАЛИЗ 3 Постановка задачи регрессионного анализа Экономические показатели функционирования предприятия (отрасли хозяйства) как правило представляются таблицами статистических данных:

ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА ПОНЯТИЕ КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО АНАЛИЗА Для решения задач экономического анализа и прогнозирования очень часто используются статистические, отчетные или наблюдаемые

1. Тема: Предпосылки МНК, методы их проверки Предпосылками метода наименьших квадратов (МНК) являются следующие функциональная связь между зависимой и независимой переменными присутствие в эконометрической

ПЛАН-КОНСПЕКТ. ТЕМА 5. МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ СВЯЗЕЙ Вопросы: 1. Сущность математико-статистических методов изучения связей 2. Корреляционный анализ 3. Регрессионный анализ 4. Кластерный

46 Глава 9. Регрессионный анализ 9.. Задачи регрессионного анализа Во время статистических наблюдений как правило получают значения нескольких признаков. Для простоты будем рассматривать в дальнейшем двумерные

Порядок выполнения работы. На основе имеющихся данных о производстве продукции за N лет рассчитать следующие величины: темпы прироста производства, производительность труда, производительность капитала.

Динамика рождаемости по Чувашской республике Содержание Введение 1. Общая тенденция рождаемости населения Чувашской республики 2. Основная тенденция рождаемости 3. Динамика рождаемости городского и сельского

3, 01 Г. В. Жукова Ìàòåìàòè åñêèå ìåòîäû èíâåñòèöèîííîãî ïëàíèðîâàíèÿ Аннотация: в данной статье рассмотрены основные математические методы, позволяющие получить прогнозные оценки развития тех или иных

Литература 1. Ханк Д.Э., Уичерн Д.У., Райтс А.Дж. Бизнес-прогнозирование, 7-е издание М.: Изд. Дом «Вильямс», 2003 2. Дуброва Т.А. Статистические методы прогнозирования/м. : ЮНИТИ- ДАНА, 2003 3. Вуколов

План лекций 1 семестр 1. Введение. 1.1. Предмет, метод и задачи статистики; источники статистической информации. 1.2. Кратка история развития статистики. Структура статистических органов на современном

Ср. температура 0 0,97789784683 Ср. осадки 0 0,893300077 Ср.температура/Осадки- 0,005975564 Данные, приведенные в табл. 4 показывают, что наиболее сильные корреляционные связи наблюдаются для среднегодовых

1 (64), 2012/ 33 The offered and realized additive model of calculation of specific norm of consumption of scrap metal at arc electric steel-smelting furnaces has allowed to reduce considerably the error

РЯДЫ ДИНАМИКИ КЛАССИФИКАЦИЯ Ряд динамики (РД), хронологический ряд, динамический ряд, временной ряд это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития

Прогнозирование в Excel методом скользящего среднего доктор физ. мат. наук, профессор Гавриленко В.В. ассистент Парохненко Л.М. (Национальный транспортный университет) Теоретическая справка. При моделировании

Контрольные тесты по дисциплине «Эконометрика» Первая главная компонента A. Содержит максимальную долю изменчивости всей матрицы факторов. B. Отражает степень влияния первого фактора на результат. C. Отражает

Алеткин П.А., Кожемякова В.В., Шайдуллина Л.И. Прогнозирование доходов и расходов предприятия на основе мультипликативной модели временных рядов В данной практической статье авторами рассмотрено применение

6 целей инвестирования в ИТ (опрос) Повышение эффективности операционной деятельности Новые товары, услуги, бизнес-модели Тесные контакты с покупателями и поставщиками Поддержка принятия решений Конкурентные

Лекция 5. Элементы теории корреляции.. Функциональная, статистическая и корреляционная зависимости. Две случайные величины могут быть связаны функциональной зависимостью, т.е. изменение одной из них по

АВТОМАТИЗАЦИЯ ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ Т. А. Заяц УО «Белорусский торгово-экономический университет потребительской кооперации», г. Гомель В современных экономических условиях планирование и управление

УДК 519.862. Физико-математические науки Летова Марина Сергеевна, студентка Факультет прикладной математики и механики, Федеральное государственное бюджетное образовательное учреждение высшего профессионального

Автокорреляция в остатках. Критерий Дарбина-Уотсона. Бондар Е. В. Филиал Федерального государственного автономного образовательного учреждения высшего образования «Южный федеральный университет» в г. Новошахтинске

ЗАДАЧИ И МЕТОДЫ ПРОГНОЗИРОВАНИЯ В ГОРНОМ ДЕЛЕ Прогнозирование событий, и в частности, последствий разработки полезных ископаемых, чрезвычайно сложное дело из-за взаимосвязанности процессов в биосфере.

Лекция 8 Тема Сравнение случайных величин или признаков. Содержание темы Аналогия дискретных СВ и выборок Виды зависимостей двух случайных величин (выборок) Функциональная зависимость. Линии регрессии.

11. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ ОБУЧАЮЩИХСЯ ПО ОСВОЕНИЮ ДИСЦИПЛИНЫ. Приступая к изучению дисциплины, студенту необходимо внимательно ознакомиться с тематическим планом занятий, списком рекомендованной литературы.

Алеткин П.А., Кожемякова В.В., Шайдуллина Л.И. Прогнозный анализ доходов и расходов от обычных видов деятельности с помощью построения аддитивной модели временного ряда В данной практической статье авторами

Линейная корреляционная зависимость Часто на практике требуется установить вид и оценить силу зависимости изучаемой случайной величины Y от одной или нескольких других величин (случайных или неслучайных).

Кафедра экономики и управления Статистика Учебно-методический комплекс для студентов ФСПО, обучающихся с применением дистанционных технологий Модуль 6 Ряды динамики Составитель: Ст. преподаватель Е.Н.

Иткин В.Ю. Модели ARMAX Семинар 4. Временные ряды. Автокорреляционная функция 4.1. Пример временного ряда Рассмотрим пример: серия измерений давления газа на выходе из абсорбера на УКПГ. На первый взгляд,

Лекция 5 ЭКОНОМЕТРИКА 5 Проверка качества уравнения регрессии Предпосылки метода наименьших квадратов Рассмотрим модель парной линейной регрессии X 5 Пусть на основе выборки из n наблюдений оценивается

Регрессионный анализ регрессионный анализ -введение коэффициент корреляции степень связи в вариации двух переменных величин (мера тесноты этой связи) метод регрессии позволяет судить как количественно

Тема 2.3. Построение линейно-регрессионной модели экономического процесса Пусть имеются две измеренные случайные величины (СВ) X и Y. В результате проведения n измерений получено n независимых пар. Перед

7 (35) 008 Рынок ценных бумаг Применение анализа временных рядов в стратегии инвестора и торговой системе трейдера Е.Е. Лещенко Кафедра менеджмента инвестиций и инноваций Российской экономической академии

Задачи для текущего контроля Задача 1 Администрация банка изучает динамику депозитов физических лиц за ряд лет (млн долл. в сопоставимых ценах). Исходные данные представлены ниже: Сумма Время, лет 1 2

3.4. СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ВЫБОРОЧНЫХ ЗНАЧЕНИЙ ПРОГНОЗНЫХ МОДЕЛЕЙ До сих пор мы рассматривали способы построения прогнозных моделей стационарных процессов, не учитывая одной весьма важной особенности.

НАУЧНЫЙ ВЕСТНИК ИЭП им Гайдарару 5 ПРОГНОЗИРОВАНИЕ В ПЕРИОДЫ ЭКОНОМИЧЕСКОЙ НЕСТАБИЛЬНОСТИ: СУЩЕСТВУЮТ ЛИ ПРОСТЫЕ СПОСОБЫ УЛУЧШЕНИЯ КАЧЕСТВА ПРОГНОЗОВ МТурунцева зав лабораторией ИЭП им ЕТ Гайдара и РАНХиГС

Управление производством УДК 631.15:338.27 ПРОГНОСТИЧЕСКИЕ МЕТОДЫ В УПРАВЛЕНИИ ПРОИЗВОДСТВОМ ЗЕРНОВЫХ КУЛЬТУР Е. Г. НИКИТЕНКО, аспирант кафедры менеджмента Е-mail: [email protected] Ставропольский государственный

Новые возможности программы ФемтоСкан Советы и рекомендации Выпуск 003 Волшебство корреляционного анализа. Часть 1. В сканирующей зондовой микроскопии, и в первую очередь в сканирующей туннельной микроскопии,

36 УДК 68.3.068 А.Ю. СОКОЛОВ, О.С. РАДИВОНЕНКО, Т.В. КОРЧАК Национальный аэрокосмический университет им. Н. Е. Жуковского ХАИ, Украина МЕТОДЫ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ ВСПЫШЕК ЭПИДЕМИЙ

Эконометрическое моделирование Лабораторная работа 7 Анализ остатков. Автокорреляция Оглавление Свойства остатков... 3 1-е условие Гаусса-Маркова: Е(ε i) = 0 для всех наблюдений... 3 2-е условие Гаусса-Маркова:

Трансформация упорядоченных данных Многие аналитические задачи, например прогнозирование, анализ продаж, динамики спроса, состояния бизнес-объектов и других протяженных во времени процессов, связаны

Эконометрическое моделирование Лабораторная работа Корреляционный анализ Оглавление Понятие корреляционного и регрессионного анализа... 3 Парный корреляционный анализ. Коэффициент корреляции... 4 Задание

ЛЕКЦИЯ Сообщения, сигналы, помехи как случайные явления Случайные величины, вектора и процессы 4 СИГНАЛЫ И ПОМЕХИ В РТС КАК СЛУЧАЙНЫЕ ЯВЛЕНИЯ Как уже отмечалось выше основная проблематика теории РТС это

УДК 674.093 ЭВОЛЮЦИЯ ТРЕНДА И ВНУТРИГОДОВОЙ ДИНАМИКИ КИСЛОТНОСТИ ОСАДКОВ, ВЫПАДАЮЩИХ В ТВЕРИ Ф. В. Качановский В предыдущих публикациях автора рассмотрены различные аспекты проблемы кислотности атмосферных

"УТВЕРЖДАЮ" Заместитель Председателя Правления ОАО "СО ЦДУ ЕЭС" Н.Г. Шульгинов 4 декабря 2007 г. Методика прогнозирования графиков электропотребления для технологий краткосрочного планирования 2007 Содержание.

Корреляционный анализ. Корреляционно-регрессионный анализ выполняется на основе анализа эмпирических данных. Методы такого анализа являются составной частью эконометрики, которая устанавливает и исследует

ЛАБОРАТОРНАЯ РАБОТА N o.1 СЛОЖЕНИЕ ОДНОНАПРАВЛЕННЫХ И ВЗАИМНО ПЕРПЕНДИКУЛЯРНЫХ КОЛЕБАНИЙ Цель работы Целью работы является практическое ознакомление с физикой гармонических колебаний, исследование процесса

Лекция. Основные показатели динамики экономических явлений На практике для количественной оценки динамики явлений широко применяются следующие основные аналитические показатели: абсолютные приросты; темпы

УДК 330.42 Экономические науки Харитонова Дарья Евгеньевна, студентка кафедры прикладной математики, специальность «Математическое и информационное обеспечение экономической деятельности», ФГБОУ ВО «Пермский

Привет.
Я хочу рассказать об одной задаче, которая очень заинтересовала меня в свое время, а именно, о задаче прогнозирования временных рядов и решении этой задачи методом муравьиного алгоритма.

Для начала вкратце о задаче и о самом алгоритме:

Прогнозирование временных рядов подразумевает, что известно значение некой функции в первых n точках временного ряда. Используя эту информацию необходимо спрогнозировать значение в n+1 точке временного ряда. Существует множество различных методов прогнозирования, но на сегодняшний день одними из самых распространенных являются метод Винтерса и ARIMA модель. Подробнее о них можно почитать .

О том что такое муравьиный алгоритм говорилось уже довольно много. Для тех кому лень лезть, например, сюда , перескажу. Вкратце, муравьиный алгоритм это моделирование поведения муравьиной колонии в их стремлении найти кратчайший путь к источнику еды. Муравьи, при движении оставляют за собой след феромона, который влияет на вероятность выбора муравьем данного пути. Учитывая то, что муравьи будут за один и тот же промежуток времени пройти короткий путь бОльшее количество раз, на нем будет оставаться больше феромона. Таким образом, с течением времени, все больше муравьев будут выбирать кратчайший путь к источнику пищи.
Для наглядности, вставлю картинку:

Теперь, перейдем непосредственно к решению задачи прогнозирования методом муравьиных колоний.
Первая проблема с которой мы сталкиваемся - необходимо представить временной ряд в виде графа, на котором будем запускать муравьиный алгоритм.
Было найдено два возможных решения:
1. Представить временной ряд в виде мультиграфа где из каждой точки временного ряда можно перейти в каждую набором определенных приростов. (Для облегчения задачи будем брать нормализованные значения на промежутке от -1 до 1). Это был первый подход, который мы попробовали. Он показал неплохой результат на временных рядах малой размерности, но с увеличением размерности стала резко падать как точность прогноза, так и производительность, поэтому от этого варианта отказались.
2. Представить временной ряд в виде набора сцепленых графов, где каждый граф отвечает за свою величину прироста значения временного ряда. иначе говоря, имеем граф который отвечает за прирост -1, -0,9… и так до 1. Шаг, естественно, можно уменьшить, или увеличить, что скажется на точности прогноза и ресурсоемкости задачи.(в конечном итоге этот вариант оказался наиболее удачным.)

На этом наборе сцепленных графов, запускался муравьиный алгоритм(на каждом графе свой), который откладывал феромон на ребрах, соответствующих известным значениям временного ряда. Причем, при откладывании феромона на графе i, феромон также откладывался на графах i-1и i+1, но в гораздо меньшем количестве(в нашем случае 1/10 от базового количества феромона) таким образом, муравьи выделяли наиболее часто встречающиеся последовательности прироста значения временного ряда, а за счет откладывания феромона на смежные графы, нивелировалась возможная погрешность и изначальная зашумленность временного ряда.

Данный алгоритм мы тестировали на искусственно подготовленных временных рядах с разным уровнем периодичности и шума. Результат получился двояким. С одной стороны, при уровнях шума до 0,3 алгоритм показывает высокие результаты прогноза, сравнимые с результатами ARIMA модели. На более высоких уровнях шума возникает большой разброс результатов: прогноз то очень точный, то совершенно неправильный.

В настоящий момент мы работаем над подбором оптимального значения параметров алгоритма и некоторыми методами его улучшения, о которых я напишу как только они будут в достаточной степени проверены.

Спасибо всем за внимание.

Upd: Постараюсь ответить на возникшие вопросы.
Мультиграф - это граф, каждая вершина которого соединена с каждой.

Хаотические ряды, как уже писали ниже, не случайны. Вы можете посмотреть на изображения ряда Лоренца в 3-х мерном пространстве и увидите цикличность движения. Просто определить эту цикличность сложно, и на первый взгляд ряд выглядит случайным.

Значения временного ряда нормализуются на промежутке -1...1 и записываются в граф. Граф - в данном случае таблица переходов из вершины в вершину. Феромон откладывается на ребра(в ячейки таблицы).

В случае со сцепленными графами используется несколько таблиц, каждая из которых отвечает только за свою величину перехода.

В зависимости от количества феромона в той, или иной ячейке, выбирается то, или иное значение временного ряда, как результат прогноза.

Алгоритм тестировали, преимущественно, на ряде Лоренца.

На данный момент рано говорить о том насколько он лучше или хуже. Похоже, что алгоритм подвержен нахождению псевдопериодов и с ростом уровня шума количество ложных периодов возрастает.
С другой стороны, при удачно подборе параметров точность прогноза достаточно высокая(отклонение до 7-10 процентов, что для хаотического ряда неплохо.)

К тестированию на реальных данным перейдем позже. Картинки постараюсь подготовить и добавить в ближайшее время.

Спасибо за внимание.

Данные за прошлые периоды можно использовать для прогнозирования.

Множество данных, где время является независимой переменной, называется временным рядом .

Общее изменение со временем результативного признака называется трендом . Мы рассмотрим модели линейного тренда , то есть параметры тренда модно рассчитать с помощью модели линейной регрессии.

Сезонная вариация – это повторение данных через небольшой промежуток времени. Под «сезоном» можно понимать день, и неделю, и месяц, и квартал. Если же промежуток времени будет длительным, то это – циклическая вариация . Мы остановимся на изучении данных для небольших интервалов времени, поэтому циклическую вариацию исключим из рассмотрения.

Сначала на основании прошлых данных определяется сезонная вариация. Исключив сезонную вариацию (проведя так называемую десезонализацию данных ), с помощью модели линейной регрессии находим уравнение тренда. По уравнению тренда и прошлым данным вычисляем величины ошибок. Это среднее абсолютное отклонение
, где - это разность фактического и прогнозного значений в момент времениt , n – число наблюдений.

Анализ аддитивной модели.

Для аддитивной модели фактическое значение фактическое значение A = трендовое значение T + сезонная вариация S + ошибка E .

Пример 50 . Предположим, что нам известен объем прожаж (тыс. руб.) за последние 11 кварталов. Дадим на основании этих данных прогноз объема продаж на следующие два квартала.

Номер квартала

Объем продаж

Оценка сезонной вариации

Заполним следующую таблицу. Оценки сезонной вариации запишем под соответствующим номером квартала году. В каждом столбце вычисляем среднее значение оценок сезонной вариации = (сумма чисел в столбце)/ (количество чисел в столбце). Результат запишем в строке «Среднее» (округления взяты до одной цифры после запятой). Сумма чисел в строке «Среднее» = -1.

Скорректируем значения в строке «Среднее», чтобы общая сумма была равна 0. Это необходимо, чтобы усреднить значения сезонной вариации в целом за год. Корректирующий фактор вычисляется следующим образом: сумма оценок сезонных вариаций (-1) делится на число кварталов в году (4). Поэтому из каждого числа этой строки нужно вычесть -1/4= -0,25. Так как у нас округления до одной цифры после запятой, то из нечетных столбцов вычтем -0,3, а из четных столбцов вычтем -0,2. В последней строке получены значения сезонной вариации для соответствующего квартала года.

Номер квартала в году

Номер квартала

Объем продаж

Сезонная вариация

A - S = T + E

Уравнение линии тренда T = a + b * x , где - номерi - го квартала.

Найдем коэффициенты a и b

где - номерi - го квартала, а - значение сезонной вариацииi - го квартала.

Номер квартала

x 2

a =1,9 и b =1,1.

T = 1,9+ 1,1 x .

i

, где - объем продаж,- сезонная вариация,- трендовое значение вi -ом квартале.

i x

Составим таблицу

Объем продаж A

Десезонализированный объем продаж A - S = T + E

Трендовое значение

Ошибка

И среднеквадратическая ошибка

Прогноз объема продаж в 12-м квартале: (1,9+1,1*12)+(-0,9)=14,2 тыс.руб.

Прогноз объема продаж в 13-м квартале: (1,9+1,1*13)+2=18,2 тыс.руб.

Задача 50. В таблице указан объем продаж (тыс. руб.) за последние 11 кварталов. Дать на основании этих данных прогноз объема продаж на следующие два квартала.

На первом шаге нужно исключить влияние сезонной вариации. Воспользуемся методом скользящей средней. Заполним таблицу.

Номер квартала

Объем продаж

Скользящая средняя за 4 квартала

Центрированная скользящая средняя

Оценка сезонной вариации

1 год = 4 квартала. Поэтому найдем среднее значение объема продаж за 4 последовательных квартала. Для этого нужно сложить 4 последовательных числа из 2-го столбца (объем продаж), эту сумму умножить на 4 (количество слагаемых) и результат записать в 3-й столбец напротив 3-го слагаемого.

Если при заполнении 3-го скользящая средняя вычислялась для четного числа сезонов, то вычисляется центрированная скользящая средняя по следующему правилу: полусумму двух соседних чисел из 3-го столбца запишем в четвертый столбец напротив верхнего из них. В противном случае (если скользящая средняя вычислялась для нечетного числа сезонов) центрированную скользящую среднюю вычислять не надо.

5-й столбец (оценка сезонной вариации) – это разность объема продаж и скользящей средней, в случае если последняя вычислялась для нечетно числа сезонов или разность объема продаж и центрированной скользящей средней в противном случае.

Заполним следующую таблицу. Оценки сезонной вариации запишем под соответствующим номером квартала году. В каждом столбце вычисляем среднее значение оценок сезонной вариации = (сумма чисел в столбце)/ (количество чисел в столбце). Результат запишем в строке «Среднее» (округления взяты до одной цифры после запятой). Сумма чисел в строке «Среднее» .

Скорректируем значения в строке «Среднее», чтобы общая сумма была равна 0. Это необходимо, чтобы усреднить значения сезонной вариации в целом за год. Корректирующий фактор вычисляется следующим образом: сумма оценок сезонных вариаций. Поэтому из каждого числа этой строки нужно вычесть = 0,593. В последней строке получены значения сезонной вариации для соответствующего квартала года.

Номер квартала в году

Скорректированная сезонная вариация

Исключим сезонную вариацию из фактических данных. Проведем десезонализацию данных.

Номер квартала

Объем продаж

Сезонная вариация

Десезонализированный объем продаж

A - S = T + E

Из чисел 2-го столбца вычитаем числа 3-го столбца и результат пишем в 4-м столбце.

Уравнение линии тренда T = a + b * x , где - номерi - го квартала.

Найдем коэффициенты a и b по данным следующим формулам:

где - номерi - го квартала, а - значение сезонной вариацииi - го квартала.

Для упрощения расчетов по указанным формулам заполним таблицу

Номер квартала

x 2

Подставляя соответствующие данные из таблицы в приведенные выше формулы получим: a =1,97 и b =1,12.

Итак, уравнение тренда запишется так T = 1,97+ 1,12 x .

Теперь займемся расчетом ошибок.

Для этого необходимо найти величины - разность фактического и прогнозного значения вi -ом квартале по следующей формуле:

, где - объем продаж,- сезонная вариация,- трендовое значение вi -ом квартале.

Чтобы вычислить трендовое значение в i -ом квартале воспользуемся соответствующей формулой приведенной выше подставляя в нее вместо x номер соответствующего квартала.

Составим таблицу

Объем продаж A

Десезонализированный объем продаж A - S = T + E

Трендовое значение

Ошибка

Среднее абсолютное отклонение и среднеквадратическая ошибка . Мы видим, что ошибки достаточно велики. Это скажется на качестве прогноза.

Дадим прогноз объема продаж на следующие два квартала.

прогноз = трендовое значение + скорректированная сезонная вариация.

Мы считаем, что тенденция, выявленная по прошлым данным, сохранится и в ближайшем будущем. Подставляем номера кварталов в формулу и учитываем скорректированную сезонную вариацию. T = 1,97+ 1,12 x .

Прогноз объема продаж в 12-м квартале: (1,97+1,12*12)+(-0,453)=14,957 тыс.руб.

Прогноз объема продаж в 13-м квартале: (1,97+1,12*13)+ 1,047=17,577 тыс.руб.

Международный консорциум «Электронный университет»

Московский государственный университет экономики, статистики и информатики

Евразийский открытый институт

Н. А. Садовникова Р. А. Шмойлова

Анализ временных рядов и прогнозирование

Учебное пособие Руководство по изучению дисциплины

Практикум

Тесты Учебная программа

Москва 2004

С 143

Садовникова Н. А., Шмойлова Р.А. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ И ПРОГ-

НОЗИРОВАНИЕ. Вып. 2: Учебное пособие, руководство по изучению дисциплины, практикум, тесты, учебная программа / Московский государственный университет экономики, статистики и информатики. - М., 2004. - 200 с.

1.1. Система статистических понятий и категорий, применяемых в моделировании и прогнозировании социально-экономических

явлений и процессов...............................................................................................

1.2. Модель как отображение действительности........................................................

1.3. Понятие и основные принципы экономико-статистического анализа..............

1.4. Характеристика информационной базы и основные принципы

ее формирования.....................................................................................................

РАЗДЕЛ II. Моделирование динамики социально-экономических явлений

2.1. Временные ряды, их характеристики и задачи анализа.

Требования к исходной информации. ..................................................................

2.2. Основные особенности статистического анализа одномерных

временных рядов по компонентам ряда. ..............................................................

Моделирование тенденции....................................................................................

Выбор формы тренда..............................................................................................

Моделирование случайного компонента.............................................................

Модели периодических колебаний.......................................................................

2.7. Модели связных временных рядов.......................................................................

КОНТРОЛЬНЫЕ ВОПРОСЫ К РАЗДЕЛУ II.....................................................................

РАЗДЕЛ III. Прогнозирование динамики социально-экономических явлений

и процессов....................................................................................................

3.1. Сущность и классификация статистических прогнозов.....................................

Простейшие методы прогнозирования.................................................................

3.3. Прогнозирование на основе экстраполяции тренда............................................

3.4. Прогнозирование с учетом дисконтирования информации...............................

3.5. Прогнозирование на основе кривых роста...........................................................

3.6. Прогнозирование рядов динамики, не имеющих тенденции.............................

3.7. Оценка точности и надежности прогнозов..........................................................

КОНТРОЛЬНЫЕ ВОПРОСЫ К РАЗДЕЛУ III ...................................................................

ТЕСТЫ ДЛЯ САМОПРОВЕРКИ.........................................................................................

КОНТРОЛЬНАЯ РАБОТА...................................................................................................

Приложения к контрольной работе.....................................................................................

ГЛОССАРИЙ.........................................................................................................................

Заключение.............................................................................................................................

Приложения............................................................................................................................

РУКОВОДСТВО ПО ИЗУЧЕНИЮ ДИСЦИПЛИНЫ.................................................

ПРАКТИКУМ.......................................................................................................................

ТЕСТЫ..................................................................................................................................

УЧЕБНАЯ ПРОГРАММА.................................................................................................

Учебное пособие

ВВЕДЕНИЕ

Введение

Развитие и повышение социально-экономического статуса и положения страны выдвигает на первый план задачу анализа и перспектив развития субъектов рыночных отношений на различных иерархических уровнях управления с целью выбора оптимальных управленческих решений, направленных на повышение эффективности и деловой активности их функционирования.

В этой связи возрастает роль методологии статистического моделирования и прогнозирования состояния, структуры и основных тенденций развития субъектов рыночных отношений вне зависимости от отраслевой принадлежности, форм собственности и внутренней структурной градации.

Учебное пособие «Анализ временных рядов и прогнозирование» включает в себя комплексную методологию моделирования и прогнозирования динамической информации, представленнойвременными рядами социально-экономических явлений и процессов.

В пособии нашло отражение обобщение отечественного и зарубежного опыта использования математико-статистических методов моделирования и прогнозирования со- циально-экономических явлений и процессов.

Важнейшая задача прогнозирования явлений и процессов - выявление закономерностей и установление основных тенденций развития. Для анализа общих тенденций не целесообразно рассматривать каждый случай в отдельности. Чем больше по числу единиц статистическая совокупность, тем, при прочих равных условиях, качественнее проявляется закономерность, присущая изучаемому явлению или процессу.

Устойчивые пропорции в экономических явлениях и процессах проявляются при действии закона больших чисел.

Моделирование и прогнозирование позволяют управлять массовыми экономическими явлениями и процессами и предвидеть их развитие.

Для моделирования и прогнозирования социально-экономических явлений и процессов решающее значение имеет принцип взаимной связи и взаимной обусловленности явлений. Для того, чтобы глубоко понять явление, необходимо изучить внешние и внутренние причинные взаимосвязи, познать конкретное состояние и условия его возникновения и существования.

Общественные явления находятся не только во взаимной связи, но и в непрерывном движении, изменении, развитии - именно это обусловливает необходимость прогнозирования.

Предметом моделирования и прогнозирования в сфере бизнеса является система, воспроизводящая объект исследования так, что на ее основе могут быть изучены структура и размещение социально-экономических явлений, их изменения во времени, связи и зависимости.

При моделировании объект, интересующий исследователя, заменяется некоторым другим объектом, который называется моделью.

Каковы же объективные основания замены одного объекта другим?

Предметы материального мира - целостные системы свойств, связей, отношений, процессов. Закономерная связь элементов является объективной основой моделирования и прогнозирования.

Элементы включены в совокупности не случайно, а закономерно координированы друг с другом, и, если два объекта сходны в каком-то существенном отношении, то они будут сходны и в другом отношении. Отсюда следует, что объектом моделирования и прогнозирования в сфере бизнеса являются статистические совокупности, их численность.

ВВЕДЕНИЕ

РАЗДЕЛ I. Теоретико-методологические аспекты моделирования явлений и процессов в сфере бизнеса

1. 1. Система статистических понятий и категорий, применяемых в моделировании и прогнозировании социально-экономических явлений и процессов

Моделирование и прогнозирование явлений и процессов предполагает использование системы статистических понятий, категорий и методов, трактовка которых углубляется в соответствии с их статистическими особенностями.

К важнейшим понятиям и категориям относится статистическая совокупность, статистическая закономерность, закон больших чисел, статистическая взаимосвязь, а также такие философские категории как качество и количество, мера, явление и сущность, единичное и всеобщее, случайное и необходимое.

Важнейшими методами, используемыми при моделировании социально-экономи- ческих явлений, являются методы статистического наблюдения, группировок, обобщающих показателей, корреляционного и регрессионного анализа и так далее.

Статистическая закономерность выражает конкретные казуальные отношения, она предопределяет типичное распределение единиц статистической совокупности на некоторый моментвремениподвоздействиемвсейсовокупностифакторов.

Условиями ее проявления являются: наличие статистической совокупности и действие закона больших чисел.

Зная статистическую закономерность, можно выявить условия и причины, порождающие ее, для того, чтобы направлять ее действия в заданное «русло», то есть либо поддерживать эти условия для ее устойчивости во времени, либо, меняя их, стремиться получить нужный результат.

Зная статистическую закономерность, можно с той или иной степенью точности предсказать развитие явления, раскрыть сущность и изучить его структуру.

Под статистической совокупностью (множеством) понимается множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояний отдельных единиц и наличием вариации.

Статистические совокупности состоят из элементов, единиц совокупности, которые являются носителем свойств изучаемого явления или процесса.

Признаки бывают существенные и несущественные, прямые и косвенные, атрибутивные и количественные, первичные и вторичные, факторные и результативные, альтернативные.

Классификация статистических признаков имеет важное значение для построения статистических моделей и осуществления прогноза. Так, при моделировании в ряде случаев важно правильно выделить факторные и результативные признаки. Среди факторных признаков необходимо отбирать лишь самые существенные, определяющие основное содержание явлений.

Закон больших чисел выявляет устойчивые пропорции и соотношения в экономических явлениях и процессах. Он служит основой для моделирования процессов, создает возможность управлять ими и предвидеть их развитие.

Закон больших чисел определяет общее, существенное в явлениях, в их массе единиц, благодаря чему происходит взаимоотношение индивидуальных случайных различий.

Итак, моделирование - воспроизведение свойств исследуемого объекта в специально построенной модели. Для этой цели используются такие статистические методы

ГЛАВА I. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ МОДЕЛИРОВАНИЯ ЯВЛЕНИЙ И ПРОЦЕССОВ В СФЕРЕ БИЗНЕСА

как статистическое наблюдение, метод группировок, обобщающих показателей, корреляционный и регрессионный анализ.

С помощью статистического наблюдения и социального эксперимента получают исходную информацию для моделирования и прогнозирования.

Метод группировок устанавливает наличие и направление связи между факторными и результативными признаками. Для объективных заключений о связи необходимо предварительно определить границу, за пределами которой влияние группировочного признака отсутствует.

На основе регрессионного и корреляционного анализа связи получают свое аналитическое выражение, устанавливается теснота связей между факторными и результативными признаками.

Значимость корреляционных характеристик определяется объективными особенностями исследуемой совокупности, а показатели регрессии и корреляции вычисляются как средние величины для совокупности в целом.

1.2. Модель как отображение действительности

Наши представления об окружающей действительности по природе своей являются приближенными копиями объективной реальности.

Термин «модель» отражает как раз эту условность, приблизительность знания об объективной действительности.

Что же такое модель?

В «Философском словаре» дается следующее определение: « Моделирование - воспроизведение свойств исследуемого объекта на специально построенном по определенным правилам аналоге его. Этот аналог называется моделью».

В «Философской энциклопедии» говорится: « Модель - условный образ (изображение, схема, описание) какого-либо объекта (или системы объектов) служит для выражения отношения между человеческими знаниями об объектах и этими объектами».

Таким образом, под моделью понимается условный образ какого-либо объекта, приближенно воссоздающий этот объект. Между объектом и его моделью существуют отношения сходства, условности.

Модель дает возможность установить в каждом явлении, объекте, процессе те основные, главные закономерности, которые присущи этим явлениям.

Отношения объекта и модели устанавливаются на основе объективно присущих оригиналу и модели свойств и отношений.

Прежде всего между моделью и объектом существует отношение соответствия (сходства), которое и позволяет исследовать моделируемый объект посредством изучения модели.

Но модель используется и для получения таких данных об объекте, которые или затруднительно, или невозможно получить путем непосредственного изучения оригинала. Для того, чтобы модель могла выполнить эту задачу, она должна быть не только сходной с оригиналом, но иотличаться от него. Отличие от оригинала - обязательный признак модели.

В процессе моделирования от установления отношений сходства между одними элементами модели и оригинала переходим к установлению отношений сходства между другими элементами оригинала и модели. Именно наличие такого перехода дает возможность получить новые данные об оригинале, о его свойствах, связях и отношениях.

Возможны два направления в моделировании.

ГЛАВА I. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ МОДЕЛИРОВАНИЯ ЯВЛЕНИЙ И ПРОЦЕССОВ В СФЕРЕ БИЗНЕСА

Одно из направлений охватывает множество задач, в которых основное внимание уделено отысканию оптимальных характеристик процесса.

В качестве таких моделей часто выступают модели линейного программирования. Эти модели часто называют экономико-математическими , поскольку их применение связано главным образом с моделированием функциональных зависимостей.

Сущность статистического моделирования состоит в построении для данного явления модели, на основании которой изучается поведение элементов системы и взаимодействие между ними с учетом многих, имеющих случайный характер, факторов. Данное направление включает всебя корреляционный анализ, изучение законов распределения и другие.

Модели, выражающие количественно закономерность, которая проявляется в массе событий, называют экономико-статистическими моделями .

Повышенный интерес, проявляемый в последние годы к статистическим моделям, обусловлен наличием электронно-вычислительных машин, позволяющих обрабатывать большие массивы информации.

Статистические модели можно подразделить на два типа: статистические и временные . В первом случае речь идет об исследовании статистической совокупности. Единицей наблюдения здесь служат отдельные единицы пространственной совокупности, а в качестве статистической информации используются их показатели по состоянию на определенный период времени.

Временная модель рассматривает процесс изменения явления во времени. В качестве единицы наблюдения здесь выступает время, а исходной информацией служат ряды динамики явления и определяющие его факторы.

По своим познавательным функциям статистические модели подразделяются на

структурные, динамические и модели взаимосвязей.

1.3. Понятие и основные принципы экономико-статистического анализа

Анализ и обобщение данных исследования - заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социальноэкономических явлений и процессов.

Анализ - это метод научного исследования объекта путем рассмотрения его отдельных сторон и составных частей.

Экономико-статистический анализ - это разработка методики, основанной на широком применении традиционных статистических и математико-статистических методов с целью контроля адекватного отражения исследуемых явлений и процессов.

Задачами анализа являются: определение и оценка специфики и особенностей изучаемых явлений и процессов, изучение их структуры, взаимосвязей и закономерностей их развития.

В качестве этапов статистического анализа выделяются:

1) формулировка цели анализа;

2) критическая оценка данных;

3) сравнительная оценка и обеспечение сопоставимости данных;

4) формирование обобщающих показателей;

5) фиксация и обоснование существенных свойств, особенностей, сходств и различий, связей и закономерностей изучаемых явлений и процессов;

6) формулировка заключений, выводов и практических предложений о резервах и перспективах развития изучаемого явления.

Временные ряды реализуют широкий набор методов описания, построения моделей, декомпозиции и прогнозирования временных рядов как во временной, так и в частотной области. Все процедуры полностью интегрированы и результаты анализа одной модели. Имеются самые разнообразные возможности для просмотра и графического представления одномерных и многомерных рядов. Можно анализировать очень длинные ряды (более 100 тыс. наблюдений для компьютера с 8 Mb оперативной памяти). С многомерными рядами (в случае многомерных исходных данных или с рядами, полученными на различных этапах анализа) можно работать в активной рабочей области; здесь их можно просматривать и сопоставлять друг с другом. Информация о последовательных преобразованиях хранится в виде длинных меток переменных, поэтому при сохранении вновь полученных рядов в файле данных автоматически сохраняется вся "история" каждого из рядов.

С помощью различных преобразований исходного временного ряда можно понять его структуру и имеющиеся в нем закономерности; реализованы такие часто используемые преобразования, как: удаление тренда, удаление автокорреляций, сглаживание скользящими средними (невзвешенными или взвешенными - с весами, заданными пользователем или вычисленными по методам Даниеля, Тьюки, Хэмминга, Парзена и Бартлета), медианное сглаживание (среднее заменено медианой), простое экспоненциальное сглаживание (подробное описание его вариантов см. далее), взятие разностей, суммирование, вычисление остатков, сдвиг, 4253H-сглаживание, косинус-сглаживание, преобразование Фурье, а также обратное преобразование Фурье и др. Можно выполнить анализ автокорреляций, частных автокорреляций и кросскорреляций.

Временные ряды включают полную реализацию модели авторегрессии и проинтегрированного скользящего среднего. Модель может включать константу. Перед построением модели ряд может быть подвергнут преобразованию, которое автоматически будет отменено после построения прогноза по АРПСС, при этом предсказанные значения и их стандартные ошибки будут выражены через значения исходного (а не преобразованного) ряда. Могут быть вычислены приближенные и точные суммы квадратов из условия максимума правдоподобия; уникальной особенностью является способность анализировать модели с длинными периодами сезонности (с лагом до 30).

Стандартный набор результатов содержит оценки параметров, стандартные ошибки и корреляции. Предсказанные значения могут быть представлены в числовой и графической форме и добавлены к исходному ряду. Имеются многочисленные дополнительные функции для исследования остатков, в том числе большой набор графических средств. Реализация модели позволяет проводить анализ прерванных временных рядов (рядов с интервенциями). Имеется возможность использовать одновременно несколько различных интервенций (до 6). Доступны следующие виды интервенций: однопараметрические скачкообразные, двупараметрические постепенные, временные (характер воздействия можно просмотреть на графике). Для всех прерванных моделей могут быть построены прогнозы, которые можно вывести на график (вместе с исходным рядом) и, если требуется, добавить прогнозы к исходному ряду.

Полностью реализованы все 12 классических моделей экспоненциального сглаживания. Задание модели может включать аддитивную или мультипликативную сезонную составляющую и/или линейный, экспоненциальный или демпфированый тренд; в частности, доступны популярные модели с линейным трендом Холта-Винтера. Пользователь может задавать начальное значение параметров сглаживания, начальное значение тренда и (если требуется) сезонные факторы. Для тренда и сезонной составляющей могут быть заданы независимые параметры сглаживания. Для определения лучшей комбинации параметров используется метод поиска на сетке; в таблицах результатов для всех комбинаций значений параметров сглаживания вычисляется средняя ошибка, средняя абсолютная ошибка, сумма квадратов ошибок, среднеквадратическая ошибка, средняя относительная ошибка и средняя абсолютная относительная ошибка. Наименьшие значения этих ошибок выделяются цветом. Имеется возможность автоматического поиска лучшего набора параметров в смысле среднеквадратической, средней абсолютной или средней абсолютной относительной ошибки (для этого используется общая процедура минимизации). Все результаты преобразования экспоненциальным сглаживанием, остатки и прогноз на требуемое число шагов доступны для дальнейшего анализа и вывода на график. Для оценки адекватности модели используются графики, на которых вместе с исходным рядом в подходящем масштабе по оси Y изображаются его сглаженный вариант, прогноз и ряд остатков.

Имеется возможность задать произвольный сезонный лаг и выбрать либо аддитивную, либо мультипликативную сезонную модель. Программа вычисляет скользящие средние, отношения или разности, сезонные компоненты, ряд с сезонной поправкой, сглаженную тренд-циклическую и нерегулярную компоненты. Все эти составляющие ряда доступны для дальнейшего анализа; например, для проверки адекватности можно построить гистограммы, графики на нормальной вероятностной бумаге и т.д.

Структура всех функций и диалоговых окон соответствует требованиям и соглашениям, описанным в документации Bureau of the Census. Можно выбрать либо аддитивные, либо мультипликативные модели. Пользователь может дополнительно вычислить априорные поправки на число рабочих дней и сезонные поправки. Колебания числа рабочих дней оцениваются регрессионными методами (с правильной обработкой крайних членов ряда) и затем (по желанию) используются для корректировки ряда. Реализованы стандартные средства для градуировки выбросов, вычисления сезонных факторов и вычисления тренд-циклической компоненты (имеется возможность выбирать несколько типов взвешенного скользящего среднего; кроме того, программа может сама находить оптимальную длину и тип скользящего среднего). Итоговые компоненты ряда (сезонная, тренд-циклическая, нерегулярная) и ряд с внесенной сезонной поправкой всегда доступны для дальнейшего анализа и вывода на график; кроме того, все они могут быть сохранены для дальнейшего исследования другими методами и/или в других программах. Все компоненты выводятся на графики в различной форме, включая категоризованные графики по месяцам (кварталам).

С помощью реализованных методов полиномиальных распределенных лагов можно выполнять оценку моделей с обычными лагами и лагами Алмона. Для анализа распределений переменных модели имеется ряд графических средств.

Преимущества реализации спектрального анализа в STATISTICA особенно отчетливо проявляются при анализе очень длинных временных рядов (с более чем 250 тыс. наблюдений) и не предполагают каких-либо ограничений на длину ряда (в частности, длина исходного ряда не обязана быть четной). Вместе с тем, иногда бывает разумно предварительно увеличить или уменьшить длину ряда. Стандартные методы предварительной обработки ряда включают косинус-сглаживание, вычитание среднего и удаление тренда. Результаты обычного спектрального анализа содержат коэффициенты частоты, периода, коэфициенты при синусах и косинусах, периодограмма и оценка спектральной плотности. Оценка плотности может быть вычислена с помощью весов Даниеля, Хэмминга, Бартлетта, Тьюки, Парзена или с весами и шириной, заданными пользователем. Очень полезно, особенно при работе с длинными рядами, иметь возможность выводить в убывающем порядке заранее заданное число точек периодограммы или спектральной плотности; таким образом можно легко обнаружить резкие пики периодограммы и спектральной плотности для длинных рядов.

Имеется возможность вычислить d-критерий Колмогорова-Смирнова для значений периодограммы чтобы проверить, подчиняются ли они экспоненциальному распределению (является ряд белым шумом или нет). Для представления результатов анализа имеются различные типы графиков; можно отобразить коэффициенты при синусах и косинусах, периодограмму, лог- периодограмму, спектральную и лог-спектральную плотность по отношению к частотам, периодам и лог-периодам. В случае длинного исходного ряда имеется возможность выбрать конкретный сегмент (период), для которого будут изображаться соответствующие периодограмма и график спектральной плотности, тем самым будет улучшено их "разрешение".

При кросс-спектральном анализе, в дополнение к результатам обычного спектрального анализа каждого отдельного ряда, вычисляется кросс- периодограмма (вещественная и мнимая часть), ко-спектральная плотность, квадратурный спектр, кросс-амплитуда, значения когерентности, усиления и фазовый спектр. Все эти величины могут быть выведены на график, где по горизонтальной оси будет откладываться частота, период или лог-период либо для всего интервала периодов (соответственно, частот), либо для выбранного пользователем диапазона. Указанное пользователем количество наибольших значений кросс-периодограммы (вещественных или мнимых) может быть выведено в убывающем порядке в виде таблицы результатов, что позволяет легко выявлять на ней резкие пики для длинных исходных рядов. Как и во всех других процедурах модуля Временные ряды, все полученные ряды могут быть добавлены в активную рабочую область и затем подвергнуты дальнейшему исследованию с помощью других методов анализа временных рядов или средствами других модулей системы STATISTICA.

Наконец, в системе STATISTICA реализованы регрессионные методы анализа временных рядов для переменных с запаздыванием (лагом) или без него, в том числе - регрессия, проходящая через начало координат, нелинейная регрессия и интерактивное "что-если" прогнозирование.