Сглаживание динамических рядов. Реферат: Методы сглаживания и выравнивания динамических рядов

Сглаживание динамических рядов. Реферат: Методы сглаживания и выравнивания динамических рядов

Методы сглаживания и выравнивания динамических рядов.

Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы:

1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уровней ряда.

2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.

1.2. 1 Методы «механического» сглаживания .

Сюда относятся:

А. Метод усреднения по двум половинам ряда , когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.

Б. Метод укрупнения интервалов , при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.

В. Метод скользящей средней . Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период. Последовательность определения скользящей средней:

– устанавливается интервал сглаживания или число входящих в него уровней. Если при расчете средней учитываются три уровня, скользящая средняя называется трехчленной, пять уровней – пятичленной и т. д. Если сглаживаются мелкие, беспорядочные колебания уровней в ряду динамики, то интервал (число скользящей средней) увеличивают. Если волны следует сохранить, число членов уменьшают.

– Исчисляют первый средний уровень по арифметической простой:

Y1 = Sy1/m, где

Y1 – I-ый уровень ряда;

M – членность скользящей средней.

– первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет y будет включен последний уровень исследуемого ряда динамики yn.

– по ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Отрицательной стороной использования метода скользящей средней является образование сдвигов в колебаниях уровней ряда, обусловленных «скольжением» интервалов укрупнения. Сглаживание с помощью скользящей средней может привести к появлению «обратных» колебаний, когда выпуклая «волна» заменяется на вогнутую.

В последнее время стала рассчитываться адаптивная скользящая средняя. Ее отличие состоит в том, что среднее значение признака, рассчитываемое также как описано выше, относится не к середине ряда, а к последнему промежутку времени в интервале укрупнения. Причем предполагается, что адаптивная средняя зависит от предыдущего уровня в меньшей степени, чем от текущего. То есть., чем больше промежутков времени между уровнем ряда и средним значением, тем меньшее влияние оказывает значение этого уровня ряда на величину средней.

Г. Метод экспоненциальной средней . Экспоненциальная средняя – это адаптивная скользящая средняя, рассчитанная с применением весов, зависящих от степени «удаленности» отдельных уровней ряда от среднего значения. Величина веса убывает по мере удаления уровня по хронологической прямой от среднего значения в соответствии с экспоненциальной функцией, поэтому такая средняя называется экспоненциальной. На практике применяется многократное экспоненциальное сглаживания ряда динамики, которое используется для прогнозирования развития явления.

Вывод: способы, включенные в первую группу, ввиду применяемых методик расчета предоставляют исследователю очень упрощенное, неточное, представление о тенденции в ряду динамики. Однако корректное применение этих способов требует от исследователя глубины знаний о динамике различных социально – экономических явлений.

1.2.2 Методы «аналитического» выравнивания

Более точным способом отображения тенденции динамического ряда является аналитическое выравнивание, т. е. выравнивание с помощью аналитических формул. В этом случае динамический ряд выражается в виде функции у (t), в которой в качестве основного фактора принимается время t, и изменения аргумента функции определяют расчетные значения уt.

Фактическими (или эмпирическими) уровнями ряда динамики называют исходные данные об изменении явления, т. е. данные, полученные опытным путем, посредством наблюдения. Они обозначаются уi. Расчетными (или теоретическими) уровнями ряда называют значения, полученные в результате подстановки в уравнение тренда значений t, и обозначают их.

Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t) . На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Чаще всего при выравнивании используются следующий зависимости:

Линейная ;

Параболическая ;

Экспоненциальная

1)Линейная зависимость выбирается в тех случаях, когда в исходном временном ряду наблюдаются более или менее постоянные абсолютные и цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению.

2)Параболическая зависимость используется, если абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) никакой тенденции развития не проявляют.

3)Экспоненциальные зависимости применяются, если в исходном временном ряду наблюдается либо более или менее постоянный относительный рост (устойчивость цепных темпов роста, темпов прироста, коэффициентов роста) , либо, при отсутствии такого постоянства, — устойчивость в изменении показателей относительного роста (цепных темпов роста цепных же темпов роста, цепных коэффициентов роста цепных же коэффициентов или темпов роста и т. д.)

Таким образом, целью аналитического выравнивания является:

– определение вида функционального уравнения;

– нахождения параметров уравнения;

– расчет «теоретических», выровненных уровней, отображающих основную тенденцию ряда динамики.

Графическое отображение изменения уровней ряда играет большую роль в применении данного вида выравнивания. Оно позволяет ускорить процедуру анализа и увеличить степень наглядности полученных результатов.

Сезонность – изменения динамических рядов, имеющих внутригодичную цикличность, зависящие от календарного периода года, явлениями природы, праздниками и др. Например, объем продаж продукции меховой фабрики вырастет в октябре, в ноябре достигнет максимума, снизится к марту, и затем до сентября – октября будет держаться на очень низком уровне. В качестве примера, интересно сравнить сезонные изменения уровня цен в России и странах Западной Европы. В России уровень цен в предпраздничные дни (например, рождество, Новый год, 9 мая, 1 сентября и т. д.) заметно растет. Тогда как в Западной Европе, как правило, в предпраздничные дни проводятся распродажи, т. е. в большинстве своем цены падают.

Явления, подверженные сезонным изменениям, необходимо исследовать на предмет наличия основной тенденции развития. Для этого необходимо распределить объем изменения явления между сезонной составляющей и основной тенденцией.

Изучение и измерение сезонности ряда динамики осуществляется с помощью специального показателя – индекса сезонности. Существует несколько вариантов анализа динамики с помощью индекса сезонности.

Индексы сезонности показывают, во сколько раз фактический уровень ряда в момент или интервал времени t больше среднего уровня либо уровня, вычисляемого по уравнению тенденции f(t) . При анализе сезонности уровни временного ряда показывают развитие явления по месяцам (кварталам) одного или нескольких лет. Для каждого месяца (квартала) получают обобщенный индекс сезонности как среднюю арифметическую из одноименных индексов каждого года. Индексы сезонности – это, по либо уровень существу, относительные величины координации, когда за базу сравнения принят либо средний уровень ряда, либо уровень тенденции. Способы определения индексов сезонности зависят от наличия или отсутствия основной тенденции.

Если тренда нет или он незначителен, то для каждого месяца (квартала) индекс рассчитывается по формуле 32:

Где — уровень показателя за месяц (квартал) t ;

— общий уровень показателя.

Как отмечалось выше, для обеспечения устойчивости показателей можно взять больший промежуток времени. В этом случае расчет производится по формулам 33:

Где — средний уровень показателя по одноименным месяцам за ряд лет;

Т — число лет.

При наличии тренда индекс сезонности определяется на основе методов, исключающих влияние тенденции. Порядок расчета следующий:

1) для каждого уровня определяют выравненные значения по тренду f(t);

2) рассчитывают отношения ;

3) при необходимости находят среднее из этих отношений для одноименных месяцев (кварталов) по формуле:

,(Т — число лет).

Сглаживание рядов с помощью скользящей средней .

1. 2. Методы сглаживания и выравнивания динамических рядов.
Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы:
1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уровней ряда.
2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.
1.2. 1 Методы «механического» сглаживания .
Сюда относятся:
а. Метод усреднения по двум половинам ряда , когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.
б. Метод укрупнения интервалов , при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.
Укрупнение интервалов – это простейший метод сглаживания уровней ряда с целью выявить основную тенденцию их изменения. При этом для укрупненных интервалов определяется итоговое значение или средняя величина исследуемого показателя. Этот метод особенно эффективен, если первоначальные уровни ряда соответствуют коротким промежуткам времени. Например, если есть данные о ежесуточной погрузке грузов по какой-либо железной дороге за месяц, то в таком ряду вероятны значительные колебания уровней, так как чем меньше период, за который приводятся данные, тем больше влияния случайных факторов.

Чтобы устранить это влияние, рекомендуется укрупнить интервалы времени (например, до 5 или 10 дней) и рассчитать общий или среднесуточный объем погрузок (соответственно по пятидневкам или декадам). В ряду с укрупненными интервалами времени закономерность изменения уровней будет более наглядной.

Пример 2.8. Пусть имеются следующие данные о выпуске продукции на предприятии по месяцам за год (в сопоставимых ценах):

Решение . Укрупним интервалы до трех месяцев и рассчитаем суммарный и среднемесячный выпуск продукции по кварталам. Получим следующие результаты:



Очевидно, что новые данные более четко выражают закономерность изменения выпуска продукции за год – увеличение из квартала в квартал.

в. Метод скользящей средней . Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период. Последовательность определения скользящей средней:
- устанавливается интервал сглаживания или число входящих в него уровней. Если при расчете средней учитываются три уровня, скользящая средняя называется трехчленной, пять уровней – пятичленной и т.д. Если сглаживаются мелкие, беспорядочные колебания уровней в ряду динамики, то интервал (число скользящей средней) увеличивают. Если волны следует сохранить, число членов уменьшают.
- Исчисляют первый средний уровень по арифметической простой:
y1 =Sy1/m, где
y1 – I-ый уровень ряда;
m – членность скользящей средней.
- первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет y будет включен последний уровень исследуемого ряда динамики yn.

По ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Отрицательной стороной использования метода скользящей средней является образование сдвигов в колебаниях уровней ряда, обусловленных «скольжением» интервалов укрупнения. Сглаживание с помощью скользящей средней может привести к появлению «обратных» колебаний, когда выпуклая «волна» заменяется на вогнутую.
В последнее время стала рассчитываться адаптивная скользящая средняя. Ее отличие состоит в том, что среднее значение признака, рассчитываемое также как описано выше, относится не к середине ряда, а к последнему промежутку времени в интервале укрупнения. Причем предполагается, что адаптивная средняя зависит от предыдущего уровня в меньшей степени, чем от текущего. То есть., чем больше промежутков времени между уровнем ряда и средним значением, тем меньшее влияние оказывает значение этого уровня ряда на величину средней.
г. Метод экспоненциальной средней . Экспоненциальная средняя – это адаптивная скользящая средняя, рассчитанная с применением весов, зависящих от степени «удаленности» отдельных уровней ряда от среднего значения. Величина веса убывает по мере удаления уровня по хронологической прямой от среднего значения в соответствии с экспоненциальной функцией, поэтому такая средняя называется экспоненциальной. На практике применяется многократное экспоненциальное сглаживания ряда динамики, которое используется для прогнозирования развития явления.
Вывод: способы, включенные в первую группу, ввиду применяемых методик расчета предоставляют исследователю очень упрощенное, неточное, представление о тенденции в ряду динамики. Однако корректное применение этих способов требует от исследователя глубины знаний о динамике различных социально - экономических явлений.
1.2.2 Методы «аналитического» выравнивания
Более точным способом отображения тенденции динамического ряда является аналитическое выравнивание, т. е. выравнивание с помощью аналитических формул. В этом случае динамический ряд выражается в виде функции у (t), в которой в качестве основного фактора принимается время t, и изменения аргумента функции определяют расчетные значения уt.
Фактическими (или эмпирическими) уровнями ряда динамики называют исходные данные об изменении явления, т. е. данные, полученные опытным путем, посредством наблюдения. Они обозначаются уi. Расчетными (или теоретическими) уровнями ряда называют значения, полученные в результате подстановки в уравнение тренда значений t, и обозначают их.
Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t) . На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Санкт-Петербургский юридический институт (филиал) Академии

Генеральной прокуратуры Российской Федерации

Кафедра общегосударственных и социально-экономических

дисциплин

Е.А. Разумовская

Обработка динамических рядов

Практикум по курсу

«Правовая статистика»

Часть 2

Санкт-Петербург

ОБРАБОТКА ДИНАМИЧЕСКИХ РЯДОВ

1. ОПИСАНИЕ РАБОТЫ

Цель работы

Анализ статистики преступности для выявления закономерностей, тенденций и прогнозирования развития процесса.

Метод выполнения

Обработка исходных данных методами укрупнения ,сглаживания исмыкания .

ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ

Изучение статистики преступности имеет большое практическое значение. Анализ закономерностей развития этого процесса дает возможность правоохранительным органам прогнозировать будущее развитие преступности, оптимально распределять силы и средства для борьбы с ней.

Преступность – это сложный общественный процесс, его развитие определяют различные факторы, в первую очередь – экономические. Динамика (т.е. развитие во времени) преступности зависит также от политической ситуации, исторических традиций, наличия особо криминогенных зон и объектов. Деятельность правоохранительных органов тоже можно отнести к факторам, влияющим на развитие преступности.

Трудность анализа состоит в том, что на основные тенденции развития процесса накладываются случайные отклонения, колебания и выбросы. Основная задача статистической обработки состоит как раз в отсечении этой случайной компоненты и выявления основных тенденций, закономерностей развития. Именно такая обработка исходных данных должна быть проведена в данной работе.

Понятие динамического ряда

Ряд в статистике – это упорядоченная совокупность числовых данных, полученных при наблюдении изучаемого явления.

Ряды позволяют производить следующие статистические исследования:

    сравнение явлений в процессе их развития во времени,

    сравнение явлений по различным их формам и видам,

    выявление взаимной зависимости явлений или зависимости от общей причины.

Пример явления, развивающегося во времени: число зарегистрированных преступлений данного вида на данной территории. Если регистрировать количество преступлений регулярно на протяжении достаточно длительного промежутка времени, затем правильно обработать полученный ряд данных, то можно выявить тенденции развития процесса, спрогнозировать будущие изменение ситуации и заранее подготовить адекватные меры борьбы с преступностью.

Процесс развития, изменения или движения социальных явлений во времени в статистике принято называть динамикой .

Динамический ряд - упорядоченная совокупность значений выбранного статистического показателя, изменяющихся во времени.

Величины ряда могут характеризовать явление по-разному:

Интервальный ряд отражает величину показателей, полученных за определённые периоды (интервалы) времени.

Например, ряд, содержащий количество гражданских дел, рассмотренных в суде за каждый месяц календарного года.

Моментный ряд характеризует уровни правового процесса на определенные моменты времени (даты отчета).

Например, количество заключенных на начало каждого календарного года.

Важнейшее условие построения и исследования рядов динамики – это однородность (сопоставимость) значений, относящихся к различным периодам.

Однородность во времени требует, чтобы значения ряда соответствовали показателю, характеризующему явление, за один и тот же отрезок времени, или чтобы соседние значения ряда были разнесены во времени друг от друга на равные промежутки.

Однородность в пространстве требует, чтобы территория, которую характеризует каждый показатель ряда, не изменялась на исследуемом временном отрезке.

Однородность по кругу охватываемых объектов требует, чтобы данные рядов относились к одинаковому количеству объектов (людей, административных единиц, возрастному промежутку и т.д.)

Однородность по сущности исследуемых величин требует, чтобы на рассматриваемом временном отрезке не изменялось уголовное законодательство.

Однородность по методологии требует, чтобы на рассматриваемом временном отрезке не изменялась методика получения показателя.

Методы укрупнения и сглаживания динамических рядов

Укрупнение и сглаживание – это математические операции над данными динамического ряда, которые позволяют выявлять тенденции, т.е. наиболее медленные составляющие изучаемого процесса, которые наблюдаются на фоне быстрых случайных всплесков и колебаний.

Такой подход к динамическому ряду, описывающему социальное явление, означает, что явление рассматривается как арифметическая сумма быстро и медленно меняющихся процессов.

РЯД(t ) = МЕДЛ(t ) + БЫСТР(t )

Целью обработки динамического ряда является разделение этих слагаемых. Во многих случаях такая модель социальных явлений правомерна.

Укрупнение динамического ряда - разбиение исходного ряда на неперекрывающиеся группы соседних данных (пары, тройки, и.т.д.), а затем вычисление суммы внутри каждой группы.

Получается новый ряд, число значений в котором будет меньше исходного в два, три или более раз, соответственно. Рассмотрим пример статистики женщин, совершивших преступления в период 2008 – 2010 годов по полугодиям.

Наблюдаются сезонные колебания данных, для выявления тенденции применим укрупнение: сгруппируем данные по 2 и сложим в каждой группе.

Исходный ряд :x 1 = 110 210,x 2 = 90 624,…,x 6 = 77 916.

Укрупнение по 2 :y1 = 110 210 + 90 624 = 200 834,

y2 = 105 796 + 66 406 = 194 202,

y3 = 94 459 + 77 916 = 172 375.

Получим данные по годам, а не по полугодиям: вместо 6 чисел - 3, но стала явно видна тенденция к снижению показателя. Аналогичным образом можно проводить укрупнение по 3, 4 и более периодов в одной группе.

Сглаживание динамического ряда - разбиение исходного ряда на перекрывающиеся группы данных по два, три или более смежных значений, (сдвиг по исходному ряду на одно значение), а затем вычисление среднего арифметического в каждой группе (скользящее среднее).

После обработки остается на 1, 2 и т.д. значения меньше в зависимости от величины групп (2, 3,…).

Рассмотрим метод сглаживания на том же примере статистики женщин-преступниц, применим сглаживание по 3 (среднее арифметическое первых трех элементов, затем 2, 3 и 4 и т.д. – это пересекающиеся группы данных).

Сглаживание по 3 :y 1 = (x 1 +x 2 +x 3) / 3 = 102 210,

y 2 = (x 2 +x 3 +x 4) / 3 = 87 609,

y 3 = (x 3 +x 4 +x 5) / 3 = 88 887,

y 4 = (x 4 +x 5 +x 6) / 3 = 79 594.

После сглаживания можно отметить следующее поведение процесса: снижение, стабильность, снова снижение показателя, однако, данных явно недостаточно, чтобы отфильтровать сезонные колебания.

Укрупнение и сглаживание ведут к уменьшению случайных всплесков, особенно хорошо тенденции видны на графиках , построенных по укрупненным или сглаженным данным. Укрупнение применяют к интервальным динамическим рядам, а сглаживание - как к интервальным, так и к моментным рядам.

Метод смыкания динамических рядов

Для изучения закономерностей и тенденций правовых процессов нужны однородные совокупности данных, однако в правовой сфере происходят существенные сдвиги: изменения законодательства, форм учета, укрупнение и разукрупнение территориально-административных единиц (например, изменение перечня тяжких преступлений, объединение субъектов РФ и т.д.). Для компенсации возникшей неоднородности данных используют:

Метод смыкания динамических рядов – выбор промежутка времени, на котором известны старые и новые показатели, принятие его за базовый (100%) и пропорциональный пересчет старых показателей влево, а новых – вправо по временной оси.

Рассмотрим статистику преступности в условном городе Nза 1991 – 1996 годы, ряд не обладает свойством однородности, т.к. в 1994 году законодательно изменился перечень тяжких преступлений.

Показатели

Число тяжких прест.

(старый перечень)

Число тяжких прест.

(новый перечень)

Сомкнутый ряд

В переходный год известны показатели по старой и новой форме, примем этот год за базовый и присвоим ему значение 100% (проценты не пишем). Найдем коэффициенты пропорциональности для старых данных по 1994 году: 100 / 80 = 1,25, для новых данных: 100 / 150 = 0,67. Умножим старые данные 1991 – 1993 годов на 1,25, новые данные 1995 – 1996 годов – на 0,67 и получим сомкнутый ряд сопоставимых показателей, по которому можно изучать тенденции процесса.

Исходные данные задачи

В данной работе изучается статистика преступности (криминальная статистика) заданного вида в пределах одного населённого пункта, регистрировавшаяся помесячно на протяжении трех лет. Такой набор статистической информации является типичным примером динамического ряда интервального типа .

В приложении № 1 методического руководства дано общее описание листа Excel, на котором нужно выполнить задание. В приложении № 2 приведена статистическая таблица –сводка количества преступлений 14 видов в двух городах. Информация представлена за три года: два года до изменения территориальных границ городов, один год – после, в первый месяц третьего года (январь) приведена статистика преступлений как в старых, так и в новых границах городов.

Рассмотрим информацию за первые два года - это двадцать четыре целых числа. Обозначим их:

а 1 , а 2 , … , а 24

Как отмечалось в предыдущем пункте, динамический ряд пригоден для статистического анализа, если он соответствует условиям однородности. В нашем случае первичные статистические данные за два года удовлетворяют критерию однородности:

    во времени - сведения о количестве преступлений собраны за одинаковые временные интервалы, следующие по порядку один за другим;

    в пространстве - данные относятся к одному территориальному объекту в одних и тех же границах;

    по сущности – данные относятся к одному классу явлений, в нашем случае, к одним видам преступлений.

Подразумеваются также выполненными следующие условия однородности: неизменность законодательства в части классификации данных преступлений, единство методики сбора и регистрации первичной информации на протяжении всего периода наблюдений.

Укрупнение ряда (кратности 2, 3, 4, 6)

Новый, укрупненный в два раза ряд формируется из исходных данных

а 1 , а 2 , … , а 24 по формуле:

b i / 2 = a i -1 + a i , i = 2, 4, 6, … , 24 (1)

Иными словами, при формировании укрупненного вдвое ряда b первое число исходного рядаa складывается со вторым, третье с четвертым и т.д.

После укрупнения исходного динамического ряда в два раза (кратность равна двум) данных становится в два раза меньше. Таким образом, метод укрупнения позволяет взглянуть на процесс в целом, выделить главное, опустив мелкие детали.

Аналогичным образом можно укрупнить ряд в три, четыре, шесть и более раз (задать различную кратность укрупненного ряда):

c i/3 = a i-2 + a i-1 + a i , i = 3, 6, 9, …, 24 (2)

d i/4 = a i-3 + a i-2 + a i-1 + a i , i = 4, 8, 12, …, 24 (3)

e i/6 = a i-5 + a i-4 + a i-3 + a i-2 + a i-1 + a i , i = 6, 12, 18, 24 (4)

При формировании ряда с исходные данные рядаа разбиваются на группы по три штуки и складываются, для рядаd - в группы по четыре штуки, для рядаe – в группы по шесть штук. Соответственно, рядb получился короче исходного рядаа в два раза, рядс – в три раза, рядd – в четыре раза, рядe – в шесть раз.

Какая же кратность укрупнения является оптимальной? Чтобы ответить на этот вопрос, нужно знать временные параметры изменения основной тенденции процесса: продолжительность роста или снижения, периодичность сезонных колебаний и т.д.

В реальных условиях эти параметры сами являются предметом изучения. Поэтому лишь эмпирическим путем можно определить оптимальную кратность укрупнения динамического ряда в нашей задаче. Метод эффективно работает, когда характер процесса (стабильность, рост, снижение и т.д.) проявляются достаточно долго.

Сглаживание ряда (кратности 3, 4, 5)

Сглаженный по три элемента (кратность равна 3) ряд образуется на основе первичных данных по формуле скользящего среднего:

f i = (a i + a i +1 + a i +2) / 3, i = 1, 2, …, 22 (5)

Иными словами, берут первое, второе и третье число ряда a , находят среднее арифметическое (складывают их, и сумму делят на 3), получается первое число рядаf . Затем берут второе, третье и четвертое числа рядаa (со сдвигом на один элемент ряда – поэтому и называется метод скользящего среднего) и, проделав аналогичные операции, получают второй элемент рядаf , и т.д.

Следует обратить внимание на то, что новый ряд на два элемента короче исходного. В соответствии с формулой сглаживание проводится по трем соседним элементам исходного ряда.

Аналогичным образом можно применить сглаживание по четырем, пяти и более элементам (кратность равна 4, 5 и т.д.):

g i = (a i + a i+1 + a i+2 + a i+3) / 4, i = 1, 2, …, 21 (6)

h i = (a i + a i+1 + a i+2 + a i+3 + a i+4) / 5, i = 1, 2, …, 20 (7)

При формировании ряда g исходные данные рядаа берут по четыре штуки и находят их среднее арифметическое, для рядаh - по пять штук. Соответственно, рядf получился короче исходного рядаа на два элемента, рядg – на три элемента, рядh – на четыре элемента.

Так же, как в методе укрупнения, параметр кратности (количество элементов исходного ряда, выбранное для вычисления среднего) нельзя рассчитать заранее, его следует определить эмпирически по полученным результатам.

Сглаженный ряд позволяет изучать средний уровень преступности и может служить основой для прогнозирования будущего развития процесса. Метод сглаживания особенно эффективен для выявления сезонных колебаний и поиска скачков в среднем уровне процесса.

Анализ результатов

После того, как проведена обработка первичных данных по формулам для различной кратности, построены графики укрупненных и сглаженных рядов, наступает следующий этап анализа – выявление тенденции изменения преступности.

В ходе обработки динамического ряда важнейшей задачей является выявление основной тенденции развития явления (тренда) и сглаживание случайных колебаний. Закономерности изменения явления во времени не проявляются в каждом конкретном уровне ряда. Это связано с действием на явления общих и случайных причин. Поэтому для решения этой задачи в статистике существуют следующие методы обработки рядов:

  • 1. Метод сглаживания путем укрупнения интервалов во времени.
  • 2. Выравнивание рядов динамики методом скользящей средней.
  • 3. Метод аналитического выравнивания.

Метод укрупнения интервалов - наиболее простой способ. Он заключается в преобразовании первоначальных рядов динамики в более крупные по продолжительности временных периодов, что позволяет более четко выявить действие основной тенденции изменения уровней. Новые уровни рассчитываются, как средние из укрупненных периодов. Переменная средняя рассчитывается по формулам простой средней арифметической. К примеру, если продолжительность периода равна 3, то переменная средняя будет рассчитана:

Недостатком этого приема является то, что идет потеря информации за счет укорачивания ряда.

Метод скользящей средней - это такая динамическая средняя, которая последовательно рассчитывается при передвижении на один интервал при заданной продолжительности периода.

Последовательность определения скользящей средней:

Формируются укрупненные интервалы, состоящие из одинаковых уровней. Если при расчете средней учитываются три уровня, скользящая средняя называется трехчленной, пять уровней - пятичленной и т.д. Если, предположим, продолжительность периода равна 3, то скользящие средние рассчитываются следующим образом:

Исчисляют первый средний уровень по арифметической простой:

y1 = y1/m, где

y1 - I-ый уровень ряда;

m - членность скользящей средней(продолжительность периода)

Заметим, первая средняя записывается напротив середины первого уровня.

  • - Первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет не будет включен последний уровень исследуемого ряда динамики y n .
  • - По ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Отрицательной стороной использования метода скользящей средней является то, что, как и в случае с методом укрупнения идет потеря информации за счет укорачивания ряда. В дальнейшем затруднен прогноз развития явлений, так как нет достаточного математического обоснования для осуществления прогноза.

Более точным способом отображения тенденции динамического ряда является аналитическое выравнивание, т. е. выравнивание с помощью аналитических формул. В этом случае динамический ряд выражается в виде функции у (t), в которой в качестве основного фактора принимается время t, и изменения аргумента функции определяют расчетные значения у t .

Фактическими (или эмпирическими) уровнями ряда динамики называют исходные данные об изменении явления, т. е. данные, полученные опытным путем, посредством наблюдения. Они обозначаются уi. Расчетными (или выровненными теоретическими) уровнями ряда называют значения, полученные в результате подстановки в уравнение тренда значений t, и обозначают их?.

Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t). На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t), а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Чаще всего при выравнивании используются следующие зависимости:

линейная;

параболическая;

экспоненциальная

  • 1. Линейная зависимость выбирается в тех случаях, когда в исходном временном ряду наблюдаются более или менее постоянные абсолютные и цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению.
  • 2. Параболическая зависимость используется, если абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) никакой тенденции развития не проявляют.
  • 3. Экспоненциальные зависимости применяются, если в исходном временном ряду наблюдается либо более или менее постоянный относительный рост (устойчивость цепных темпов роста, темпов прироста, коэффициентов роста), либо, при отсутствии такого постоянства, -устойчивость в изменении показателей относительного роста.

Таким образом, целью аналитического выравнивания является:

  • - определение вида функционального уравнения;
  • - нахождения параметров уравнения тренда методом наименьших квадратов, где сумма квадратов отклонений фактических уровней от выровненных теоретических на искомой линии должна быть минимальна
  • ?(y i - ?) 2 >min;
  • - расчет «теоретических», выровненных уровней, отображающих основную тенденцию ряда динамики.

Графическое отображение изменения уровней ряда играет большую роль в применении данного вида выравнивания. Оно позволяет ускорить процедуру анализа и увеличить степень наглядности полученных результатов.

Тенденцию развития социально-экономических явлений обычно изображают кривой, параболой, гиперболой и прямой линией.

Наиболее простой и часто встречающейся в практике является линейная зависимость, описываемая уравнением:

где у i - фактические уровни;

у t - теоретическое значение уровня;

t - периоды времени - фактор времени.

«а» и «в» - параметры уравнения.

Так как «t» известно, то для нахождения «у t » необходимо определить параметры «а» и «в». Их находят методом наименьших квадратов, где сумма квадратов отклонений фактических уровней от выровненных теоретических на искомой линии должна быть min ?(y i - ?) 2 >min; Этому требованию удовлетворяет следующая система нормальных уравнений:

n - количество уровней ряда динамики.

Эту систему уровней можно упростить, если взять t (период времени) таким, чтобы сумма периодов равнялась нулю: Уt = 0.

Для этого необходимо периоды ряда динамики пронумеровать так, чтобы перенести в середину ряда начало отчета времени. В ряду динамики с нечетным числом периодов времени нумерация начинается с середины ряда и с нуля «0», а с четным числом периодов с «-1» и «+1». Тогда уравнения примут следующий вид:

an = Уу, отсюда получим «а»

После нахождения параметров необходимо рассчитать выровненные уровни ряда путем подстановки значения номера периода.

Таким образом, аналитическое уравнение сводится к замене фактических уровней теоретическими.

Анализ рядов динамики предполагает и исследование сезонной неравномерности (сезонных колебаний), под которыми понимают устойчивые внутригодовые колебания, причиной которых являются многочисленные факторы, в том числе и природно-климатические. Сезонные колебания измеряются с помощью индексов сезонности, которые рассчитываются двумя способами в зависимости от характера динамического развития.

При относительно неизменном годовом уровне явления индекс сезонности можно рассчитать как процентное отношение средней величины из фактических уровней одноименных месяцев к общему среднему уровню за исследуемый период:

Очень часто, урони рядов динамики колеблются, при этом тенденция развития явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью более четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание ) временных рядов.

Методы сглаживания временных рядов делятся на две основные группы:

1. аналитическое выравнивание с использованием кривой, проведенной между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных колебаний;

2. механическое выравнивание отдельных уровней временного ряда с использованием фактических значений соседних уровней.

Суть методов механического сглаживания заключается в следующем. Берется несколько уровней временного ряда, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания; с помощью полинома определяются новые, выровненные значения уровней в середине интервала сглаживания. Далее интервал сглаживания сдвигается на один уровень ряда вправо, вычисляется следующее сглаженное значение и так далее.

Самым простым методом механического сглаживания является метод простой скользящей средней.

2.4.1. Метод простой скользящей средней.

Сначала для временного ряда: определяется интервал сглаживания . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания.

Для первых уровней ряда вычисляется их среднее арифметическое. Это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление среднего арифметического и так далее. Для вычисления сглаженных уровней ряда применяется формула:

где (при нечетном ); для четных формула усложняется.

В результате такой процедуры получаются сглаженных значений уровней ряда; при этом первые и последние уровней ряда теряются (не сглаживаются). Другой недостаток метода в том, что он применим лишь для рядов, имеющих линейную тенденцию.

2.4.2. Метод взвешенной скользящей средней.

Метод взвешенной скользящей средней отличается от предыдущего метода сглаживания тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с тем, что аппроксимация ряда в пределах интервала сглаживания осуществляется с использованием полинома не первой степени, как в предыдущем случае, а степени начиная со второй.

Используется формула средней арифметической взвешенной:

,

причем веса определяются с помощью метода наименьших квадратов. Эти веса рассчитаны для различных степеней аппроксимирующего полинома и различных интервалов сглаживания.

1. для полиномов второго и третьего порядков числовая последовательность весов при интервале сглаживания имеет вид: , а при имеет вид: ;

2. для полиномов четвертой и пятой степеней и при интервале сглаживания последовательность весов выглядит следующим образом: .

Распределение весов на протяжении интервала сглаживания, полученное на основе метода наименьших квадратов см. на диаграмме 1.



2.4.3. Метод экспоненциального сглаживания.

К той же группе методов относится метод экспоненциального сглаживания.

Его особенность заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда

соответствующие сглаженные значения обозначить через , то экспоненциальное сглаживание осуществляется по формуле:

где параметр сглаживания ; величина называется коэффициентом дисконтирования.

Используя, приведенное рекуррентное соотношение для всех уровней ряда, начиная с первого и кончая моментом времени , можно получить, что экспоненциальная средняя, то есть сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней.