Сглаживание динамических рядов. Методы сглаживания и выравнивания динамических рядов

Обработка динамических рядов

Сглаживание динамических рядов. Методы сглаживания и выравнивания динамических рядов

Обработка динамических рядов

Похожие публикации

1. 2. Методы сглаживания и выравнивания динамических рядов.
Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы:
1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уровней ряда.
2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.
1.2. 1 Методы «механического» сглаживания .
Сюда относятся:
а. Метод усреднения по двум половинам ряда , когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.
б. Метод укрупнения интервалов , при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.
Укрупнение интервалов – это простейший метод сглаживания уровней ряда с целью выявить основную тенденцию их изменения. При этом для укрупненных интервалов определяется итоговое значение или средняя величина исследуемого показателя. Этот метод особенно эффективен, если первоначальные уровни ряда соответствуют коротким промежуткам времени. Например, если есть данные о ежесуточной погрузке грузов по какой-либо железной дороге за месяц, то в таком ряду вероятны значительные колебания уровней, так как чем меньше период, за который приводятся данные, тем больше влияния случайных факторов.

Чтобы устранить это влияние, рекомендуется укрупнить интервалы времени (например, до 5 или 10 дней) и рассчитать общий или среднесуточный объем погрузок (соответственно по пятидневкам или декадам). В ряду с укрупненными интервалами времени закономерность изменения уровней будет более наглядной.

Пример 2.8. Пусть имеются следующие данные о выпуске продукции на предприятии по месяцам за год (в сопоставимых ценах):

Решение . Укрупним интервалы до трех месяцев и рассчитаем суммарный и среднемесячный выпуск продукции по кварталам. Получим следующие результаты:

Очевидно, что новые данные более четко выражают закономерность изменения выпуска продукции за год – увеличение из квартала в квартал.

в. Метод скользящей средней . Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период. Последовательность определения скользящей средней:
- устанавливается интервал сглаживания или число входящих в него уровней. Если при расчете средней учитываются три уровня, скользящая средняя называется трехчленной, пять уровней – пятичленной и т.д. Если сглаживаются мелкие, беспорядочные колебания уровней в ряду динамики, то интервал (число скользящей средней) увеличивают. Если волны следует сохранить, число членов уменьшают.
- Исчисляют первый средний уровень по арифметической простой:
y1 =Sy1/m, где
y1 – I-ый уровень ряда;
m – членность скользящей средней.
- первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет y будет включен последний уровень исследуемого ряда динамики yn.

По ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Отрицательной стороной использования метода скользящей средней является образование сдвигов в колебаниях уровней ряда, обусловленных «скольжением» интервалов укрупнения. Сглаживание с помощью скользящей средней может привести к появлению «обратных» колебаний, когда выпуклая «волна» заменяется на вогнутую.
В последнее время стала рассчитываться адаптивная скользящая средняя. Ее отличие состоит в том, что среднее значение признака, рассчитываемое также как описано выше, относится не к середине ряда, а к последнему промежутку времени в интервале укрупнения. Причем предполагается, что адаптивная средняя зависит от предыдущего уровня в меньшей степени, чем от текущего. То есть., чем больше промежутков времени между уровнем ряда и средним значением, тем меньшее влияние оказывает значение этого уровня ряда на величину средней.
г. Метод экспоненциальной средней . Экспоненциальная средняя – это адаптивная скользящая средняя, рассчитанная с применением весов, зависящих от степени «удаленности» отдельных уровней ряда от среднего значения. Величина веса убывает по мере удаления уровня по хронологической прямой от среднего значения в соответствии с экспоненциальной функцией, поэтому такая средняя называется экспоненциальной. На практике применяется многократное экспоненциальное сглаживания ряда динамики, которое используется для прогнозирования развития явления.
Вывод: способы, включенные в первую группу, ввиду применяемых методик расчета предоставляют исследователю очень упрощенное, неточное, представление о тенденции в ряду динамики. Однако корректное применение этих способов требует от исследователя глубины знаний о динамике различных социально - экономических явлений.
1.2.2 Методы «аналитического» выравнивания
Более точным способом отображения тенденции динамического ряда является аналитическое выравнивание, т. е. выравнивание с помощью аналитических формул. В этом случае динамический ряд выражается в виде функции у (t), в которой в качестве основного фактора принимается время t, и изменения аргумента функции определяют расчетные значения уt.
Фактическими (или эмпирическими) уровнями ряда динамики называют исходные данные об изменении явления, т. е. данные, полученные опытным путем, посредством наблюдения. Они обозначаются уi. Расчетными (или теоретическими) уровнями ряда называют значения, полученные в результате подстановки в уравнение тренда значений t, и обозначают их.
Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t) . На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Углубленный анализ временных рядов требует использования более сложных методик математической статистики. При наличии в динамических рядах значительной случайной ошибки (шума) применяют один из двух простых приемов - сглаживание или выравнивание путем укрупнения интервалови вычисления групповых средних. Этот метод позволяет повысить наглядность ряда, если большинство «шумовых» составляющих находятся внутри интервалов. Однако, если «шум» не согласуется с периодичностью, распределение уровней показателей становится грубым, что ограничивает возможности детального анализа изменения явления во времени.

Более точные характеристики получаются, если используют скользящие средние - широко применяемый способ для сглаживания показателей среднего ряда. Он основан на переходе от начальных значений ряда к средним в определенном интервале времени. В этом случае интервал времени при вычислении каждого последующего показателя как бы скользит по временному ряду.

Применение скользящего среднего полезно при неопределенных тенденциях динамического ряда или при сильном воздействии на показатели циклически повторяющихся выбросов (резко выделяющиеся варианты или интервенция).

Чем больше интервал сглаживания, тем более плавный вид имеет диаграмма скользящих средних. При выборе величины интервала сглаживания необходимо исходить из величины динамического ряда и содержательного смысла отражаемой динамики. Большая величина динамического ряда с большим числом исходных точек позволяет использовать более крупные временные интервалы сглаживания (5, 7, 10 и т.д.). Если процедура скользящего среднего используется для сглаживания не сезонного ряда, то чаще всего величину интервала сглаживания принимают равной 3 или 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - отличная возможность выбрать авиакомпанию на перелет из Москвы в Нью-Йорк

Приведем пример вычисления скользящего среднего числа хозяйств с высокой урожайностью (более 30 ц/га) (табл. 10.3).

Таблица 10.3 Сглаживание динамического ряда укрупнением интервалов искользящим средним

Учетный год	Число хозяйств с высокой урожайностью	Суммы за три года	Скользящие за три года	Скользящие средние

			90,0	89,7
1984				88,7
				87,3
			87,3	87,0
				86,7
				83,0
			83,0	82,3
				82,3
				82,6
			82,7	82,7

Примеры вычисления скользящего среднего:

1982 г.(84 + 94 + 92) / 3 = 90,0;

1983 г. (94 + 92 + 83) / 3 = 89,7;

1984 г.(92 + 83 + 91) / 3 = 88,7;

1985 г.(83 + 91 + 88) / 3 = 87,3.

Составляется график. На оси абсцисс указываются годы, на оси ординат - число хозяйств с высокой урожайностью. Указываются координаты числа хозяйств на графике и соединяют полученные точки ломаной линией. Затем указываются координаты скользящей средней по годам на графике и соединяются точки плавной полужирной линией.

Более сложным и результативным методом является сглаживание (выравнивание) рядов динамики с помощью различных функций аппроксимации. Они позволяют формировать плавный уровень общей тенденции и основную ось динамики.

Наиболее эффективным методом сглаживания с помощью математических функций является простое экспоненциальное сглаживание. Этим методом учитываются все предшествующие наблюдения ряда по формуле:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

где S t - каждое новое сглаживание в момент времени t ; S t - 1 - сглаженное значение в предыдущий момент времени t -1; X t - фактическое значение ряда в момент времени t ; α - параметр сглаживания.

Если α = 1, то предыдущие наблюдения полностью игнорируются; при величине α = 0 игнорируются текущие наблюдения; значения α между 0 и 1 дают промежуточные результаты. Изменяя значения этого параметраможно подобрать наиболее приемлемый вариант выравнивания. Выбор оптимального значения α осуществляется путем анализа полученных графических изображений исходной и выравненной кривых, либо на основе учета суммы квадратов ошибок (погрешностей) вычисленных точек. Практическое использование этого метода следует проводить с использованием ЭВМ в программе MS Excel . Математическое выражение закономерности динамики данных можно получить с помощью функции экспоненциального сглаживания.

Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы: 1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уров-ней ряда.

2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.

Методы «механического» сглаживания.

Сюда относятся:

а) Метод усреднения по двум половинам ряда , когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.

б) Метод укрупнения интервалов , при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.

в) Метод скользящей средней . Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период.

Последовательность определения скользящей средней:

Устанавливается интервал сглаживания или число входящих в него величин ряда. В случае если при расчете средней учитываются три величины, скользящая средняя принято называть трехчленной, если пять – пятичленной и т.д. В случае если не сглаживаются мелкие, беспорядочные колебания величин в ряду динамики, то интервал (число скользящей средней) увеличивают. В случае если волны следует сохранить, число членов уменьшают.

Исчисляют первое среднее значение по простой среднеарифметической: Σy i / m, где Σy i – 1- ая группа ряда; m – членность скользящей средней. К примеру, для трёхчленной скользящей средней первая точка нового ряда будет иметь значение Y 1 = (y 1 + y 2 + y 3) / 3.

Для расчёта значения Y 2 отбрасывают значение у 1 , а в расчёт средней включают значение у 4 , ᴛ.ᴇ. .Y 2 = (у 2 + у 3 + у 4) / 3. Процесс продолжается до тех пор, пока в расчет Y i будет включена последняя группа (3 шт.) данных исследуемого ряда динамики.

По ряду динамики, построенному из средних значений Y i , выявляют общую тенденцию развития явления.

Методы «аналитического» выравнивания

Более точным способом отображения тенденции динамического ряда является аналитическое выравнивание, т. е. выравнивание с помощью аналитических формул. В этом случае динамический ряд выражается в виде функции у (t), в которой в качестве основного фактора принимается время t, и изменения аргумента функции определяют значения у i . Фактическим (или эмпирическим) рядом динамики называют исходные данные измерения параметра, т. е. данные, полученные опытным путем, посредством наблюдения. Οʜᴎ обозначаются у i . Расчетными (или теоретическими) уровнями ряда называют значения, полученные в результате подстановки в уравнение тренда значений t, и обозначают их Y i

Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t) . На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса.

Чаще всего при выравнивании используются зависимости: линей-ная; параболическая; экспоненциальная. Вариантом решения вопроса выравнивания являются линии регрессии (см. разд. 4.2).

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, целью аналитического выравнивания является: - определение вида функционального уравнения; - нахождения параметров уравнения; - расчет «теоретических», выровненных уровней, отображающих основную тенденцию ряда динамики. Графическое отображение изменения уровней ряда играет большую роль в применении данного вида выравнивания. Оно позволяет ускорить процедуру анализа и увеличить степень наглядности полученных результатов.

Одной из задач анализа рядов динамики, является установление закономерностей изменения уровней изучаемого показателя во времени.

В некоторых случаях эта закономерность развития объекта вполне ясно отображается уровнями динамического ряда. Однако часто приходится встречаться с такими рядами динамики, когда уровни ряда претерпевают самые различные изменения. В подобных случаях для определения основной тенденции развития, достаточно устойчивой на протяжении данного периода, используют особые приёмы обработки рядов динамики.

Уровни ряда динамики формируются под совокупным влиянием множества длительных и кратковременных факторов, в том числе различных, случайных обстоятельств. В то же время выявление основной тенденции изменения уровня ряда предполагает её количественное выражение, которое свободно от случайных воздействий. Существуют различные методы выявления тенденции развития динамики. Одним из приёмов выявления основной тенденции является метод укрупнения интервалов. Этот способ основан на укрупнении периодов времени, к которым относятся уровни ряда. Например, ряд ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т.д.

Другой метод - метод подвижной (скользящей) средней. Суть метода состоит в замене исходных уровней средними арифметическими за определённые периоды. При этом сначала для временного ряда определяется интервал сглаживания . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нежно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Процесс сглаживания, для первых уровней динамического ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в средине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т. д. Для вычисления сглаженных уровней временного ряда применяется формула:

(5.6)

В результате такой процедуры получаются сглаженных значений уровней ряда; при этом первые уровней и последние уровней ряда теряются (не сглаживаются).

К этому методу сглаживания (выравнивания) примыкает экспоненциальное сглаживание. Особенность данного метода заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом. Если для исходного динамического ряда соответствующие сглаженные значения уровней обозначить через , , то экспоненциальное сглаживание осуществляется по формуле:

где параметр сглаживания; называется коэффициентом дисконтирования.

Используя приведенное выше рекуррентное соотношение (5.7) для всех уровней ряда, начиная с первого и кончая моментом времени , можно получить, что экспоненциальная средняя, т. е. сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней:

, (5.8)

где величина, характеризующая начальные условия.

В практических задачах обработки экономических временных рядов рекомендуется (необоснованно) выбирать величину параметра сглаживания в интервале от 0,1 до 0,3. Других точных рекомендаций для выбора оптимальной величины параметра пока нет. В отдельных случаях Р. Браун предлагает определять величину исходя из длины сглаживаемого ряда:

Что касается начального параметра So, то в конкретных задачах его берут или равным значению первого уровня ряда , или равным средней арифметической нескольких первых членов ряда, например, членов :

Указанный выше порядок выбора величины So обеспечивает хорошее согласование сглаженного и исходного рядов для первых уровней. Если при подходе к правому концу временного ряда сглаженные этим методом значения при выбранном параметре начинают значительно отличаться от соответствующих значений исходного ряда, необходимо перейти на другой параметр сглаживания. Заметим, что при этом методе сглаживания не теряются ни начальные, ни конечные уровни сглаживаемого временного ряда.

Санкт-Петербургский юридический институт (филиал) Академии

Генеральной прокуратуры Российской Федерации

Кафедра общегосударственных и социально-экономических

дисциплин

Е.А. Разумовская

Практикум по курсу

«Правовая статистика»

Часть 2

Санкт-Петербург

ОБРАБОТКА ДИНАМИЧЕСКИХ РЯДОВ

1. ОПИСАНИЕ РАБОТЫ

Цель работы

Анализ статистики преступности для выявления закономерностей, тенденций и прогнозирования развития процесса.

Метод выполнения

Обработка исходных данных методами укрупнения ,сглаживания исмыкания .

ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ

Изучение статистики преступности имеет большое практическое значение. Анализ закономерностей развития этого процесса дает возможность правоохранительным органам прогнозировать будущее развитие преступности, оптимально распределять силы и средства для борьбы с ней.

Преступность – это сложный общественный процесс, его развитие определяют различные факторы, в первую очередь – экономические. Динамика (т.е. развитие во времени) преступности зависит также от политической ситуации, исторических традиций, наличия особо криминогенных зон и объектов. Деятельность правоохранительных органов тоже можно отнести к факторам, влияющим на развитие преступности.

Трудность анализа состоит в том, что на основные тенденции развития процесса накладываются случайные отклонения, колебания и выбросы. Основная задача статистической обработки состоит как раз в отсечении этой случайной компоненты и выявления основных тенденций, закономерностей развития. Именно такая обработка исходных данных должна быть проведена в данной работе.

Понятие динамического ряда

Ряд в статистике – это упорядоченная совокупность числовых данных, полученных при наблюдении изучаемого явления.

Ряды позволяют производить следующие статистические исследования:

сравнение явлений в процессе их развития во времени,

сравнение явлений по различным их формам и видам,

выявление взаимной зависимости явлений или зависимости от общей причины.

Пример явления, развивающегося во времени: число зарегистрированных преступлений данного вида на данной территории. Если регистрировать количество преступлений регулярно на протяжении достаточно длительного промежутка времени, затем правильно обработать полученный ряд данных, то можно выявить тенденции развития процесса, спрогнозировать будущие изменение ситуации и заранее подготовить адекватные меры борьбы с преступностью.

Процесс развития, изменения или движения социальных явлений во времени в статистике принято называть динамикой .

Динамический ряд - упорядоченная совокупность значений выбранного статистического показателя, изменяющихся во времени.

Величины ряда могут характеризовать явление по-разному:

Интервальный ряд отражает величину показателей, полученных за определённые периоды (интервалы) времени.

Например, ряд, содержащий количество гражданских дел, рассмотренных в суде за каждый месяц календарного года.

Моментный ряд характеризует уровни правового процесса на определенные моменты времени (даты отчета).

Например, количество заключенных на начало каждого календарного года.

Важнейшее условие построения и исследования рядов динамики – это однородность (сопоставимость) значений, относящихся к различным периодам.

Однородность во времени требует, чтобы значения ряда соответствовали показателю, характеризующему явление, за один и тот же отрезок времени, или чтобы соседние значения ряда были разнесены во времени друг от друга на равные промежутки.

Однородность в пространстве требует, чтобы территория, которую характеризует каждый показатель ряда, не изменялась на исследуемом временном отрезке.

Однородность по кругу охватываемых объектов требует, чтобы данные рядов относились к одинаковому количеству объектов (людей, административных единиц, возрастному промежутку и т.д.)

Однородность по сущности исследуемых величин требует, чтобы на рассматриваемом временном отрезке не изменялось уголовное законодательство.

Однородность по методологии требует, чтобы на рассматриваемом временном отрезке не изменялась методика получения показателя.

Методы укрупнения и сглаживания динамических рядов

Укрупнение и сглаживание – это математические операции над данными динамического ряда, которые позволяют выявлять тенденции, т.е. наиболее медленные составляющие изучаемого процесса, которые наблюдаются на фоне быстрых случайных всплесков и колебаний.

Такой подход к динамическому ряду, описывающему социальное явление, означает, что явление рассматривается как арифметическая сумма быстро и медленно меняющихся процессов.

РЯД(t ) = МЕДЛ(t ) + БЫСТР(t )

Целью обработки динамического ряда является разделение этих слагаемых. Во многих случаях такая модель социальных явлений правомерна.

Укрупнение динамического ряда - разбиение исходного ряда на неперекрывающиеся группы соседних данных (пары, тройки, и.т.д.), а затем вычисление суммы внутри каждой группы.

Получается новый ряд, число значений в котором будет меньше исходного в два, три или более раз, соответственно. Рассмотрим пример статистики женщин, совершивших преступления в период 2008 – 2010 годов по полугодиям.

Наблюдаются сезонные колебания данных, для выявления тенденции применим укрупнение: сгруппируем данные по 2 и сложим в каждой группе.

Исходный ряд :x 1 = 110 210,x 2 = 90 624,…,x 6 = 77 916.

Укрупнение по 2 :y1 = 110 210 + 90 624 = 200 834,

y2 = 105 796 + 66 406 = 194 202,

y3 = 94 459 + 77 916 = 172 375.

Получим данные по годам, а не по полугодиям: вместо 6 чисел - 3, но стала явно видна тенденция к снижению показателя. Аналогичным образом можно проводить укрупнение по 3, 4 и более периодов в одной группе.

Сглаживание динамического ряда - разбиение исходного ряда на перекрывающиеся группы данных по два, три или более смежных значений, (сдвиг по исходному ряду на одно значение), а затем вычисление среднего арифметического в каждой группе (скользящее среднее).

После обработки остается на 1, 2 и т.д. значения меньше в зависимости от величины групп (2, 3,…).

Рассмотрим метод сглаживания на том же примере статистики женщин-преступниц, применим сглаживание по 3 (среднее арифметическое первых трех элементов, затем 2, 3 и 4 и т.д. – это пересекающиеся группы данных).

Сглаживание по 3 :y 1 = (x 1 +x 2 +x 3) / 3 = 102 210,

y 2 = (x 2 +x 3 +x 4) / 3 = 87 609,

y 3 = (x 3 +x 4 +x 5) / 3 = 88 887,

y 4 = (x 4 +x 5 +x 6) / 3 = 79 594.

После сглаживания можно отметить следующее поведение процесса: снижение, стабильность, снова снижение показателя, однако, данных явно недостаточно, чтобы отфильтровать сезонные колебания.

Укрупнение и сглаживание ведут к уменьшению случайных всплесков, особенно хорошо тенденции видны на графиках , построенных по укрупненным или сглаженным данным. Укрупнение применяют к интервальным динамическим рядам, а сглаживание - как к интервальным, так и к моментным рядам.

Метод смыкания динамических рядов

Для изучения закономерностей и тенденций правовых процессов нужны однородные совокупности данных, однако в правовой сфере происходят существенные сдвиги: изменения законодательства, форм учета, укрупнение и разукрупнение территориально-административных единиц (например, изменение перечня тяжких преступлений, объединение субъектов РФ и т.д.). Для компенсации возникшей неоднородности данных используют:

Метод смыкания динамических рядов – выбор промежутка времени, на котором известны старые и новые показатели, принятие его за базовый (100%) и пропорциональный пересчет старых показателей влево, а новых – вправо по временной оси.

Рассмотрим статистику преступности в условном городе Nза 1991 – 1996 годы, ряд не обладает свойством однородности, т.к. в 1994 году законодательно изменился перечень тяжких преступлений.

В переходный год известны показатели по старой и новой форме, примем этот год за базовый и присвоим ему значение 100% (проценты не пишем). Найдем коэффициенты пропорциональности для старых данных по 1994 году: 100 / 80 = 1,25, для новых данных: 100 / 150 = 0,67. Умножим старые данные 1991 – 1993 годов на 1,25, новые данные 1995 – 1996 годов – на 0,67 и получим сомкнутый ряд сопоставимых показателей, по которому можно изучать тенденции процесса.

Исходные данные задачи

В данной работе изучается статистика преступности (криминальная статистика) заданного вида в пределах одного населённого пункта, регистрировавшаяся помесячно на протяжении трех лет. Такой набор статистической информации является типичным примером динамического ряда интервального типа .

В приложении № 1 методического руководства дано общее описание листа Excel, на котором нужно выполнить задание. В приложении № 2 приведена статистическая таблица –сводка количества преступлений 14 видов в двух городах. Информация представлена за три года: два года до изменения территориальных границ городов, один год – после, в первый месяц третьего года (январь) приведена статистика преступлений как в старых, так и в новых границах городов.

Рассмотрим информацию за первые два года - это двадцать четыре целых числа. Обозначим их:

а 1 , а 2 , … , а 24

Как отмечалось в предыдущем пункте, динамический ряд пригоден для статистического анализа, если он соответствует условиям однородности. В нашем случае первичные статистические данные за два года удовлетворяют критерию однородности:

во времени - сведения о количестве преступлений собраны за одинаковые временные интервалы, следующие по порядку один за другим;

в пространстве - данные относятся к одному территориальному объекту в одних и тех же границах;

по сущности – данные относятся к одному классу явлений, в нашем случае, к одним видам преступлений.

Подразумеваются также выполненными следующие условия однородности: неизменность законодательства в части классификации данных преступлений, единство методики сбора и регистрации первичной информации на протяжении всего периода наблюдений.

Укрупнение ряда (кратности 2, 3, 4, 6)

Новый, укрупненный в два раза ряд формируется из исходных данных

а 1 , а 2 , … , а 24 по формуле:

b i / 2 = a i -1 + a i , i = 2, 4, 6, … , 24 (1)

Иными словами, при формировании укрупненного вдвое ряда b первое число исходного рядаa складывается со вторым, третье с четвертым и т.д.

После укрупнения исходного динамического ряда в два раза (кратность равна двум) данных становится в два раза меньше. Таким образом, метод укрупнения позволяет взглянуть на процесс в целом, выделить главное, опустив мелкие детали.

Аналогичным образом можно укрупнить ряд в три, четыре, шесть и более раз (задать различную кратность укрупненного ряда):

c i/3 = a i-2 + a i-1 + a i , i = 3, 6, 9, …, 24 (2)

d i/4 = a i-3 + a i-2 + a i-1 + a i , i = 4, 8, 12, …, 24 (3)

e i/6 = a i-5 + a i-4 + a i-3 + a i-2 + a i-1 + a i , i = 6, 12, 18, 24 (4)

При формировании ряда с исходные данные рядаа разбиваются на группы по три штуки и складываются, для рядаd - в группы по четыре штуки, для рядаe – в группы по шесть штук. Соответственно, рядb получился короче исходного рядаа в два раза, рядс – в три раза, рядd – в четыре раза, рядe – в шесть раз.

Какая же кратность укрупнения является оптимальной? Чтобы ответить на этот вопрос, нужно знать временные параметры изменения основной тенденции процесса: продолжительность роста или снижения, периодичность сезонных колебаний и т.д.

В реальных условиях эти параметры сами являются предметом изучения. Поэтому лишь эмпирическим путем можно определить оптимальную кратность укрупнения динамического ряда в нашей задаче. Метод эффективно работает, когда характер процесса (стабильность, рост, снижение и т.д.) проявляются достаточно долго.

Сглаживание ряда (кратности 3, 4, 5)

Сглаженный по три элемента (кратность равна 3) ряд образуется на основе первичных данных по формуле скользящего среднего:

f i = (a i + a i +1 + a i +2) / 3, i = 1, 2, …, 22 (5)

Иными словами, берут первое, второе и третье число ряда a , находят среднее арифметическое (складывают их, и сумму делят на 3), получается первое число рядаf . Затем берут второе, третье и четвертое числа рядаa (со сдвигом на один элемент ряда – поэтому и называется метод скользящего среднего) и, проделав аналогичные операции, получают второй элемент рядаf , и т.д.

Следует обратить внимание на то, что новый ряд на два элемента короче исходного. В соответствии с формулой сглаживание проводится по трем соседним элементам исходного ряда.

Аналогичным образом можно применить сглаживание по четырем, пяти и более элементам (кратность равна 4, 5 и т.д.):

g i = (a i + a i+1 + a i+2 + a i+3) / 4, i = 1, 2, …, 21 (6)

h i = (a i + a i+1 + a i+2 + a i+3 + a i+4) / 5, i = 1, 2, …, 20 (7)

При формировании ряда g исходные данные рядаа берут по четыре штуки и находят их среднее арифметическое, для рядаh - по пять штук. Соответственно, рядf получился короче исходного рядаа на два элемента, рядg – на три элемента, рядh – на четыре элемента.

Так же, как в методе укрупнения, параметр кратности (количество элементов исходного ряда, выбранное для вычисления среднего) нельзя рассчитать заранее, его следует определить эмпирически по полученным результатам.

Сглаженный ряд позволяет изучать средний уровень преступности и может служить основой для прогнозирования будущего развития процесса. Метод сглаживания особенно эффективен для выявления сезонных колебаний и поиска скачков в среднем уровне процесса.

Анализ результатов

После того, как проведена обработка первичных данных по формулам для различной кратности, построены графики укрупненных и сглаженных рядов, наступает следующий этап анализа – выявление тенденции изменения преступности.

Показатели

Число тяжких прест.
(старый перечень)

Число тяжких прест.
(новый перечень)

Сомкнутый ряд