Анализ рядов распределения. Показатели формы распределения

Анализ рядов распределения. Показатели формы распределения

Социология, социальная работа и статистика

ТЕМА 3 Ряды распределения. Показатели вариации ПЛАН ЛЕКЦИИ 1. Понятие рядов распределения. 2. Характеристики центра распределения. Средние величины. 3. Характеристики вариации. 4. Характеристики формы распределения. 1. Понятие рядов распределения 1. В результате...

ТЕМА 3

Ряды распределения. Показатели вариации

ПЛАН ЛЕКЦИИ

1. Понятие рядов распределения.

. Средние величины.

3. Характеристики вариации.

4. Характеристики формы распределения.

1. Понятие рядов распределения

1. В результате группирования получают ряды распределения. Ряд распределения — упорядоченная последовательность пар элементов: вариант-частота. Варианта - отдельное значение групировочного признака; частота - количество элементов в группе с соответствующим значением (уровнем) признака. Хорошим примером ряда распределения будут группированные результаты сдачи экзамена группой студентов:

«неудовлетворительно» - 4

«удовлетворительно» ~ 8

«хорошо» - 10

«отлично» - 3.

Вместо частот иногда удобнее употреблять часть, выраженную коэффициентом или процентом. В зависимости от признака ряды распределения бывают атрибутивными , как в приведенном выше примере, или вариационными , например распределение рабочих по уровню заработка.

Вариационные ряды могут быть дискретными или интервальными . Дискретные ряды построены для разрывных, или дискретных признаков. Дискретным является такой признак, который имеет определенные значения, между которыми не может быть никаких других (число детей в семьи). Интервальные ряды строятся, как правило, для непрерывных признаков , которые могут принимать любые значения в полных границах и выражаются лишь приблизительно (рост человека).

Интервальный ряд может быть построен и для дискретного признака, если она изменяется (варьирует) в широких границах (например, распределение всех страховых компаний города за численностью работников). При этом варианты группируются в интервалы, а частоты относятся не к отдельному значению признака, как в дискретных рядах, а ко всему интервалу.

Очень полезным и даже интересным может быть графическое изображение рядов распределения. Это будто фотография всей совокупности. Укажем, что дискретный ряд изображается в виде полигона (рис. 3.1), а вариационный ряд с равными интервалами ~ в.

Число детей, чел.

Рис. 3.1. Распределение семей по количеству лиц в семье в г. Киеве в 1995 г. (по данным социологического обследования).

виде гистограммы (рис. 3.2)

Рис. 3.2. Распределение населения г. Киева по возрасту в 1995 г. (по данным социологического обследования).

При возрастании объема совокупности и уменьшении ширины интервала гистограмма приближается к кривой.

Ряд распределения может быть охарактеризован системой характеристик (статистических оценок), среди которых различают характеристики центра, вариации и формы распределения.

2. Характеристики центра распределения . Средние величины.

К характеристикам центра относятся средняя, мода и медиана.

Средняя в статистике - абстрактная, обобщающая величина, которая характеризует уровень варьирующего признака в качественно однородной совокупности. Колебание индивидуальных значений признака, вызванные действием разных факторов, уравновешиваются в средней величине.

Средние, которые применяют в статистике, принадлежат к классу степенных, которые в обобщенной форме имеют вид:

где х - индивидуальные значения варьирующего признака (варианты);

z - показатель степени средней;

n — число вариант.

Конкретный вид средней зависит от ее степени. Основные виды степенных средних приведены в табл. 3.1. В ней f – частота (повторяемость индивидуального значения).

Таблица 3.1.

Формулы степенных средних

Степень (Z )

Название средней

Формула расчета

простая

взвешенная

Средняя гармоническая

Средняя геометрическая

Средняя арифметическая

Средняя квадратичная

При изучении закономерностей распределения применяют среднюю арифметическую, вариации - среднюю квадратичную, интенсивности развития — среднюю геометрическую. Разные виды средних, вычисленные для одних и тех же данных, имеют разную величину. Соотношение между ними имеет следующий вид и называется правилом мажорантности:

В социально-экономической статистике вычисления различных средних для одной и той же совокупности нецелесообразно, поэтому стоит вопрос выбора вида средней в каждом конкретном случае исследования.

Рассмотрим условия и примеры вычисления средних.

Средняя арифметическая — одна из наиболее распространенных, применяется в тех случаях, когда объем варьирующего признака для всей совокупности есть сумма индивидуальных значений ее отдельных элементов. Для не сгруппированных данных вычисляют среднюю арифметическую простую, для сгруппированных - взвешенную. Например, если имеем список рабочих строительной бригады, которая содержит данные об индивидуальных заработках за месяц, то, наверное, легче не подсчитывать количество рабочих, которые заработало одинаковые суммы денег за данный период, а просто подытожить все заработки, а потом поделить на численность бригады:

где x i - индивидуальные заработки, n — общее количество рабочих. Когда же, например, вычисляется средний заработок сотрудников кафедры, где профессора, доценты, лаборанты имеют фиксированные оклады, то удобнее перед суммированием перемножить количество профессоров на величину их оклада и т.д.:

где f - численность сотрудников соответствующей должности. В данном случае частота выступает в роли веса, поэтому и средняя носит название взвешенной. В обеих случаях результат будет одинаковой.

Если в роли веса применяют части (w ) , тогда формула будет иметь вид:

когда w представлены в процентах и

если w представлены в коэффициентах.

Если средняя вычисляется для интервального ряда распределения, то вариантами выступают середины интервалов, которые определяют как полусумму двух границ. Ширину открытого интервала условно принимают такой же, как в соседнем закрытом интервале.

Вычисление средней из относительных величин (средний процент, средний удельный вес) имеет особенность. В роли веса здесь выступают знаменатели тех соотношений, с помощью которых были вычислены индивидуальные относительные показатели.

Пример 3.1

На основании приведенных данных вычислить средний процент выполнения плана двумя бригадами (табл. 3.2).

Можно было бы предположить, что обе бригады в среднем выполнили план на 103%. Но средний показатель выполнения плана будет тяготеть в сторону цеха, который имеет большую часть продукции в общем плановом объеме, то есть к цеху №1.

Таблица 3.2

Выполнение бригадами цеха плана выпуска продукции

Бригада

Выполнение плана, %

Плановый выпуск, ед.

№1

№2

Действительно,

Свойства средней арифметической:

1) Алгебраическая сумма отклонений всех вариант от средней равняется нулю:

2) Если каждую варианту увеличить или уменьшить на любую постоянную величину, то и средняя изменится на ту же величину:

3) Если каждую варианту разделить или помножить на любое число, то и средняя уменьшится или увеличится в столько же раз:

4) Если частоты всех вариант увеличить или уменьшить на одно и то же самое число, то средняя при этом не изменится:

5) Сумма квадратов отклонений вариант от средней меньше любой другой величины:

Исходя из формулы вычисления средней, можно говорить о том, что на среднюю влияет колебание структуры совокупности. Объясним на таком примере.

Пример 3.2

Имеем данные о заработной плате и количестве сотрудников кафедры в разрезе (профессоры, лаборанты) за два периода (табл. 3.3).

Рассчитаем среднюю заработную плату за сентябрь, пользуясь формулой средней арифметической взвешенной.

Тогда

За октябрь она будет равняться:

Таблица 3.3

Оплата работы сотрудников кафедры за два периода

Должность

Оклад, грн.

Количество сотрудников, чел.

сентябрь

октябрь

сентябрь

октябрь

Профессор

Лаборант

Итого

То есть, при одинаковых условиях оплаты работы и численности сотрудников кафедры средняя уменьшилась благодаря изменению структуры ее профессионального состава.

Средняя гармоническая — применяется в тех случаях, если нам известны не сами варианты, а их обратные числа.

Пример 3.3

Например, мы имеем данные о затратах времени в часах на изготовление одной детали любым из трех рабочих: 1/2, 1/3 и 1/7. Требуется вычислить средние затраты времени на одну деталь. Тогда

Рассмотрим на примере применения формулы средней гармонической взвешенной.

Пример 3.4

Таблица 3.4

Средняя выработка на одного рабочего и объем продукции для двух видов бригад за апрель

Бригада

Фактический объем произведенной продукции, тыс. грн. (Q )

Средняя выработка одного рабочего, тыс. грн.

Количество бригад

Специализированная

Комплексная

Итого

1620

Для решения этой задачи необходимо исходить из экономического смысла усредненного показателя. То есть, средняя выработка одного рабочего (W ) будет равняться:

В условии отсутствуют данные о численности рабочих (T ), то есть мы не знаем частоты (f ), но ее можно рассчитать по формуле для каждой из бригад. Тогда в нашем примере необходимо использовать формулу средней гармонической взвешенной, где — средняя выработка одного рабочего для каждого вида бригад, Q - фактический объем произведенной продукции.

Средняя выработка одного рабочего для всех бригад составлял в апреле 5,4 тыс. грн.

В литературе можно встретить рекомендации по определению средних для признаков порядковой и номинальной шкалы. Авторы считают, что, если ранги порядковой шкалы отображают приблизительно одинаковые расстояния между отдельными качествами явлений, средний ранг можно вычислять так же, как и при измерении признаков метрической шкалы. В качестве примера они приводят средний уровень квалификации (разряд), средний аттестационный балл и др. Мы из своей стороны считаем, что «одинаковость расстояния» в приведенных примерах довольно сомнительная. Далее отмечается, что в некоторых случаях ранги могут быть числами положительными и отрицательными. Так, значение удовлетворенности рабочих своей профессией, «удовлетворен», «равнодушный», «недовольный», предлагается обозначить баллами, соответственно, 1, 0, -1, а потом определить среднюю арифметическую для всей бригады.

Отметим, что результаты таких процедур могут быть довольно условными, а поэтому советуем быть с ними осторожными.

К характеристикам центра распределения, кроме средней арифметической, принадлежит мода и медиана, которые еще называют порядковыми (структурными) средними и рассматривают вместе с такими характеристиками, как квантили и децили.

Мода (Мо) — значение варианты, которое чаще повторяется в ряду распределения. В дискретном ряду моду легко отыскать визуально, в интервальном ряду легко отыскать модальный интервал, а приблизительное значение моды исчисляется по формуле

Нижняя граница модального интервала; — размер модального интервала; - частота модального интервала; - частота предшествующего интервала; частота интервала, следующего за модальным.

Медиана (Ме) — варианта, которая делит ранжированный ряд на две, равные по численности, части. Так, если в ряду распределения рабочих по возрасту Ме = 34, то это означает, что половина из них меньшие этого возраста, половина — старшие этого возраста. Если ряд содержит парное число членов, медиана равняется средний из двух значений расположенных внутри ряда. Для нахождения медианы в дискретном ряду сначала вычисляют полусумму частот, а потом определяют, какая варианта приходится на нее. Для интервального ряда медиану вычисляют по формуле

где - нижняя граница медианного интервала; — размер медианного интервала; полусумма частот медианного интервала; — сумма накопленных частот перед медианным интервалом; — частота медианного интервала.


Пример 3.5

Таблица 3.5

Распределение семей по количеству лиц в семье в г. Киеве в 1995 г. (по данным социологического обследования)

Размер семьи, чел.

Частость, %

Накопленная частость, %

20.3

29.7

36.6

66.3

24.7

91.0

97.2

99.4

7 и больше

100.0

В этом ряду распределения Мо = 3 и Ме = 3, так как больше половины единиц совокупности находится в первых трех группах.

Пример 3.6

Таблица 3.6

Возрастная структура населения Луганской области в 1999 г. (на начало года) (по данным Луганского областного управления статистики)

Группы по возрасту

Количество, тыс.

Частость, %

Накопленная частость, %

251,0

10-19

407,1

20-29

360,4

30-39

388,8

40-49

417,2

50-59

283,2

60-69

323,7

70 и старше

236,7

Всего

В этом примере модальный интервал Мо расположен в группе (40-49), тогда

Медианный интервал Ме расположен в группе (30-39), тогда по формуле

Каждую из двух частей, на которые медиана разделяет совокупность по объему, в свою очередь также можно поделить с помощью квартилей Q .

Первый квартиль Q 1 , таким образом, отделяет четверть совокупности, второй Q 2 то есть сама медиана, -половину, третий Q 3 - три четверти. Также вычисляют децили и процентили . Так, q - й процентиль — это число, меньше которого принимают значение q % совокупности. Таким образом, 25 — й процентиль есть первая квартиль, а 10 — й процентиль — первая дециль. Иногда Q 1 и Q 3 соответственно, называют нижним и верхним квартилями.

Меру рассеяния вариант можно характеризовать величиной (Ме - Q 1 ;) или (Q 3 - Ме ), еще лучше - их средним значением - средним квартильным отклонением, которое исчисляется по формуле

Q=(Q 1 -Q 3 )/2/

Укажем, что в интервале (Ме ± Q ) лежит половина всех вариант. Мода и медиана не зависят от всех вариант совокупности и потому не заменяют среднюю, как обобщающую величину, а лишь дополняют ее. В отдельных случаях они имеют даже некоторое преимущество перед средней арифметической. Значения всех трех характеристик совпадают лишь в случае симметрии ряда распределения (рис. 3.3, 3.4, 3.5).

Характеристики центра, обобщая индивидуальное, характеризуют общее, тем не менее, не отображают степень и закономерности отклонения индивидуального от общего, то есть степень вариации и форму распределения.

3. Характеристики вариации

Вариация признака является свойством статистической совокупности и обусловлена действием большого множества взаимосвязанных причин, среди которых есть основные и второстепенные. Основные формируют центр распределения, второстепенные — вариацию признаков, совокупное их действие — форму распределения . Чем меньшая вариация, тем более надежными, типичными являются характеристики центра, прежде всего средняя.

Для характеристики вариации применяют систему таких оценок.

Размах вариации — это разность между наибольшим и наименьшим значением признака

В интервальном ряду распределения R определяют как разность между верхней границей последнего интервала и нижней границей первого или же разность между средними значениями этих интервалов.

Как мера вариации R не всегда может быть надежной, поскольку зависит от двух крайних значений, которые часто не являются типичными для совокупности, или имеют случайный характер. Они получили название «выбросы». В практике статистических исследований крайние значения подлежат обработке или, по крайней мере, внимательному рассмотрению. Как правило, это ошибки кодирования или регистрации, иногда они имеют случайный характер. Поэтому их часто просто выбрасывают, суживая тем самым размах и делая совокупность более однородной. Также уменьшает влияние случайных причин так называемый квартильный размах, вычисленный по формуле

В любом случае, отбрасывая крайние значения, следует помнить, что иногда с ними может быть связано что-то интересное или даже феноменальное. Вместо простого отбрасывания предлагают процедуры вычисления оценок распределения, которые нечутки к структуре данных и получили название робастных . Робастными оценками называют также оценки распределения, которые получают при применении этих методов.

Программы статистических пакетов часто предусматривают вычисления оценок Хампеля, Ендрюса и Тьюки.

Например, Тьюки (Тиісеу) предложил один из видов робастных оценок, а именно винзоризованные оценки. Суть в том, что крайние значения не отбрасываются, а заменяются. Если имеем упорядоченный ряд значений х 1 , х 2 , ..., х n , то х 1 присваивается значение х 2 а х n - значение x n -1 . Если такая операция не дает желательных результатов, то есть совокупность еще не становится довольно однородной, то процедуру повторяют (например, с помощью пакета статистических программ ВМОР до 5 раз). Так, при двукратной винзоризации х 1 и х 2 присваивается величина варианты х 3 , а двум последним в ряде — величина х n -2 .

Важно подчеркнуть, что статистический анализ относится к таким работам, где от усердия подготовки материала может зависеть успех всего дела. Относительно всяческих процедур «чистки» или предыдущей обработки данных, то здесь кроме профессиональной стороны дела существует еще и этическая. Исследователь должен стремиться к объективному, научно обоснованному результату, а он может оказаться и не таким, как хотелось бы.

Среднее отклонение вычисляется как:

1) среднее линейное отклонение:

а) невзвешенное: б ) взвешенное:

2) среднее квадратичное отклонение:

Характеристика вариации имеет название дисперсии:

а) невзвешенное: б) взвешенное:

На практике применяют более простую формулу расчета дисперсии:

Чем меньшее среднее отклонение, тем типичнее средняя, тем более однородная совокупность. всегда больше чем d . В симметричных и умеренно асимметрических распределениях = 1,25 d . Характеристики R , d и - именованные величины, которые имеют единицы измерения варьирующего признака.

При сравнении степени вариации одного и того же признака в разных совокупностях используют коэффициент вариации:

или линейный коэффициент вариации :

С его помощью можно оценить также однородность совокупности. Однородной принято считать совокупность, для которой < 33%, что учитывают при предварительной обработке данных.

Рассмотрим особенности вычисления некоторых характеристик для альтернативного признака. Обозначим наличие признака через 1, его отсутствие — через 0. Часть единиц, которые имеют данный признак обозначим через р, которые не имеют — через q .

Тогда

Очевидно, при отсутствии вариации =0; максимальное значение дисперсии составляет 0,25 при р = q =0,5 . Если номинальный признак принимает больше двух значений, оценка его вариации равняется произведению частей:

4. Характеристики формы распределения

Анализ статистической совокупности можно сделать более полным, если отобразить закономерности соотношения вариант и частот определенной функцией, которую называют теоретической кривой . Она является моделью реального явления в целом. Если кривая построена по данным наблюдения, то она имеет название эмпирической кривой .

По своей форме кривые распределения делятся на симметричные и асимметричные. Если в асимметричном распределении вершина смещена влево, то мы имеем правостороннюю асимметрию («правый хвост»), и наоборот.

Рис. 3.3. Левосторонняя асимметрия: < Ме < Мо.

Рис. 3.4. Симметричное распределение: = Ме = Мо ,

Рис. 3.5. Правосторонняя асимметрия: > Ме > Мо.

Кривые бывают одно-, дву- и многовершинные. Многовершинность свидетельствует о неоднородности совокупности.

В зависимости от формы вершины кривые распределения бывают остро- и плосковершинные. Степень асимметрии и островершинности измеряют с помощью коэффициента асимметрии и эксцесса, которые обозначают, соответственно, как А и Е . При нормальном распределении Е = 3, при островерхом Е > 3, при плосковерхом Е < 3 (рис. 3.6, 3.7). То есть можно вести речь про большую или меньшую остро(плоско)верхость.

Рис. 3.6. Островерхое распределение.

Рис. 3.7. Плосковерхое распределение.

Коэффициент асимметрии можно рассчитывать по простой формуле таким образом

Значение А s может быть положительным и отрицательным.

При симметричном распределении А == 0, при правосторонний ассиметрии А > 0, при левосторонний — А < 0. Если имеет место отклонение от 0 в того или другая сторону, то можно вести речь про большую или меньшую асимметрию.

Характеристики формы распределения базируются на моментах распределения. Момент распределения — это средняя k -ой степени отклонений - а.

В зависимости от величины а моменты делятся на первичные (а = 0), центральные (а = х) и условные (а = const ). Степень k определяет порядок момента . В литературе обычно записывают

Тогда

То есть для расчета коэффициента асимметрии и эксцесса прежде всего необходимо рассчитать моменты третьей и четвертой степени.

Особое место среди кривых распределения занимает нормальная кривая, которая отображает нормальное распределение (см. рис. 3.4), или распределение Гаусса. Оно есть результатом влияния неограниченного количества независимых один от другого факторов, который встречается в природе очень часто. Понятие нормального распределения положено в основу многих методов статистики.

Рассмотрим пример, который иллюстрирует методику расчета всех показателей вариации и формы распределения.

Пример 3.7

Имеем данные о выполнении норм выработки рабочими одного из цехов завода (табл. 3.7).

Таблица 3.7

Распределение рабочих по выполнению норм выработки

Группы по выполнению нормы, %

Количество рабочих, чел. (f )

Середина интервала x "

Кумулята,

x " f

Отклонение от средней

До 100

97.5

1170

12.3

100-105

102.5

2050

105-110

107.5

8600

110-115

112.5

5175

115-120

117.5

4230

120 и выше

122.5

12.7

Итого

21960

Так как данные сгруппированы, среднее рассчитывается по формуле средней арифметической взвешенной:

Для расчета показателей вариации построим табл. 3.8.

Таблица 3.8

Расчет показателей вариации и формы распределения

Группы

147.6

1815,48

22330,4

274663,9

146,0

1065,80

7780.3

56796,5

112,0

423,20

973,4

2238,7

124.2

355,34

905.4

2444.6

277,2

2734,44

16435,2

126550.9

76,2

967,74

12290,3

156086.8

Итого

883,2

7362,00

1453,2

618781,4

В табл. 3.8 в графах 1-2 приведенные промежуточные данные, которые рассчитаны для удобства пользования формулами. Используем их для расчета среднего линейного отклонения и дисперсии для сгруппированных данных:

Среднее квадратичное отклонение:

Относительные характеристики вариации:

а) линейный коэффициент вариации

Относительно низкие коэффициенты вариации свидетельствуют об однородности совокупности рабочих по выполнению норм выработки.

Для характеристики формы распределения используем коэффициент асимметрии и эксцесса через моменты третьего и четвертого порядка

Тогда

Рассчитанные значения свидетельствуют о том, что распределение рабочих по выполнению норм выработки левостороннее с небольшой плосковерхостью. Построим график распределения (рис. 3.8).

До 100 105-110 155-120

Выполнение нормы выработки, %

Рис. 3.8. Гистограмма распределения рабочих по выполнению норм выработки.

Вопросы для самоконтроля.

1. Назовите элементы вариационного ряда распределения. В чем различие между частотой и частостью?

2. Какими будут ряды распределения квартир по числу комнат и по густоте их заселения (чел./комн.)? Дискретными или интервальными?

3. Почему средняя является абстрактной величиной и почему обобщающей?

4. Чему равняется средняя заработная плата в коллективе, одна часть которого имеет заработок 100 грн., вторая - 500 грн.?

5. Назовите характеристики центра ряда распределения по признаку «профессия».

6. Каким образом изменится средний оклад сотрудников кафедры, если одной половине его увеличить вдвое , второй ~ вдвое уменьшить.

7. Назовите характеристики центра ряда распределения по признаку «уровень квалификации».

8. Постройте график распределения для таких данных о возрасте рабочих бригады:

№ п/п

возраст, лет

Вычислите Me , Q 1 , Q 3 , Q 4 .

9. Для каждой ли группы студентов численностью 25 чел. могут быть найдены такие характеристики, как мода и медиана для ряда распределения по возрасту; по полу?

10. На основании приведенных данных за месяц определить среднюю часть продукции высшего качества и среднюю производительность работы одного рабочего для всех бригад. Объясните, какие виды средних следует употреблять в данном случае и почему, производительность работы определяется как объем продукции произведенной одним работником за месяц.

Вид бригады

Число бригад

Объем выработанной за месяц продукции

Часть продукции высшего качества, %

Средняя производительность одного рабочего, тыс.грн.

Специализированная

96.0

Комплексная

92.6

11. На основе таких данных вычислить дисперсию образования работников фирмы:

Образование

Часть работников, %

среднее

среднее специальное

высшее

12. Вычислить характеристики такого ряда распределения:

№ работника

Заработок, грн.

13 Какие признаки называют дискретными; непрерывными?

К показателям центра распределения относятся средняя арифметическая, мода и медиана.

Под средней величиной понимают обобщающий показатель, характеризующий типичный уровень признака и рассчитанный на единицу однородной совокупности.

Средняя арифметическая вычисляется по формулам:

простая ; взвешенная ,

где - среднее значение признака; - варианты; - частоты; - численность совокупности.

Мода - величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности.

В дискретных рядах распределения модой будет варианта с наибольшей частотой.

В интервальном ряду мода определя6ется по формуле:

где - нижняя граница интервала, содержащего моду; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота послемодального интервала.

Медианой называется варианта, расположенная в середине вариационного ряда.

Если ряд дискретный имеет нечётное число единиц, то медианой будет варианта, расположенная в середине упорядоченного ряда и её порядковый номер. Если ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух вариант с порядковыми номерами: и .

В интервальном ряду медиана рассчитывается по формуле:

где - нижняя граница медианного интервала; - величина медианного интервала; - сумма накопленных частот, предшествующих медианному интервалу; -частота медианного интервала. Медианным является интервал, накопленная частота которого равна или больше полусуммы всех частот.

Конец работы -

Эта тема принадлежит разделу:

Статистика

Саратовский государственный аграрный университет им н и вавилова.. кафедра экономической.. построение и графическое изображение вариационных рядов..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Статистика

Статистика
Методические указания к выполнению расчётно-графической работы для студентов специальностей «Бухгалтерский учет, анализ и аудит», «Экономика и управление на предприятии АПК», «Менеджмент организаци

Оформление расчётно-графической работы
Расчётно-графическая работа печатается на компьютере шрифтом Times New Roman 14 размера с полуторным междустрочным интервалом, при наборе таблиц используется шрифт 12 размера с один

И их графическое изображение
Составление вариационных рядов рассмотрим на следующем примере. Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: урожайностью озимой пш

Показатели колеблемости признака
Для измерения колеблемости признака применяются следующие показатели вариации. Размах вариации- это разность между максимальным и минимальным значениями изучаемого признак

Показатели формы распределения
Зависимость распределения частот от вариации изучаемого признака есть закономерность распределения. Эмпирическое распределение – распределение, полученное в результ

В менюСервисвыберемАнализ данных,затем Описательная статистикаи нажмём ОК
2. В поле Входной интервалвведём адреса ячеек, содержащих исходные данные А1:В31. 3. Введём данные в поле Выходной интервал;в нашем случа

Статистические оценки параметров распределения
Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают ста

Проверка гипотезы о законе нормального распределения
Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе

Оценка значимости уравнения регрессии и параметров тесноты связи
Для оценки существенности, значимости коэффициента корреляции используется t-критерий Стьюдента. Находится средняя ошибка коэффициента корреляции по формуле:

Корреляционно-регрессионный анализ в Excel
Проведём корреляционно-регрессионный анализ взаимосвязи урожайности и затрат труда на 1 ц зерна. Для этого открываем лист Excel, в ячейки А1:А30 вводим значения факторного признака

По математической статистике
Выполнил студент … курса ….. группы _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ (ф.и.о.) “_ _” _ _ _ _ _ _ _ _ _ _ _ 20_ _ г. Сар

Критические точки распределения Стьюдента
Число степеней свободы Уровень значимости

Точные и асимптотические границы для верхней грани модуля разности истинной и эмпирической функций распределения
n Уровень значимости 0,05 Уровень значимости 0,01 точная граница асимптотическая гр

распределение ранжирование вариационный показатель

Среднее значение признаков совокупности, мода и медиана характеризуют центральную тенденцию распределения, указывают тот уровень признака, который является типичным, характерным для данной совокупности. Использование того или иного показателя распределения зависит от типа исходных данных и цели исследования. Поскольку средняя величина рассчитывается на единицу совокупности, но с использованием всех индивидуальных значений признака, она является обобщённой характеристикой всей совокупности.

Формулы расчёта. Средняя арифметическая простая:

где - значение признака у i_ой единицы совокупности, n - объём совокупности.

Медиана-значение признака единицы совокупности стоящий в центре ранжированного ряда.

где - нижняя граница медианного интервала, - величина группировочного интервала, - сумма частот (), - накопленная частота интервала, предшествующего медианному; - частота медианного интервала.

Мода - это значение показателя вокруг которого концентрируются

значительная часть единицы совокупности, т.е имеют значения близкие к модальному.

Мо= 45+163* (45-0)+(45-10)=136,69

где - нижняя граница модального интервала, - величина группировочного интервала, - частота модального интервала,

/ - частота интервала, предшествующего / следующего за модальным.

Таблица 3

Показатели центра и структуры распределения

В среднем в регионах России оборот малых предприятий за 2011 г.составил 214,52 млрд.руб. В 50% регионов России оборот малых предприятий за 2011 г. составил 142,45 млрд.руб.

Показатели структуры распределения

К показателям структуры, кроме медианы, также относят квартили, которые делят совокупность на четыре части, децили (10 частей) и прочие показатели. Использование тех или иных характеристик зависит от цели исследования и от объёма изучаемой совокупности (с увеличением объёма растёт число групп). В данной работе необходимо подсчитать только медиану и квартили .

Формулы расчёта. Нижний квартиль:

Верхний квартиль:

Таблица 4

Показатели структуры

В среднем в 25% в Регионах России оборот малого бизнеса не привышает 94,1 млрд.руб. и не выше 264,6 млрд.руб.

Показатели вариации

Вариация - различия у индивидуального значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:

Абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);

Относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации) .

Формулы расчёта. Размах вариации:

где и - максимальное и минимальное значение признака совокупности.

Дисперсия:

где - значение признака у i_ой единицы совокупности, - средняя арифметическая, - частота у i_ой единицы совокупности, - сумма частот ().

Среднее квадратическое (стандартное) отклонение:

Коэффициент вариации:

Таблица 5

Показатели вариации

Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 816,2 единицы. Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей, в том числе и коэффициент вариации, в данном случае равный 0,85%.Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность не однородна, т.к. коэффициент вариации больше 33%,значит существенна. В среднем величина по регионам России за 2012 г отличалась от среднего на 182,26 величин.

Графики являются наглядной формой отображения рядов распределения. Для изображения рядов применяются линейные графики и плоскостные диаграммы, построенные в прямоугольной системе координат.

Для графического представления атрибутивных рядов распределения используются различные диаграммы: столбиковые, линейные, круговые, фигурные, секторные и т. д.

Для дискретных вариационных рядов графиком является полигон распределения.

Полигоном распределения называется ломаная линия, соединяющая точки с координатами или где - дискретное значение признака, - частота, - частость.

График строится в принятом масштабе. Вид полигона распределения приведен на рис. 5.1.

Для изображения интервальных вариационных рядов применяют гистограммы , представляющие собой ступенчатые фигуры, состоящие из прямоугольников, основания которых равны ширине интервала , а высота - частоте (частости ) равноинтервального ряда или плотности распределения неравноинтервального Построение диаграммы аналогично построению столбиковой диаграммы. Общий вид гистограммы приведен на рис. 5.2.

Для графического представления вариационных рядов может использоваться также кумулята – ломаная линия, составленная по накопленным частотам (частостям). Накопленные частоты наносятся в виде ординат; соединяя вершины отдельных ординат отрезками прямой, получаем ломаную линию, имеющую неубывающий вид. Координатами точек на графике для дискретного ряда являются для интервального ряда - Начальная точка графика имеет координаты самая высокая точка - Общий вид кумуляты приведен на рис.5.3. Использование кумуляты особенно удобно при проведении сравнений вариационных рядов.

При построении графиков рядов распределения большое значение имеет соотношение масштабов по оси абсцисс и оси ординат . В этом случае и необходимо руководствоваться «правилом золотого сечения», в соответствии с которым высота графика должна быть примерно в два раза меньше его основания .

При проведении эмпирического исследования ряда распределения рассчитываются и анализируются следующие группы показателей:

Показатели положения центра распределения;

Показатели степени его однородности;

Показатели формы распределения.

Показатели положения центра распределения. К ним относятся степенная средняя в виде средней арифметической и структурные средние – мода и медиана.

Средняя арфметическая для дискретного ряда распределения рассчитывается по формуле:

В отличие от средней арифметической, рассчитываемой на основе всех вариант, мода и медиана характеризует значение признака у статистической единице, занимающей определенное положение в вариационном ряду.

Медиана ( Me) - значение признака у статистической единицы, стоящей в середине ранжированного ряда и делящей совокупность на две равные по численности части.

Мода (Mo) - наиболее часто встречаемое значение признак в совокупности. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и др.

Для дискретных вариационных рядов Mo и Me выбираются в соответствии с определениями: мода - как значение признака с наибольшей частотой : положение медианы при нечетном объеме совокупности определяется ее номером , где N – объем статистической совокупности. При четном объеме ряда медиана равна средней из двух вариантов, находящихся в середине ряда.

Медиану используют как наиболее надежный показатель типичного значения неоднородной совокупности, так как она нечувствительна к крайним значениям признака, которые могут значительно отличаться от основного массива его значений. Кроме этого, медиана находит практическое применение вследствие особого математического свойства: Рассмотрим определение моды и медианы на следующем примере: имеется ряд распределения рабочих участка по уровню квалификации.

Данные приведены в таблице 5.2.

Мода выбирается по максимальному значению частоты: при n max = 14 Mo =4, т.е. чаще всего встречается 4-ый разряд. Для нахождения медианы Me определяются центральные единицы Это 25 и 26-ая единицы. По накопленным частотам определяется группа, в которую попадают эти единицы. Это 4-ая группа, в которой значение признака равно 4. Таким образом, Me = 4, это означает, что у половины рабочих разряд ниже 4-го, а у другой – выше четвертого. В интервальном ряду значения Mo и Me вычисляются более сложным путем.

Мода определяется следующим образом:

По максимальному значению частоты определяется интервал, в котором находится значение моды. Он называется модальным.

Внутри модального интервала значение моды вычисляется по формуле:

Для расчета медианы в интервальных рядах используется следующий подход:

По накопленным частотам находится медианный интервал. Медианным называется интервал, содержащий центральную единицу.

Внутри медианного интервала значение Me определяется по формуле:

В неравноинтервальных рядах при вычислении Mo используется другая частотная характеристика – абсолютная плотность распределения:

Расчет моды и медианы для интервального ряда распределения рассмотрим на примере ряда распределения рабочих по стажу, приведенного в таблице 5.3.

Расчет Mo:

Максимальная частота n max = 13, она соответствует четвертой группе, следовательно, модальным является интервал с границами 12 – 16 лет.

Моду рассчитаем по формуле:

Чаще всего встречаются рабочие со стажем работы около 13 лет. Мода не находится в середине модального интервала, она смещена к его нижней границе, связано это со структурой данного ряда распределения (частота предмодального интервала значительно больше частоты постмодального интервала).

Расчет медианы:

По графе накопленных частот определяется медианный интервал. Он содержит 25 и 26-у статистические единицы, которые находятся в разных группах – в 3-ей и 4-ой. Для нахождения Me можно использовать любую из них. Расчет проведем по 3-ей группе:

Такое же значение Me можно получить при её расчете по 4-ой группе:

При сдвоенном центре Me всегда находится на стыке интервалов, содержащих центральные единицы. Вычисленное значение Me показывает, что у первых 25 рабочих стаж работы – менее 12 лет, а у оставшихся 25-ти, следовательно, - более 12 лет.

Моду можно определить графически по полигону распределения в дискретных рядах, по гистограмме распределения – в интервальных, а медиану - по кумуляте.

Для нахождения моды в интервальном ряду правую вершину модального прямоугольника нужно соединить с правым верхним углом предыдущего прямоугольника, а левую вершину – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Для определение медианы высоту наибольшей ординаты кумуляты, соответствующей общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Кроме Mo и Me в вариантных рядах могут быть определены и другие структурные характеристики – квантили. Квантили предназначены для более глубокого изучения структуры ряда распределения. Квантиль – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности. Различают следующие виды квантилей:

квартили – значения признака, делящие упорядоченную совокупность на 4 равные части;

децили – значения признака, делящие совокупность на 10 равных частей;

перцентели - значения признака, делящие совокупность на 100 равных частей.

Если данные сгруппированы, то значение квартиля определяется по накопленным частотам: номер группы, которая содержит i -ый квантиль. Определяется как номер первой группы от начала ряда, в котором сумма накопленных частот равна или превышает i ·N, где I – индекс квантиля. Если ряд интервальный, то значение квантиля определяется по формуле:

Рассчитаем квартили для ряда распределения рабочих участка по стажу работы:

Следовательно, у четверти рабочих стаж менее 7 лет и у четверти – более 16 лет. Таким образом, для характеристики положения центра ряда распределения можно использовать 3 показателя: среднее значение признака , мода, медиана .

При выборе вида и формы конкретного показателя центра распределения необходимо исходить из следующих рекомендаций:

Для устойчивых социально-экономических процессов в качестве показателя центра используют среднюю арифметическую. Такие процессы характеризуются симметричными распределениями, в которых

Для неустойчивых процессов положение центра распределения характеризуется с помощью Mo или Me . Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку занимает положение между средней арифметической и модой.

Вторая важнейшая задача при определении общего характера распределения – это оценка степени его однородности. Однородность статистических совокупностей характеризуется величиной вариации (рассеяния) признака, т.е. несовпадением его значений у разных статистических единиц. Для измерения вариации в статистике используются абсолютные и относительные показатели. Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и исследование формы распределения, т.е. оценку симметричности и эксцесса.

Из математической статистики известно, что при увеличении объема статистической совокупности и одновременного уменьшении интервала группировки полигон либо гистограмма распределения все более и более приближается к некоторой плавной кривой, являющейся для указанных графиков пределом. Эта кривая называется эмпирической кривой распределения и представляет собой графическое изображение в виде непрерывной линии изменения частот, функционально связанного с изменением вариант.

В статистике различают следующие виды кривых распределения :

одновершинные кривые; многовершинные кривые.

Однородные совокупности описываются одновершинными распределениями. Многовершинность распределения свидетельствует о неоднородности изучаемой совокупности или о некачественном выполнении группировки.

Одновершинные кривые распределения делятся на симметричные, умеренно асимметричные и крайне асимметричные.

Распределение называется симметричным, если частоты любых 2-х вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой . В таких распределениях

Для характеристики асимметрии используют коэффициенты асимметрии.

Наиболее часто используются следующие из них:

Коэффициент асимметрии Пирсона

В одновершинных распределениях величина этого показателя изменяется от -1 до +1. в симметричных распределениях As=0. При As>0 наблюдается правосторонняя асимметрия (рис.5.4). В распределениях с правосторонней асимметрией Mo Me

Рис. 5.4.Правосторонняя асимметрия Рис. 5.5. Левосторонняя асимметрия

Чем ближе по модулю As к 1, тем асимметрия существеннее:

Коэффициент асимметрии Пирсона характеризует асимметрию только в центральной части распределения, поэтому более распространенным и более точным является коэффициент асимметрии , рассчитанный на основе центрального момента 3-его порядка:

Центральным моментом в статистике называется среднее отклонение индивидуальных значений признака от его среднеарифметической величины.

Центральный момент k-ого порядка рассчитывается как:

Соответственно формулы для определения центрального момента третьего порядка имеют следующий вид:

Для оценки существенности рассчитанного вторым способом коэффициента асимметрии определяется его средняя квадратическая ошибка:

Для одновершинных распределений рассчитывается еще один показатель оценки его формы – эксцесс . Эксцесс является показателем островершинности распределения . Он рассчитывается для симметричных распределений на основе центрального момента 4-ого порядка

к плосковершинным.

Для отражения особенностей структуры распределения признака в совокупности используют квантили распределения.

Квантили – это варианты признака, занимающие в упорядоченном (ранжированном) ряду единиц совокупности определенное место (каждое четвертое, каждое пятое, каждое шестое и т.д.). в результате квантили делят ряд распределения на равные (по числу единиц) части: квартили – на четыре; квинтили – на пять; секстили – на шесть; децили – на десять; перцентили – на сто частей. Значение квантилей для сгруппированных данных определяют по накопленным частотам.

Наиболее широко используют децили и квартили ряда распределения.

Первая дециль (D 1) – это такое значение признака, что 0,1 (или 10 %) единиц совокупности имеют значение признака меньше, чем D 1 , а 0,9 (90 %) – больше чем 0D 1 . Вторая дециль (D 2) – это такое значении признака, что 0,2 (или 20 %) единиц совокупности имеют значение признака меньше, чем D 2 , а 0,8 (80 %) – больше, чем D 2 . Аналогично определяют D 3 , D 4 , D 5 , D 6 , D 7 , D 8 , D 9 . Формулы расчета крайних децилий следующие:

где, – нижняя граница интервалов, где находятся первая и девятая децили; , – величины интервалов, где располагаются первая и девятая частоты децили; – общая сумма частот (частостей); , – суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили; и – частота интервала, в котором располагаются соответственно первая и девятая децили.

Первая квартиль (Q 1) определяет такое значение признака, что ¼ единиц совокупности имеют значение признака меньше, чем Q 1 , а ¾ – больше чем Q 1 . Вторая квартиль (Q 2) равна медиане. Третья квартиль (Q 3) определяет такое значение признака, что ¾ единиц совокупности имеют значения признака меньше, чем Q 3 , а ¼ – больше, чем Q 3 . Величины крайних для интервального ряда распределения могут быть рассчитаны по следующим формулам:

где – нижняя граница интервала, в котором находятся первая и третья квартили; – суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых располагаются первая и третья квартили; – частота интервала, в котором находятся первая и третья квартили.

Для характеристики формы распределения используют показатель симметричности распределения частот – коэффициент асимметрии, и показатель эксцесса, который отражает крутизну (островершинность) этого распределения. Расчету значений этих показателей предшествует вычисление так называемых моментов распределения.

Моментом распределения называют среднюю арифметическую тех или иных степеней отклонений индивидуальных значений признака от определенной исходной величины:

где, x i – значения признака; A – величина, от которой определяются отклонения; k – степень отклонения (порядок момента).

В зависимости от того, что принимается за исходную величину, различают три вида моментов:

– начальный (М) при А=0;

– центральный () при А= ;

–условный (m), когда А – произвольная величина, не равная и отличная от нуля.

Начальный момент первого порядка представляет собой среднюю арифметическую, а центральный (нулевое свойство средней арифметической) всегда равен нулю. Центральный момент второго порядка – это дисперсия, а для третьего порядка он равен нулю в симметричном распределении и используется при определении показателя асимметрии. Центральный момент четвертого порядка применяется при вычислении показателя эксцесса.

Коэффициент асимметрии представляет собой нормированный центральный момент третьего порядка, т.е. отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:

Коэффициент асимметрии (A s) характеризует асимметричность распределения признака в совокупности. Если A s =0, то распределение симметричное, если A s >0, то асимметрия правосторонняя, а если A s <0, то асимметрия левосторонняя. Величина A s может изменяться от –1 до +1 (для одновершинных распределений).

Для симметричных распределений среднее арифметическое значение, мода и медиана равны между собой. Учитывая это, показатель асимметрии может быть рассчитан следующим образом:

Для оценки существенности асимметрии вычисляют показатель средней квадратической ошибки коэффициента асимметрии:

Если отношение имеет значение больше трех, то это свидетельствует о существенном характере асимметрии.

Показатель островершинности распределения – эксцесс (Е х) – рассчитывается для умеренно асимметричных распределений. Он будет наиболее точным, если при вычислении используется нормированный центральный момент четвертого порядка. В нормальном распределении это отношение равно трем, поэтому формула для расчета эксцесса как показателя отклонения от нормального распределения имеет следующий вид:

Эксцесс представляет собой отклонение вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. Наличие положительного эксцесса означает, что распределение более островершинное, чем нормальное, а при отрицательном эксцессе распределение имеет более плосковершинный характер, чем нормальное.

Конец работы -

Эта тема принадлежит разделу:

О.Д. Малышева. Статистика предприятия

Учреждение образования могилевский государственный университет продовольствия..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Статистика предприятия
Курс лекций для студентов специальности 1 – 27 01 01 «Экономика и организация производства (по направлениям)» Часть I Могилев 2012 УДК 311.1 &n

Предмет статистики
В настоящее время слово статистика широко употребляется в обиходе. Оно имеет латинское происхождение (от слова status – состояние, положение вещей). В науке этот термин был введен

Категории статистической науки
Так как статистика дает характеристику массовых явлений, то она имеет дело со следующими категориями: 1 статистические показатели; 2 статистическая совокупность; 3 статис

Задачи статистики
Перед статистикой как составной частью системы управления народным хозяйством стоят следующие основные задачи: 1 всестороннее исследование происходящих в обществе экономических и социальны

Организация статистики в Республике Беларусь
В Республике Беларусь статистика организована по централизованному признаку. В своей деятельности органы государственной статистики Республики Беларусь руководствуются законом «О государственной ст

Статистическое наблюдение
Статистическое исследование включает в себя три этапа или стадии: – статистическое наблюдение; – сводку и группировку статистического материала; – анализ

Организационные формы наблюдения
Различают две основные формы статистического наблюдения: 1Отчетность – основная форма статистического наблюдения, с помощью которой статистические органы в определенные ср

Виды статистического наблюдения
Виды статистических наблюдений можно классифицировать по ряду признаков: по частоте регистрации фактов: – непрерывное (текущее); – прерывное. По

Способы статистического наблюдения
Существуют различные способы статистических наблюдений: – непосредственное наблюдение; – документальный способ; – опрос. Непосредственное наблюдение

Организация работы по статистическим наблюдениям
Чтобы провести статистическое наблюдение, надо сформулировать его цель и основные гипотезы, которые должны быть проверены по данным наблюдения. Для успешного проведения статистических набл

Ошибки статистического наблюдения
Ошибки наблюдения – это неточности статистических данных. Они делятся на ошибки регистрации и репрезентативности (представительности). Ошибки регистрации

Контроль статистических данных
Различают три основных вида контроля: – внешний; – счетный (арифметический); – логический. Внешний контроль – это чисто визуальная проверка прав

Статистические группировки и их виды
Первым шагом статистической сводки является статистическая группировка. Это один из наиболее распространенных методов обработки статистической информации. Таким образом, группировк

Типологическая группировка
Типологическая группировка может строиться для разных целей и по различным критериям. Задача выделения типов из общей совокупности решается сравнительно просто только в тех случаях, когда различия

Структурная группировка
Группировки, характеризующие распределение единиц однотипной совокупности по каким-либо признакам, называются структурными. К ним относятся группировки рабочих по возрасту, стажу, зарплате

Аналитическая группировка
Аналитические – такие группировки, которые применяются для исследования взаимосвязей между явлениями. Для проведения аналитической группировки нужно определить факторный и результа

Вторичные группировки
Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода, могут оказаться несопоставимыми из-за различного числа

Ряды распределения, их виды и графическое изображение
Статистический ряд распределения – это упорядоченное распределение совокупности на группы по определенному варьирующему признаку. Ряды распределения принято оформлять в ви

Статистические таблицы
Статистические таблицы являются средством наглядного выражения результатов исследования. Значение таблиц определяется тем, что они позволяют изолированные статистические данные рас

Статистические графики
Современную науку невозможно представить себе без применения графических методов. Особое место графические методы занимают в статистике и экономике, имеющих дело с большими комплексами циф

Абсолютные величины, их виды, единицы измерения
Первым видом обобщающих статистических показателей являются абсолютные величины. Это такие количественные величины, которые выражают объем или размер общественных явлений в конкрет

Относительные величины, их виды и значения
В исследованиях любого общественного процесса важно изучать его в развитии и сравнивать с другими аналогичными показателями. Относительные – такие величины, которые характ

Основные принципы построения относительных величин
При построении относительных величин следует помнить: 1 Сравниваемые абсолютные показатели должны быть чем-то связаны в реальной жизни объективно, независимо от нашего желания. 2

Построение системы статистических показателей
Поскольку отдельные свойства объекта или явления не изолированы, а связаны между собой, то и статистические показатели, отражающие эти свойства объекта, необходимо связывать в систему. Вид

Понятие средней величины. Виды средних величин
Средние величины – наиболее распространенные обобщающие величины в статистике. Средней величиной называется обобщающая характеристика совокупности однотипных явлений по какому-либо количес

Средняя арифметическая, ее свойства и вычисление
Средняя арифметическая используется в двух формах: – в форме простой: (1) – в форме средней арифметической взвешенной: (2) Формула 1 применяется тогда,

Вычисление средней арифметической способом моментов
Способ моментов применяется для упрощения вычисления средней арифметической при условии, что варианты большие числа. Применяется в основном для рядов с равными интервалами. Суть метода:

Средняя гармоническая, ее виды и вычисления
Средняя гармоническая – это величина обратная средней арифметической из обратных значений признака. Применяется в 2-х формах: в форме простой:

Мода и медиана. Их вычисление в дискретных и интервальных вариационных рядах
Мода и медиана – особого рода средние, которые используются для изучения структуры вариационного ряда. Их иногда называют структурными средними, в отличие от рассмотренных ранее ст

Вычисление моды и медианы в интервальном вариационном ряду
Мода в интервальном вариационном ряду вычисляется по формуле где ХМ0 - начальная граница модального интервала, hм0 – величина

Характеристика показателей вариации
Средняя величина, характеризуя вариационный ряд в целом, не показывает, как располагаются вокруг нее варианты осредняемого признака, т.е. средняя не характеризует колеблемость приз

Основные свойства дисперсии и ее вычисление
Дисперсия – это наиболее часто используемый показатель вариации. Это средний квадрат отклонения вариантов от их среднего значения. Используется в двух формах: – простой

Вычисление дисперсии способом моментов
Способ моментов применяется для упрощения расчетов в том случае, если варианты − большие числа. Первые четыре пункта такие же, как для вычисления средней арифметической способом моментов.

Дисперсия альтернативного признака
В ряде случаев возникает необходимость изучать не среднюю величину, а долю единиц, обладающих каким-либо признаком. Признаки, имеющие только два взаимоисключающих значения − это наличие призн

Определение тесноты связи между факторами. Правило сложения дисперсий
Если некоторая совокупность единиц делится на группы, то наряду с общей дисперсией может быть рассчитана дисперсия по отдельным группам (групповая или частная), а также средняя из групповых и межгр

Принципы и методы построения общих индексов
Для того, чтобы рассчитать общий индекс, надо, прежде всего, преодолеть несуммарность отдельных элементов изучаемого явления. Это достигается путем введения в индекс какого-то дополнительного и неи

Построение индексов качественных показателей в агрегатной форме
Построение индексов качественных показателей будем рассматривать на примере агрегатного индекса цен (Пааше и Ласпейреса). В первом индексе (Пааше) в числителе стоит количество произведенно

Построение агрегатных индексов, объемных показателей
Построение индексов объемных показателей рассмотрим на примере построения индекса объема произведенной или реализованной продукции. Этот индекс можно вычислить по схеме: – Ласпейр

Построение агрегатного индекса производительности труда
В некоторых случаях произведение индексируемой величины на вес дает нам такой объемный показатель, элементы которого являются несоизмеримыми и не поддаются суммированию. Рассмотрим на прим

Индексы с постоянными и переменными весами
Системой индексов называется ряд последовательно построенных индексов. Такие системы характеризуют изменения, происходящие в изучаемом явлении в течение исследуемого периода времен

Преобразование агрегатных индексов в индексы средние из индивидуальных
Индекс средний из индивидуальных получается путем преобразования агрегатного индекса. Для этого в числителе или знаменателе агрегатного индекса вместо индексируемого показателя ставят выражение его

Индексный метод анализа факторов динамики (система взаимосвязанных индексов)
Индексный метод анализа факторов динамики широко применяется для анализа роли отдельных факторов в динамике какого-либо сложного явления. Например: Рассмотрим динамику товарооборо

Индексы постоянного, переменного состава и влияния структурных сдвигов
Характеризуя динамику народного хозяйства, мы пользуемся наряду с объемными также и средними показателями. На величину среднего значения показателя может оказывать влияние как изменение самого осре

Построение территориальных индексов
В статистической практике часто возникает потребность в сопоставлении уровней экономического явления в пространстве: по странам, экономическим районам, областям, т.е. исчислении территориальных инд

Решение
Территориальный индекс цен, в котором в качестве базы сравнений принимаются данные по городу А (), будет иметь вид, где, – фактически действующие цены в городе А и Б;

Ряды динамики и их виды
Рядами динамики в статистике называют ряды последовательно расположенных в хронологическом порядке показателей, которые характеризуют развитие явлений. Исследование рядов

Темпы роста, их вычисление
Темпы роста − это отношение уровней ряда одного периода к другому. Темпы роста могут быть вычислены как базисные, когда все уровни ряда относятся к уровню одного и т

Вычисление средних показателей динамики
Средний уровень ряда называется средней хронологической. Средняя хронологическая − это средняя величина из показателей, изменяющихся во времени. В и

Решение
1 Среднегодовой размер заработной платы определим по формуле средней арифметической простой тыс. р. 2 Ежегодный (цепной) абсолютный прирост () определим по формуле,

Приемы анализа рядов динамики
Для исследования закономерностей динамики социально-экономических процессов изучают общую линию развития, или так называемый тренд. Изменение уровня ряда динамики обусловл

Аналитическое выравнивание ряда динамики
Использование методов этой группы позволяет преодолеть недостатки приемов механического сглаживания. Они дают возможность учитывать все уровни динамического ряда, моделировать динамические процессы

При четном числе уровней динамического ряда
При нечетном Тогда, подставив значение ∑t=0 в систему уравнений, получим следующую систему уравнений: . Следовательно, значе

Приемы анализа сезонных колебаний
Под сезонными колебаниями понимаются более или менее устойчивые внутригодовые колебания уровней социально-экономических явлений. Сезонные колебания являются результатом влияния природных, обществен

Решение
Индекс сезонности определим по формуле, где – одноименные (одномесячные) средние (в нашем примере в среднем за три года); – общая средняя; – средний уровень ряд

Общее понятие о выборочном методе и причины его использования
1. Выборочное наблюдение – это один из видов несплошного наблюдения, когда исследованию подвергается какая-то часть совокупности; показатели, характеризующие эту отобранную часть, распространяются

Способы отбора
Существуют различные виды (способы) отбора единиц в целях образования выборки. Выборку можно проводить путем последовательного отбора отдельных единиц (это индивидуальный отбор) или путем

Собственно случайная выборка
Собственно-случайная выборка – это такая выборка, при которой отбор единиц и групп единиц для обследования производится в случайном порядке. Часто для таких целей применяется жеребьевка. При этом к

Решение
1 Рассчитаем предельную ошибку выборки () по формуле, где – коэффициент доверия, который зависит от вероятности, с которой можно гарантировать, что предельная ошибка выб

Решение
На основании имеющегося распределения семей определим выборочную среднюю и дисперсию чел. Предельную ошибку выборки определим по формуле, где – коэффици

Механический отбор
Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы. При этом размер интервала рав

Типический (районированный) отбор
В некоторых случаях, когда генеральная совокупность не однотипна, применяется предварительное деление ее на типически однородные группы (районы). Группировка производится по существенным признакам,

Гнездовой (серийный) отбор
Иногда приходится отбирать не отдельные единицы, а целые группы или серии с тем, чтобы затем в этих группах подвергать обследованию все без исключения единицы. Серийный отбор применяется в 2 вариан

Понятие о моментном наблюдении и малой выборке
Особым видом выборочного наблюдения является моментное наблюдение. Оно широко распространено в промышленности. Суть его в том, что на отдельные определенные моменты времени фиксируется наличие отде

Виды связей
Исследование объективно существующих связей между явлениями -важнейшая задача теории статистики.Статистика разработала множество методов изучения связей, выбор которых зависит от п

Коэффициент взаимной сопряженности Чупрова и Пирсона
Коэффициент взаимной сопряженности Чупрова и Пирсона применяется тогда, когда исследуется теснота связи между варьированием двух атрибутивных признаков, когда это варьирование обра

Коэффициенты ассоциации и контингенции
Коэффициенты ассоциации и контингенции применяются тогда, когда исследуется связь между варьированием двух атрибутивных признаков, по каждому признаку имеется две группы (таблица 10.2). &n

Метод сравнения параллельных рядов
Установить наличие и характер связи между количественными признаками можно с помощью метода сравнения параллельных рядов, заключающегося в следующем. Признаки-факторы мы р

Коэффициент Фехнера
Коэффициент Фехнера основан на методе параллельных рядов. Суть его в том, что сравниваются знаки отклонений значений признака от их средних арифметических. 1 Находим средние арифметические

Коэффициент корреляции рангов
Коэффициент корреляции рангов – это более точный коэффициент определения тесноты связи между количественными признаками. С помощью этого коэффициента можно определить не только силу, но и направлен

Метод аналитических группировок
Значительно более отчетливо будут проявляться корреляционные зависимости, если мы применим метод группировок и будем сравнивать не индивидуальные данные, а групповые средние. Группировка п

Метод корреляционно-регрессионного анализа. Корреляционное отношение и коэффициент корреляции
При исследовании корреляционных зависимостей решению подлежит широкий круг вопросов: 1 предварительный анализ свойств моделируемой совокупности; 2 установление факта наличия связи

Измерение тесноты связи между признаками
Для определения тесноты связи между факторным и результативным признаком используются: 1 индекс корреляции R, вычисляемый по формуле где − общая диспе

Проверка значимости корреляционной связи с помощью дисперсионного анализа
Можно проверить значимость корреляционной связи с помощью дисперсионного анализа. Дисперсионный анализ основывается на расчленении общей вариации признака на вариацию систематическую, обусловленну

Понятие о многофакторном корреляционно-регрессионном анализе
Для многофакторного корреляционного анализа математически задача формулируется следующим образом: требуется найти аналитическое выражение, наилучшим образом отражающее связь между факторными призна

Статистика
Курс лекций Составитель Малышева Ольга Дмитриевна Редактор Т.Л. Бажанова Технический редактор А.А. Щербакова Подп