Glajenje časovnih vrst.  Metode glajenja in poravnave časovnih vrst

Glajenje časovnih vrst. Metode glajenja in poravnave časovnih vrst

1. 2. Metode glajenja in poravnave časovnih vrst.
Odprava naključnih nihanj v vrednostih nivojev serije se izvede z iskanjem "povprečnih" vrednosti. Metode za odpravo naključnih dejavnikov so razdeljene še v dve skupini:
1. Metode "mehanskega" glajenja nihanj s povprečjem vrednosti serije glede na druge sosednje ravni serije.
2. Metode "analitične" poravnave, tj. določitev najprej funkcionalnega izraza trenda serije, nato pa novih, izračunanih vrednosti serije.
1.2. 1 Mehanske metode anti-aliasinga .
Tej vključujejo:
a. Metoda povprečja za dve polovici serije ko je vrsta razdeljena na dva dela. Nato se izračunata dve vrednosti povprečnih ravni serije, s katerimi je grafično določen trend serije. Očitno takšen trend ne odraža v celoti osnovnega vzorca razvoja pojava.
b. Intervalna metoda hrapavosti, pri katerem se poveča dolžina časovnih intervalov in se izračunajo nove vrednosti ravni serije.
Povečanje intervalov je najpreprostejša metoda glajenja nivojev niza, da bi razkrili glavno težnjo njihovega spreminjanja. V tem primeru se za povečane intervale določi skupna vrednost oziroma povprečna vrednost preučevanega indikatorja. Ta metoda je še posebej učinkovita, če začetne ravni serije ustrezajo kratkim časovnim obdobjem. Na primer, če obstajajo podatki o dnevnem nakladanju blaga na železnico za en mesec, potem so v takšni seriji verjetna znatna nihanja ravni, saj krajše kot je obdobje, za katerega so podatki predstavljeni, večji je vpliv naključni dejavniki.

Za odpravo tega vpliva je priporočljivo povečati časovne intervale (na primer do 5 ali 10 dni) in izračunati skupni ali povprečni dnevni obseg obremenitve (oziroma pet dni ali desetletja). Ob povečanih časovnih intervalih bo bolj očitna pravilnost spreminjanja nivoja.

Primer 2.8. Naj bodo naslednji podatki o proizvodnji v podjetju po mesecih za leto (v primerljivih cenah):

Rešitev... Podaljšajmo intervale na tri mesece in izračunajmo skupno in povprečno mesečno proizvodnjo po četrtletjih. Dobimo naslednje rezultate:



Očitno novi podatki bolj jasno izražajo vzorec sprememb proizvodnje med letom – povečanje iz četrtletja v četrtletje.

v. Metoda drsečega povprečja... Ta metoda se uporablja za karakterizacijo trenda razvoja preučevane statistične populacije in temelji na izračunu povprečnih ravni serije za določeno obdobje. Zaporedje za določanje drsečega povprečja:
- nastavite interval glajenja ali število stopenj, vključenih v njem. Če se pri izračunu povprečja upoštevajo tri ravni, se drseče povprečje imenuje trimesečno, pet stopenj - petmesečno itd. Če se majhna, neenakomerna nihanja ravni v nizu dinamike zgladijo, se interval (število drsečega povprečja) poveča. Če je treba valove ohraniti, se število izrazov zmanjša.
- Izračunajte prvo povprečno raven s preprosto aritmetično:
y1 = Sy1 / m, kjer
y1 - I-ta raven vrstice;
m je članstvo drsečega povprečja.
- prva stopnja se zavrže, stopnja, ki sledi zadnji stopnji, ki sodeluje pri prvem izračunu, pa se vključi v izračun povprečja. Postopek se nadaljuje, dokler v izračun y ne vključimo zadnje stopnje proučevane serije dinamike yn.

Številne dinamike, zgrajene iz povprečnih ravni, razkrivajo splošni trend razvoja pojava.

Negativna stran uporabe metode drsečega povprečja je nastanek premikov v nihanjih nivojev serije zaradi "drsenja" konsolidacijskih intervalov. Glajenje gibljivega povprečja lahko privede do "obratnih" nihanj, ko se konveksni "val" nadomesti z konkavnim.
Nedavno je bilo izračunano prilagodljivo drseče povprečje. Njena razlika je v tem, da se povprečna vrednost lastnosti, izračunana kot je opisano zgoraj, ne nanaša na sredino vrstice, temveč na zadnje časovno obdobje v intervalu združevanja. Poleg tega se domneva, da je prilagodljivo povprečje odvisno od prejšnje ravni v manjši meri kot od trenutne. To pomeni, da več kot je časovnih intervalov med nivojem serije in povprečno vrednostjo, manj vpliva vrednost te ravni serije na vrednost povprečja.
G. Metoda eksponentnega povprečja... Eksponentno povprečje je prilagodljivo drseče povprečje, izračunano z uporabo uteži, ki je odvisna od stopnje "oddaljenosti" posameznih ravni serije od povprečja. Vrednost teže pada z oddaljenostjo nivoja vzdolž kronološke premice od povprečne vrednosti v skladu z eksponentno funkcijo, zato se takšno povprečje imenuje eksponentno. V praksi se uporablja večkratno eksponentno glajenje številnih dinamik, ki se uporablja za napovedovanje razvoja pojava.
Zaključek: metode, vključene v prvo skupino, glede na uporabljene računske metode dajejo raziskovalcu zelo poenostavljeno, netočno predstavo o trendu v nizu dinamike. Vendar pa pravilna uporaba teh metod od raziskovalca zahteva poglobljeno znanje o dinamiki različnih družbeno-ekonomskih pojavov.
1.2.2 Tehnike analitičnega usklajevanja
Natančnejši način za prikaz trenda časovne vrste je analitična poravnava, to je poravnava z uporabo analitičnih formul. V tem primeru je časovna vrsta izražena kot funkcija y (t), pri kateri je čas t vzet kot glavni faktor, spremembe v argumentu funkcije pa določajo izračunane vrednosti yt.
Dejanske (ali empirične) ravni določene dinamike imenujemo začetni podatki o spremembi pojava, torej podatki, pridobljeni empirično z opazovanjem. Označeni so z yi. Izračunane (ali teoretične) ravni serije so vrednosti, pridobljene kot rezultat zamenjave vrednosti t v enačbo trenda, in jih označimo.
Namen analitične poravnave časovne vrste je določiti analitično ali grafično odvisnost f (t). V praksi se glede na razpoložljivo časovno vrsto nastavi oblika in poiščejo parametri funkcije f (t), nato pa se analizira obnašanje odstopanj od trenda. Funkcija f (t) je izbrana tako, da daje smiselno razlago preučevanega procesa.

Ministrstvo za izobraževanje Ruske federacije

Vseruski dopisni finančno-ekonomski inštitut

podružnica Yaroslavl

Oddelek za statistiko

Tečajno delo

po disciplini:

"Statistika"

naloga številka 19

Študentka: Kurashova Anastasia Yurievna

Posebnost "Finance in kredit"

3 tečaj, periferija

Vodja: V.P. Sergejev

Jaroslavl, 2002

1. Uvod …………………………………………………………………… 3 str.

2. Teoretični del ………………………………………………………… 4 str.

2.1 Osnovni pojmi o nizu dinamike ………………………… ... 4 str.

2.2 Metode za glajenje in poravnavo časovnih vrst …………………………………………………………… .6 str.

2.2.1 Metode "mehanskega glajenja" ……………………… 6 str.

2.2.2 Metode "analitične" poravnave …………………. 8 str.

3. Izračunski del …………………………………………………… 11 str.

4. Analitični del ………………………………………………………. .16 str.

5. Zaključek ……………………………………………………………………. stran 25

6. Reference ………………………………………………………… 26 strani.

7. Dodatki ………………………………………………………. 27 strani


Uvod

Popolne in zanesljive statistične informacije so nujna podlaga, na kateri temelji proces gospodarskega upravljanja. Vse informacije nacionalnega gospodarskega pomena se na koncu obdelajo in analizirajo s pomočjo statistike.

Prav statistični podatki omogočajo določitev obsega bruto domačega proizvoda in nacionalnega dohodka, opredelitev glavnih trendov v razvoju sektorjev gospodarstva, oceno stopnje inflacije, analizo stanja finančnih in blagovnih trgov, preučevanje življenjski standard prebivalstva in drugi družbeno-ekonomski pojavi in ​​procesi.

Obvladovanje statistične metodologije je eden od pogojev za razumevanje tržnih razmer, proučevanje trendov in napovedi, sprejemanje optimalnih odločitev na vseh ravneh delovanja.

Končna, analitična faza raziskave je težka, dolgotrajna in odgovorna. Na tej stopnji se izračunajo povprečni kazalniki in kazalniki porazdelitve, analizira se struktura populacije, razišče se dinamika in razmerje med preučevanimi pojavi in ​​procesi.

Na vseh stopnjah študije statistika uporablja različne metode. Statistične metode so posebne tehnike in metode za preučevanje množičnih družbenih pojavov.

I. Teoretični del.

1.1 Osnovni pojmi o nizu dinamike.

Serije dinamike so statistični podatki, ki odražajo razvoj preučevanega pojava skozi čas. Imenujejo se tudi časovne vrste, časovne vrste.

Vsaka vrstica zvočnikov ima dva glavna elementa:

1) indikator časa t;

2) ustrezne stopnje razvoja preučevanega pojava y;

Časovni odčitki v nizu dinamike so bodisi določeni datumi (trenutki) bodisi ločena obdobja (leta, četrtletja, meseci, dnevi).

Stopnje serije dinamike odražajo kvantitativno oceno (mero) razvoja preučevanega pojava skozi čas. Lahko jih izrazimo kot absolutne, relativne ali povprečne vrednosti.

Serija dinamike se razlikuje glede na naslednje značilnosti:

1) Po času. Glede na naravo obravnavanega pojava se lahko ravni serije dinamike nanašajo bodisi na določene datume (trenutke) v času bodisi na ločena obdobja. V skladu s tem so serije dinamike razdeljene na trenutne in intervalne.

Trenutni nizi dinamike odražajo stanje preučenih pojavov ob določenih datumih (trenutih) v času. Primer trenutne serije dinamike je naslednji podatek o seznamu zaposlenih v trgovini v letu 1991 (tab. 1):

Tabela 1

Navedeno število zaposlenih v trgovini v letu 1991

Značilnost trenutne serije dinamike je, da lahko njene ravni vključujejo iste enote preučevanega agregata. Čeprav v nizu trenutkov obstajajo intervali - intervali med sosednjimi datumi v nizu - vrednost določene ravni ni odvisna od dolžine obdobja med dvema datumoma. Tako je glavni del zaposlenih v trgovini, ki sestavlja plačilno listo od 01.01.1991 in nadaljuje z delom v tem letu, je prikazan v ravneh naslednjih obdobij. Zato lahko pri seštevanju ravni trenutne serije pride do ponavljajočega se štetja.

S pomočjo trenutnih nizov dinamike v trgovini se preučujejo zaloge blaga, stanje osebja, število opreme in drugi kazalniki, ki odražajo stanje proučevanih pojavov za posamezne datume (trenutke) časa.

Intervalne serije dinamike odražajo rezultate razvoja (delovanja) preučenih pojavov za določena obdobja (intervale) časa.

Primer intervalne serije so podatki o maloprodajnem prometu trgovine v letih 1987 - 1991. (tab. 2):

tabela 2

Obseg maloprodajnega prometa trgovine v letih 1987 - 1991

Maloprodajni promet, tisoč rubljev

885.7 932.6 980.1 1028.7 1088.4

Vsaka raven intervalne serije je že vsota nivojev za krajša časovna obdobja. Hkrati enota agregata, ki je del ene ravni, ni del drugih ravni.

Značilnost intervalne serije dinamike je, da je vsaka njena raven sestavljena iz podatkov za krajše intervale (podobdobja) časa. Na primer, če seštejemo promet za prve tri mesece v letu, dobimo njegov obseg za prvo četrtletje, če seštejemo promet za štiri četrtletja, dobimo njegovo vrednost za leto itd. Ob vseh drugih pogojih, raven intervalne serije je večja, čim daljša je dolžina intervala, ki mu ta raven pripada.

Lastnost seštevanja nivojev za zaporedne časovne intervale omogoča pridobitev niza dinamike večjih obdobij.

S pomočjo intervalnih nizov dinamike v trgovini se preučujejo spremembe v času prejema in prodaje blaga, višina distribucijskih stroškov in drugi kazalniki, ki odražajo rezultate delovanja preučevanega pojava za določena obdobja.

Struktura številnih dinamik:

Teoretično je mogoče predstaviti poljubno število dinamik v obliki komponent:

1) trend - glavni trend razvoja časovne vrste (do povečanja ali zmanjšanja njenih ravni);

2) ciklično (periodična nihanja, vključno s sezonskimi);

naključna nihanja.

1. 2. Metode za glajenje in poravnavo časovnih vrst.

Odprava naključnih nihanj v vrednostih nivojev serije se izvede z iskanjem "povprečnih" vrednosti. Metode za odpravo naključnih dejavnikov so razdeljene še v dve skupini:

1. Metode "mehanskega" glajenja nihanj s povprečjem vrednosti serije glede na druge sosednje ravni serije.

2. Metode "analitične" poravnave, tj. določitev najprej funkcionalnega izraza trenda serije, nato pa novih, izračunanih vrednosti serije.

1.2. 1 Metode "mehanskega" glajenja.

Tej vključujejo:

a. Metoda povprečja dveh polovic serije, ko je serija razdeljena na dva dela. Nato se izračunata dve vrednosti povprečnih ravni serije, s katerimi je grafično določen trend serije. Očitno takšen trend ne odraža v celoti osnovnega vzorca razvoja pojava.

b. Metoda agregacije intervalov, pri kateri se poveča dolžina časovnih intervalov in se izračunajo nove vrednosti nivojev serije.

v. Metoda drsečega povprečja. Ta metoda se uporablja za karakterizacijo trenda razvoja preučevane statistične populacije in temelji na izračunu povprečnih ravni serije za določeno obdobje. Zaporedje za določanje drsečega povprečja:

Nastavite interval glajenja ali število ravni, vključenih v njem. Če se pri izračunu povprečja upoštevajo tri ravni, se drseče povprečje imenuje trimesečno, pet stopenj - petmesečno itd. Če se majhna, neenakomerna nihanja ravni v nizu dinamike zgladijo, se interval (število drsečega povprečja) poveča. Če je treba valove ohraniti, se število izrazov zmanjša.

Izračunajte prvo povprečno raven s preprosto aritmetično:

y1 = Sy1 / m, kjer

y1 - I-ta raven vrstice;

m je članstvo drsečega povprečja.

Prva stopnja se zavrže, stopnja, ki sledi zadnji stopnji, ki sodeluje pri prvem izračunu, pa se vključi v izračun povprečja. Postopek se nadaljuje, dokler v izračun y ne vključimo zadnje stopnje proučevane serije dinamike y n.

Številne dinamike, zgrajene iz povprečnih ravni, razkrivajo splošni trend razvoja pojava.

Negativna stran uporabe metode drsečega povprečja je nastanek premikov v nihanjih nivojev serije zaradi "drsenja" konsolidacijskih intervalov. Glajenje gibljivega povprečja lahko privede do "obratnih" nihanj, ko se konveksni "val" nadomesti z konkavnim.

Nedavno je bilo izračunano prilagodljivo drseče povprečje. Njena razlika je v tem, da se povprečna vrednost lastnosti, izračunana kot je opisano zgoraj, ne nanaša na sredino vrstice, temveč na zadnje časovno obdobje v intervalu združevanja. Poleg tega se domneva, da je prilagodljivo povprečje odvisno od prejšnje ravni v manjši meri kot od trenutne. To pomeni, da več kot je časovnih intervalov med nivojem serije in povprečno vrednostjo, manj vpliva vrednost te ravni serije na vrednost povprečja.

d) metoda eksponentnega povprečja. Eksponentno povprečje je prilagodljivo drseče povprečje, izračunano z uporabo uteži, ki je odvisna od stopnje "oddaljenosti" posameznih ravni serije od povprečja. Vrednost teže pada z oddaljenostjo nivoja vzdolž kronološke premice od povprečne vrednosti v skladu z eksponentno funkcijo, zato se takšno povprečje imenuje eksponentno. V praksi se uporablja večkratno eksponentno glajenje številnih dinamik, ki se uporablja za napovedovanje razvoja pojava.

Zaključek: metode, vključene v prvo skupino, glede na uporabljene računske metode dajejo raziskovalcu zelo poenostavljeno, netočno predstavo o trendu v nizu dinamike. Vendar pa pravilna uporaba teh metod od raziskovalca zahteva poglobljeno znanje o dinamiki različnih družbeno-ekonomskih pojavov.

Osnovne metode vzorčenja

Od tega je odvisna zanesljivost statističnih zaključkov in smiselna interpretacija rezultatov reprezentativnost vzorčenje, t.j. popolnost in ustreznost zastopanosti lastnosti splošne populacije, glede na katero se ta vzorec lahko šteje za reprezentativnega. Preučevanje statističnih lastnosti populacije je mogoče organizirati na dva načina: z uporabo neprekinjeno in prekinjeno opazovanje ... Nenehno opazovanje predvideva anketo vseh enoteštudiral agregat, a diskontinuirano (selektivno) opazovanje- samo njeni deli.

Obstaja pet glavnih načinov organizacije opazovanja vzorca:

1. preprosta naključna izbira, pri katerem so predmeti naključno izločeni iz splošne populacije predmetov (na primer z uporabo tabele ali generatorja naključnih števil), pri čemer ima vsak od možnih vzorcev enako verjetnost. Takšni vzorci se imenujejo pravilno naključno;

2. preprosta izbira z običajnim postopkom se izvede z uporabo mehanske komponente (na primer datum, dan v tednu, številka stanovanja, črka abecede itd.) in tako pridobljeni vzorci se imenujejo mehansko;

3. stratificirano izbor je v tem, da je splošna populacija volumna razdeljena na podmnožice ali plasti (strate) volumna, tako da. Strate so po statističnih značilnostih homogeni objekti (populacija je na primer razdeljena na sloje po starostnih skupinah ali družbenem razredu; podjetja - po panogah). V tem primeru se vzorci pokličejo stratificirano(sicer, stratificiran, tipičen, zoniran);

4.metode serijsko izbor se uporablja za oblikovanje serijsko oz ugnezdenih vzorcev... Primerne so, če je treba takoj pregledati "blok" ali vrsto predmetov (na primer pošiljko blaga, izdelke določene serije ali prebivalstvo v ozemeljsko-upravni delitvi države). Izbira sklopov se lahko izvede povsem naključno ali mehansko. V tem primeru se izvede popoln pregled določene serije blaga ali celotne teritorialne enote (stanovanjska stavba ali četrt);



5. kombinirano(postopna) selekcija lahko kombinira več metod izbire hkrati (na primer stratificirano in naključno ali naključno in mehansko); tak vzorec se imenuje kombinirano.

Vrste izbire

Avtor um razlikovati med individualno, skupinsko in kombinirano selekcijo. Ob individualni izbor posamezne enote splošne populacije so izbrane v vzorec, s skupinski izbor- kvalitativno homogene skupine (serije) enot, in kombiniran izbor predvideva kombinacijo prve in druge vrste.

Avtor metoda izbor razlikovati ponavljajoče se in neponavljajoče vzorec.

Neponovljiv imenuje se selekcija, pri kateri se enota, ki je prišla v vzorec, ne vrne v prvotno populacijo in ne sodeluje pri nadaljnji selekciji; medtem ko število enot v splošni populaciji N se v izbirnem postopku zmanjša. Ob ponovil izbor ujel v vzorcu se enota po registraciji vrne v generalno populacijo in tako obdrži enako možnost, da se skupaj z drugimi enotami uporabi v nadaljnjem izbirnem postopku; medtem ko število enot v splošni populaciji N ostaja nespremenjena (metoda se v socioekonomskih raziskavah redko uporablja). Vendar pa z velikim N (N → ∞) formule za neponovljiv izbire se približujejo tistim za ponovil izbor in skoraj pogosteje se uporabljajo slednji ( N = konst).

Vzorci so deterministično in verjetnostno.

Deterministično vzorčenje je sestavljen iz elementov, ki so vanjo vključeni, ne da bi upoštevali verjetnost njihovega videza, t.j. anketiranci sodelujejo v anketah na lastno pobudo. Tipičen primer so nereprezentativni vzorci. Mnoga podjetja na primer izvajajo ankete tako, da obiskovalcem svojih spletnih strani omogočijo, da izpolnijo anketo in jo oddajo prek interneta. Takšni vprašalniki omogočajo zbiranje velike količine informacij v kratkem času, vendar so vzorci sestavljeni iz odgovorov uporabnikov interneta, ki se v anketi udeležujejo na lastno pobudo. V mnogih primerih edina vrsta vzorcev, ki so na voljo, niso povsem naključni vzorci. V tem primeru postane mnenje strokovnjaka s področja raziskave izjemno pomembno za pridobitev smiselnih rezultatov. Skupinski vzorci in kosi so še en primer determinističnih vzorcev.

Vzorčenje verjetnosti- sestoji iz elementov, katerih verjetnost je vnaprej znana. Obstajajo štiri vrste verjetnostnih vzorcev: preprosti naključni, sistematični, stratificirani in grozdni.

Enostavno naključno vzorčenje... Znotraj preprostega naključnega izbora s simbolom n običajno označujejo velikost vzorca, simbol N pa označuje velikost okvirja (populacije). Vsak element stebla je oštevilčen od 1 do N. Verjetnost izbire katerega koli določenega elementa stebla pri prvi ekstrakciji je 1/N.

Naključni vzorec mora biti reprezentativen, t.j. predstavnik. Reprezentativni vzorec- to je vzorec, v katerem so vse glavne značilnosti splošne populacije, iz katere je ta vzorec ekstrahiran, predstavljene približno v enakem razmerju ali z enako pogostostjo, s katero se ta lastnost pojavlja v tej splošni populaciji. Obstajata dva glavna načina za pridobivanje vzorcev: z in brez vračanja. Sledenje nazaj pomeni, da se izbrani predmet vrne v bazo, verjetnost njegovega priklica pa ostane nespremenjena.

Izbira brez vračila pomeni, da se artikel po pridobitvi ne vrne v steblo in ga zato ni mogoče ponovno izbrati.

Pri oblikovanju sistematično vzorčenje N elementov, ki tvorijo osnovo, je razdeljenih v k skupin s prostornino n. Z drugimi besedami, k = N / n.

Število k, zaokroženo na najbližje celo število. Za pridobitev sistematičnega vzorca je treba njegov prvi element naključno izbrati izmed prvih k elementov prve skupine, vzetih iz okvirja. Preostali elementi se oblikujejo z izbiro vsakega k-tega elementa celotne baze.

Za izobraževanje grozdno vzorčenje osnova, sestavljena iz N elementov, je razdeljena na več grozdov, tako da vsaka skupina odraža lastnosti celotne splošne populacije. Nato se izvede preprosta naključna izbira grozdov, v katerih se preučujejo vsi elementi.


4)) Metode združevanja podatkov

Združevanje je delitev populacije na skupine, ki so na nek način homogene ali združevanje posameznih enot populacije v skupine, ki so na nek način homogene. Vztrajno razmejitev predmetov se imenuje klasifikacija ali standard, v katerem je vsak zapis atributov mogoče dodeliti samo eni skupini ali podskupini. Metoda združevanja temelji na dveh kategorijah – atribut združevanja in interval.

Značilnost združevanja je značilnost, s katero se posamezne enote populacije združujejo v homogene skupine. Lahko je tako kvantitativno kot kvalitativno. V nekaterih primerih se izkaže, da združevanje, ki se zdi zgolj kvalitativno, na koncu temelji na kvantitativni lastnosti. To je na primer razvrstitev industrijskih podjetij po panogah. Ker eno in isto podjetje proizvaja izdelke različnih vrst, statistika o tem vprašanju odloča s kvantitativno prevlado ene ali druge vrste.

Interval oriše kvantitativne meje skupin in predstavlja interval med največjo in najmanjšo vrednostjo lastnosti v skupini. Intervali so enaki, neenaki, zaprti (če obstajata zgornja in spodnja meja) in odprti (če je ena od meja odsotna).

Statistična združevanja in klasifikacije zasledujejo cilj prepoznavanja kvalitativno homogenih populacij, preučevanja strukture populacije in proučevanja razmerja med faktorjem in posledično značilnostmi. Vsak od teh ciljev ustreza posebnemu tipu združevanja: tipološki, strukturni in analitični.

Glede na število atributov, ki so položeni v osnovo združevanja, ločimo enostavne in večdimenzionalne skupine.

Enostavno združevanje se izvaja na eni osnovi. Med preprostimi skupinami izstopajo distribucijske serije. Distribucijska serija je združevanje, v katerem se en kazalnik uporablja za karakterizacijo skupin, razvrščenih po vrednosti lastnosti – velikosti skupine.

Vzemimo pogojni primer diskretne serije porazdelitve dopisnih študentov po višini:

P / p št.
Višina, cm

Ta serija je razvrščena, ker so vrednosti rasti razvrščene v naraščajočem vrstnem redu.

Konstruirajmo intervalno serijo porazdelitve študentov po višini, za katero je treba izbrati optimalno število skupin (intervalov lastnosti) in nastaviti dolžino (obseg) intervala. Ker se pri nadaljnji analizi porazdelitvene serije primerjajo frekvence v različnih intervalih, je potrebno, da je dolžina intervalov konstantna (v nasprotnem primeru bo treba frekvenco zaradi primerljivosti deliti z intervalno enoto - dobljeno vrednost se imenuje gostota).

Optimalno število skupin je izbrano tako, da se raznolikost vrednosti lastnosti v agregatu dovolj odraža in hkrati pravilnost porazdelitve, njena oblika ni izkrivljena zaradi naključnih nihanj frekvenc. Če je skupin premalo, se vzorec variacije ne bo pojavil; če je skupin preveč, bodo naključni frekvenčni skoki popačili obliko porazdelitve.

Primer. Analizirajte raven tedenskih plač (tenge) delavcev v podjetju na podlagi vzorca 30 delavcev

6500 4580 5670 7460 7650 8760 6960 6540 7490 3760 5430 6540 6750 4390 7830 6200 5700 6430 7950 2300 6490 5630 7890 5680 6430 5890 7900 5370 5890 3500

Podatke v tej izvirni obliki je težko analizirati. Da jih osmislimo, jih predstavimo v obliki frekvenčne tabele. Da bi to naredili, da bi določili celoten obseg frekvenčne tabele, poiščemo največjo in najmanjšo vrednost. V primeru je največja vrednost 8760 tenge, najmanjša pa 2300 tenge. V Excelu lahko za te namene uporabite funkciji MAX in MIN.

Nato morate navedeni obseg razdeliti na skupine ali intervale združevanja. V mnogih primerih je priporočljivo, da se razdelite na več ali manj skupin. Pri združevanju podatkov se zastavlja vprašanje, v koliko skupin bo razdeljena preučevana populacija. Na to vprašanje ni standardnega odgovora. Če je porazdelitev lastnosti v mejah njene variacije dovolj enakomerna ali blizu normalne, se obseg nihanj lastnosti razdeli na enake intervale, katerih dolžina je določena s formulo:

kjer sta x max, x min največja in najmanjša vrednost atributa v agregatu; k je število skupin. Število skupin lahko določimo s Sturgessovo formulo k = 1 + 3,322lgN, kjer je N število enot v agregatu. Običajno so skupine enake intervalne dolžine. V našem primeru lahko intervale podatkov določimo s formulo:

k = 1 + 3,322lgN = 1 + 3,322xlg30 = 1 + 3,322x1,477 = 5,9

h = =

Dobljeno vrednost je treba popraviti za lažje izračune, v našem primeru 1000. Tako jo bomo predstavili v obliki tabele 1.

Tabela 1 – Pogostost združevanja v skupine

Ta tabela kaže, da glavni del, od 30 delavcev, 24 zasluži v razponu od 5000-8000 tenge. Pri zaposlovanju delavcev jim lahko povemo, da veliko delavcev v povprečju zasluži od 5.000 do 8.000 tenge. Neobdelane podatke je mogoče tabelarizirati z odprtimi obrobami, kot je prikazano spodaj:

Tabela 2 – Razvrščanje po specifični teži

Ta tabela 2 kaže, da v podjetju z 30 delavci 80% delavcev prejme od 5.000 do 8.000 tenge.

Zaprti so intervali z obema označenima mejama, odprti - intervali z eno obrobo. Intervali 2000 - zajema plače od leta 2000 naprej, vendar pod prvo številko intervala naslednje skupine, t.j. pod 3000 tenge.

Z uporabo enakih razmikov za oblikovanje skupin se bo njihovo število po nepotrebnem povečalo, saj bo veliko skupin majhnih. Pod temi pogoji se prebivalstvo deli v skupine v neenakih intervalih.

Razporeditev frekvenc

Ko se velikost vzorca povečuje, niti urejena matrika niti diagram stebla in listov ne olajšata predstavitve, analize in interpretacije rezultatov. Za velike nabore podatkov bi morali ustvariti vrtilne tabele tako, da podatke razvrstite v skupine (ali kategorije). Ta način predstavitve podatkov se imenuje dodelitev frekvenc.

Razporeditev frekvenc je vrtilna tabela, ki kategorizira podatke v skupine ali kategorije.

Ko so podatki združeni v frekvenčno porazdelitev, postane proces njihove analize in interpretacije bolj obvladljiv in smiseln. Pri dodeljevanju frekvenc morate skrbno izbrati interval združevanja ali obseg skupin ter izračunati tudi meje vsake skupine, ne da bi dovolili, da se prekrivajo.

Število skupin, izbranih za združevanje podatkov, je neposredno odvisno od velikosti izvirnega vzorca. Več elementov kot vsebuje izbor, več skupin lahko ustvarite. Praviloma pa mora frekvenčna porazdelitev vsebovati najmanj 5 in ne več kot 15 skupin.

Vsaka skupina, ki tvori frekvenčno porazdelitev, mora imeti enak razpon. Za izračun frekvenčne porazdelitve je treba določiti meje skupin, tako da se ne sekajo. Prekrivanje skupin ni dovoljeno. Tabela 2 prikazuje razvrščanje podatkov v skupine. Glavna prednost te tabele je zmožnost enostavnega izračuna osnovnih značilnosti podatkov. Na primer, približni razpon tedenskih plač je omejen na številke 2.000 in 9.000, pri čemer so stopnje na splošno združene v razponu od 5.000 do 8.000.

Za bolj poglobljeno analizo frekvenčne porazdelitve lahko narišete relativno frekvenčno porazdelitev ali odstotno porazdelitev. Relativna frekvenčna porazdelitev se izračuna tako, da se število elementov vsake skupine, ki tvorijo frekvenčno porazdelitev, deli s skupnim številom opazovanj.


5)) Metode za združevanje podatkov z uporabo funkcije FREQUENCY

Excel uporablja funkcijo FREQUENCY za izgradnjo vzorčnih distribucijskih funkcij. Ta funkcija izračuna pogostost pojavljanja naključne spremenljivke v danih intervalih vrednosti in jih izpiše kot niz frekvenc. Funkcija FREQUENCY je v statistični kategoriji Argument "podatkovni niz" je niz podatkov, za katere se izračunajo frekvence. Prepir "Matrika intervalov" - je niz intervalov, v katerih so vrednosti argumentov združene "podatkovni niz"(slika 6)

Število elementov (frekvenc) v vrnjenem nizu je število elementov v intervalnem nizu. Pred klicem funkcije FREQUENCY je treba zgraditi niz vrednostnih intervalov

Po načelu "bolje je enkrat videti kot stokrat slišati" se za analizo statističnih podatkov pogosto uporabljajo grafične slike in ne tabele.

Za povečanje vidnosti empiričnih distribucij se uporablja njihov grafični prikaz. Najpogostejši grafični prikazi so histogram, frekvenčni poligon in kumulativni frekvenčni poligon. 2.3.1. palični graf

Histogram se uporablja za grafično predstavitev distribucij nenehno spreminjajoče se lastnosti in je sestavljen iz sosednjih pravokotnikov, kot je prikazano na sl. 2.1. Osnova vsakega pravokotnika je enaka širini intervala združevanja, njegova višina pa je taka, da kvadratni pravokotnik je sorazmeren s frekvenco (ali frekvenco) zadetka v danem intervalu. Če je vrstica brez intervala, je širina vseh stolpcev izbrana poljubna, vendar enaka. Tako morajo biti višine pravokotnikov sorazmerne z vrednostmi

kje n i- frekvenca jaz th interval združevanja; h i- premer jaz th skupinski interval.

Na grafu histograma je osnova pravokotnikov narisana vzdolž abscise ( x), in višina - vzdolž ordinate ( pri) pravokotni koordinatni sistem.

Vendar v primerih, ko je širina vseh intervalov združevanja enaka, se oblika histograma ne bo spremenila, če vrednosti niso narisane vzdolž ordinatne osi p i, in frekvence intervalov n i.

Frekvenčni poligon

Druga pogosta grafična predstavitev je frekvenčni poligon.

Frekvenčni poligon tvori lomljena črta, ki povezuje točke, ki ustrezajo srednjim vrednostim intervalov združevanja in frekvencam teh intervalov, srednje vrednosti so narisane vzdolž osi NS, in frekvence - vzdolž osi pri.

Iz primerjave dveh obravnavanih metod grafične predstavitve empiričnih porazdelitev izhaja, da je za pridobitev frekvenčnega poligona iz zgrajenega histograma potrebno povezati središča oglišč pravokotnikov, ki tvorijo histogram, z ravnimi odseki. Predstavljen je primer frekvenčnega poligona

Frekvenčni poligon se uporablja za predstavitev porazdelitve tako neprekinjenih kot diskretnih značilnosti. V primeru neprekinjene porazdelitve je frekvenčni poligon bolj zaželen način grafiranja kot histogram, če je graf empirične porazdelitve opisan z gladko odvisnostjo.


6)) Pojem časovnih vrst in njihove vrste. Komponente časovne vrste

Pojem časovnih vrst in njihove vrste. Statistični opis razvoja gospodarskih procesov v času poteka s pomočjo časovnih vrst.

Časovne serije je niz opazovanj vrednosti določenega indikatorja (značilnosti), urejenih v kronološkem zaporedju, t.j. v naraščajočem vrstnem redu spremenljivke parametra t-čas. Posamezna opazovanja časovne vrste se imenujejo ravni te serije.

Časovne vrste se delijo na trenutne in intervalne. V trenutnih časovnih vrstah ravni označujejo vrednosti indikatorja v določenih časovnih točkah. Na primer, časovne vrste cen za določene vrste blaga, časovne vrste cen delnic, katerih ravni so določene za določene številke, so trenutne. Primeri trenutnih časovnih vrst so lahko tudi serije velikosti populacije ali vrednosti osnovnih sredstev, saj se vrednosti ravni teh serij določijo letno za isto število.

V intervalnih serijah ravni označujejo vrednost indikatorja za določene intervale (obdobja) časa. Primeri tovrstnih vrst so časovne vrste proizvodnje v fizičnem ali vrednostnem smislu za mesec, četrtletje, leto itd.

Včasih ravni serije niso neposredno opazovane vrednosti, temveč izpeljane vrednosti: povprečne ali relativne. Takšne serije imenujemo izpeljanke. Ravni takšnih časovnih vrst so pridobljene z nekaterimi izračuni na podlagi neposredno opaznih kazalnikov. Primeri takšnih serij so serije povprečne dnevne proizvodnje večjih industrijskih izdelkov ali serije indeksov cen.

Ravni niza imajo lahko deterministične ali naključne vrednosti. Primer niza z determinističnimi vrednostmi ravni je niz zaporednih podatkov o številu dni v mesecih. Seveda so serije z naključnimi vrednostmi ravni podvržene analizi in kasneje napovedovanju. V takih serijah lahko vsako raven obravnavamo kot realizacijo naključne spremenljivke – diskretne ali zvezne.

Komponente časovne vrste. V praksi napovedovanja je splošno sprejeto, da so vrednosti ravni časovnih vrst ekonomskih kazalnikov sestavljene iz naslednjih komponent: trenda, sezonske, ciklične in naključne komponente.

Trend se razume kot sprememba, ki določa splošno smer razvoja, glavni trend časovne vrste. Je sistematična sestavina dolgotrajnega delovanja. Ob dolgoročnih trendih v časovnem nizu gospodarskih procesov se pogosto dogajajo bolj ali manj redna nihanja -

periodične komponente niza dinamike. Če obdobje nihanj ne presega 1 leta, se imenujejo sezonsko. Najpogosteje se za vzrok njihovega pojava štejejo naravne in podnebne razmere. Včasih so razlogi za sezonska nihanja družbene narave, na primer povečanje nakupov v predprazničnem času, povečanje plačil ob koncu četrtletja itd. Pri daljšem obdobju nihanj se domneva, da je v časovni vrsti ciklična komponenta. Primeri vključujejo demografske, naložbene in druge cikle. Če se trendne in periodične komponente odstranijo iz časovne vrste, ostane nepravilna komponenta.

Ekonomisti delijo dejavnike, pod vplivom katerih nastane nepravilna komponenta, na 2 vrsti: _ dejavnike ostrega, nenadnega delovanja; _ trenutni dejavniki.

Prva vrsta dejavnikov (na primer naravne nesreče, epidemije itd.) Praviloma povzroča pomembnejša odstopanja v primerjavi z naključnimi nihanji - včasih se takšna odstopanja imenujejo katastrofalna nihanja. Dejavniki druge vrste povzročajo naključna nihanja, ki so posledica delovanja velikega števila sekundarnih vzrokov. Vpliv vsakega od trenutnih dejavnikov je nepomemben, vendar se čuti njihov celoten učinek.Če je časovna vrsta predstavljena kot vsota pripadajočih komponent, potem nastali model imenujemo aditivni (1.1), če je v obliki produkta. , je multiplikacijski (1.2) ali mešani tip (1.3):

Yt = ut + st + vt + et (1.1) Yt = ut _ st _ vt _ et (1.2) Yt = ut _ st _ vt + et (1.3),

kjer so yt ravni časovne vrste;

ut je komponenta trenda; st je sezonska komponenta; vt je ciklična komponenta; et je naključna komponenta.


7)) Kazalniki sprememb v ravneh številne dinamike

Kazalniki sprememb v ravneh številne dinamike. Analiza hitrosti razvoja pojava v času je značilna s pomočjo statističnih kazalnikov, ki so pridobljeni kot rezultat medsebojne primerjave ravni. Sem spadajo: absolutna rast, stopnja rasti in dobička, absolutna vrednost enega odstotka rasti

Absolutni dobiček () se izračuna kot razlika med obema nivojema serije. Glede na osnovo so primerjave lahko verižne ali kot osnovne. če je k = 1, potem je nivo pri i -1 prejšnji za dano serijo in absolutni prirastki spremembe nivoja bodo verižni.

Stopnja rasti- relativni kazalnik, izračunan kot razmerje med dvema nivojema serije. Intenzivnost ravni je ocenjena z razmerjem med nivojem poročanja in izhodiščnim stanjem ter je izražena s faktorjem rasti in stopnjo rasti. Koeficient rasti kaže, kolikokrat je dani nivo serije večji od osnovnega nivoja. Kot osnovno raven, odvisno od namena študija, lahko vzamemo neko konstantno raven za vse ali za vsako naslednjo stopnjo pred njo.

izhodiščna stopnja rasti oz stopnje rasti verige

Stopnja povečanja- relativni kazalnik, ki kaže, koliko odstotkov je določena raven višja od druge, vzet kot osnova za primerjavo. Lahko se izračuna na dva načina.

oz

Izračun povprečnih kazalnikov v nizu dinamike. Splošna značilnost dinamične serije je lahko najprej povprečna raven serije U. Imenuje se povprečna kronološka. Za različne vrste časovnih vrst se povprečna raven izračuna drugače.

V intervalnem nizu absolutnih vrednosti z enakimi obdobji se povprečna raven izračuna kot aritmetično preprosto povprečje ravni serije. Na primer

Povprečna raven se določi na enak način v nizu povprečnih vrednosti. Tako narobe. Povprečna raven za trenutno serijo se izračuna nekoliko drugače. Za niz trenutkov, ki vsebuje n nivojev z enakimi intervali med trenutki, je povprečna raven določena s formulo

To povprečje je v statistiki znano kot kronološko povprečje trenutne serije.

V primeru neenakih intervalov med datumi se lahko kronološko povprečje trenutne serije izračuna kot aritmetično povprečje povprečnih vrednosti nivojev ne za vsak par trenutkov, uteženih z razdaljo med datumi.

Na primer. Naj bodo naslednji podatki o razpoložljivosti zalog v skladišču za leto 2005.

Datum objave 01.01.2005 01.03.2005 01.06.2005 01.11.2005 01.01.2006
Ostanki blaga u.

Nato povprečno mesečno stanje blaga za leto 2005. bo.

Povprečno absolutno povečanje ravni se izračuna kot preprosta aritmetična sredina posameznika verižni prirastki

Pri 0 - kot osnova za izračun dobičkov od leta 2002 je torej 5 obdobij.

Poseben pomen pri analizi serije dinamike je izračun povprečnih stopenj rasti. Najpogosteje se povprečna stopnja rasti izračuna kot geometrijska sredina stopenj rasti verige, izračunanih v vsakem obdobju glede na prejšnje.

ali (1)

Hkrati je pri izračunu povprečne stopnje rasti včasih pomembneje, da se osredotočimo na doseganje skupne vsote ravni in ne le na končno raven. Na primer, ko gre za dinamiko takšnih kazalnikov, kot so investicije, zagon stanovanjskih prostorov, gradnja avtocest, je pomembno določiti povprečno stopnjo rasti, pri kateri je dosežena skupna vrednost kazalnika za analizirano obdobje, in ne samo končna raven. Nato se povprečna raven izračuna po formuli in se imenuje povprečna parabolična

(2)

Dobljena vrednost desne strani se določi v skladu s tabelo, osredotočeno na pridobivanje vsote ravni za obdobje.

Na primer, določite povprečno stopnjo rasti zagona stanovanjskih prostorov za obdobje 2000-2005

Najprej izračunajmo povprečno stopnjo rasti po formuli (1)

tiste. letni zagon stanovanjskih prostorov se zmanjša za 0,3 %. Tukaj je treba izvesti izračun povprečne letne stopnje rasti, pri čemer se osredotočimo na skupni znesek zagona stanovanj za celotno obdobje, nato se uporabi formula

za n = 5 iščemo vrednost blizu razmerja, ki smo ga dobili, to je 5,468 in ustreza k = 1,03 ali T = 103 %, kar pomeni povečanje oddaje stanovanjskega prostora v določenem obdobju letno za povprečno 3%. Podobno se reši, ko se nivoji znižajo.

Povprečna stopnja rasti se izračuna na podlagi povprečne stopnje rasti tako, da se od zadnjega odšteje 100 %.

T pr = T p -100 %. V prejšnjem primeru je povprečna stopnja rasti 103 %, potem je povprečna stopnja rasti = 103 % -100 % = 3 %.

Indikatorje spremembe nivojev serije lahko uporabimo pri izbiri analitične krivulje za poravnavo serije. Na primer, poravnava v ravni črti je učinkovita za niz nivojev, pri katerih so prve razlike (absolutni prirastki) ravni bolj ali manj konstantne. Parabola 2. reda odraža razvoj s pospešeno ali zapoznelo spremembo nivojev serije. hkrati pa absolutni verižni prirastki sami po sebi razkrivajo določen trend razvoja, vendar so absolutni verižni prirastki absolutnih verižnih prirastkov (razlike drugega reda) konstantni.

Če se pri zaporedni razporeditvi t vrednosti ravni spreminjajo eksponentno, se lahko tak razvoj odraža z eksponentno funkcijo.


8)) Splošne značilnosti številnih dinamik (povprečne ravni serije; povprečni kazalniki ravni serije)

Vrstice dinamike so vrstice kronološko razporejenih kazalnikov, ki označujejo spremembo katere koli vrednosti skozi čas. Serija dinamike vključuje dva glavna elementa: časovne indekse - t in ustrezne indekse velikosti - Y.

Povprečna dinamika

1. Povprečna raven

Označuje tipično vrednost kazalnikov

V intervalni časovni vrsti se izračuna kot preprosta aritmetična sredina

Y_ (avg) = \ frac (\ vsota Y_i) (n)

V trenutni dinamični seriji z enakimi časovnimi intervali med vzorci kot kronološko povprečje

Y_ (povprečno) = \ frac (\ frac (1) (2) Y_1 + Y_2 + ... + Y_ (n-1) + \ frac (1) (2) Y_n) (n-1)

2. Povprečna absolutna rast

Splošni kazalnik stopnje absolutne spremembe vrednosti časovne vrste

\ Delta_ (povprečno) Y = \ frac (\ Delta Y_b_i) (n-1)

3. Povprečna stopnja rasti

Splošne značilnosti stopenj rasti številnih dinamik

T_ (avg) = (T_b_i) ^ (\ frac (1) (i-1)) (koren stopnje i - 1)

4. Povprečna stopnja rasti

Razmerje je enako kot med stopnjo rasti in stopnjo rasti

T_ (povprečno) \ Delta = T_ (povprečno) -1

Za posploševanje značilnosti dinamike se uporabljajo naslednje:

1 srednji nivo vrstice;

2 povprečna indikatorja sprememb ravni serije:

Povprečna absolutna rast;

Povprečna stopnja rasti;

Povprečna stopnja rasti.

Povprečna raven serije daje posplošeno karakteristiko kazalnika za celotno obdobje, ki ga zajema serija dinamike.

Povprečna raven v intervalu in trenutnem nizu dinamike je določena na različne načine. V intervalnem nizu z enakimi obdobji (intervali) se povprečna raven izračuna po preprosti formuli aritmetične sredine. Na primer, povprečna raven proizvodnje nafte, taljenja surovega železa in tako naprej letno (na mesec) za obravnavano obdobje. Tako morate za izračun povprečja iz intervalne serije sešteti člane niza in dobljeno vsoto deliti z njihovim številom. To povprečje je v statistiki znano kot karakteristično povprečje za trenutno serijo. Tako je povprečna kronološka iz trenutne serije dinamike enaka vsoti kazalnikov te serije (v tem primeru je treba začetno in končno raven vzeti na polovico), deljeno s številom kazalnikov brez enega.

V primeru neenakih časovnih intervalov med dejstvi (trenutki, datumi) se povprečna raven serije določi v naslednjem zaporedju: 1) določi se povprečje za intervale, omejene z dvema datumoma; 2) izračun njihovega skupnega povprečja; medtem je treba povprečja za daljše intervale vzeti z utežmi, ki so večkratniki njihove dolžine.

Stopnje rasti(Stopnja dinamike TP) Je relativni statistični kazalnik, ki je opredeljen kot razmerje ene ravni do druge enake in kaže, kolikokrat je ena raven več (manj) od druge.

Glede na izbiro primerjalne osnove se stopnje rasti izračunajo kot verižne, ko se vsaka raven primerja z ravnjo prejšnjega obdobja, in kot osnovne, ko se vse ravni serije primerjajo z ravnjo enega od obdobja, vzeta kot osnova za primerjavo (praviloma je to začetna raven serije, lahko pa obstaja raven katerega koli drugega obdobja) V skladu s tem stopnje rasti verige(Trci) označujejo intenzivnost razvoja pojava v vsakem posameznem obdobju, izhodišče pa intenzivnost razvoja za katero koli časovno obdobje (loči dano raven od izhodišča). V obeh primerih se lahko stopnja rasti izrazi v obliki koeficientov, če vzamemo osnovo razmerja kot ena, in v obliki odstotkov, če vzamemo osnovo kot 100.

Stopnja rasti (TP) prikazuje, za koliko odstotkov se je primerjalna raven spremenila z nivojem, za primerjalno osnovo. Ta kazalnik je mogoče izračunati: 1) z izračunom 100 % in pripadajoče stopnje rasti ali 2) kot odstotek absolutne rasti do osnovne ravni, v primerjavi s katero se izračuna absolutna rast. Od tod sklep, da obstaja povezava med kazalniki stopnje rasti in stopnje rasti.Če se ravni števila dinamike znižajo (zmanjšajo), potem kazalnika stopnje rasti z znakom “-” in s “ +" znak, če se ravni povečajo. Tako stopnja rasti označuje relativno povečanje ali zmanjšanje ravni pojava.
Kazalnik absolutne vrednosti 1% rasti (A%) se določi kot količnik deljenja absolutne rasti s stopnjo rasti (za ustrezno obdobje) A% =?Y: Tn (%).

Absolutna vrednost 1-odstotnega povečanja je enaka stotinki prejšnje ravni. Iz tega je enostavno razbrati, da je izračun absolutne vrednosti 1-odstotnega dobička smiseln samo za verižne dobičke in stopnje rasti.
Za osnovni prirast se bodo zbrani prirastki z enako začetno ravnjo in zato za vse prirastke zmanjšali za enako vrednost 1 % prirastka.


9)) Metode glajenja časovnih vrst

Obstaja več metod za obdelavo časovnih vrst, in sicer: metoda agregacije intervalov, metoda drsečega povprečja in analitična poravnava. Pri vseh metodah se namesto dejanskih nivojev pri obdelavi serije izračunajo drugi nivoji, pri katerih se tako ali drugače izniči učinek naključnih faktorjev in s tem zmanjšajo nihanja nivoja. Posledično postanejo slednji tako rekoč »poravnani«, »zglajeni« glede na izvirne dejanske podatke. Takšne tehnike obdelave imenujemo glajenje ali izravnavanje časovnih vrst.

Ministrstvo za izobraževanje Ruske federacije

Vseruski dopisni finančno-ekonomski inštitut

podružnica Yaroslavl

Oddelek za statistiko

Tečajno delo

po disciplini:

"Statistika"

naloga številka 19

Študentka: Kurashova Anastasia Yurievna

Posebnost "Finance in kredit"

3 tečaj, periferija

Vodja: V.P. Sergejev

Jaroslavl, 2002

Načrtujte

1. Uvod …………………………………………………………………… 3 str.

2. Teoretični del ………………………………………………………… 4 str.

2.1 Osnovni pojmi o nizu dinamike ………………………… ... 4 str.

2.2 Metode za glajenje in poravnavo časovnih vrst …………………………………………………………… .6 str.

2.2.1 Metode "mehanskega glajenja" ……………………… 6 str.

2.2.2 Metode "analitične" poravnave …………………. 8 str.

3. Izračunski del …………………………………………………… 11 str.

4. Analitični del ………………………………………………………. .16 str.

5. Zaključek ……………………………………………………………………. stran 25

6. Reference ………………………………………………………… 26 strani.

7. Dodatki ………………………………………………………. 27 strani

Uvod

Popolne in zanesljive statistične informacije so nujna podlaga, na kateri temelji proces gospodarskega upravljanja. Vse informacije nacionalnega gospodarskega pomena se na koncu obdelajo in analizirajo s pomočjo statistike.

Prav statistični podatki omogočajo določitev obsega bruto domačega proizvoda in nacionalnega dohodka, opredelitev glavnih trendov v razvoju sektorjev gospodarstva, oceno stopnje inflacije, analizo stanja finančnih in blagovnih trgov, preučevanje življenjski standard prebivalstva in drugi družbeno-ekonomski pojavi in ​​procesi.

Obvladovanje statistične metodologije je eden od pogojev za razumevanje tržnih razmer, proučevanje trendov in napovedi, sprejemanje optimalnih odločitev na vseh ravneh delovanja.

Končna, analitična faza raziskave je težka, dolgotrajna in odgovorna. Na tej stopnji se izračunajo povprečni kazalniki in kazalniki porazdelitve, analizira se struktura populacije, razišče se dinamika in razmerje med preučevanimi pojavi in ​​procesi.

Na vseh stopnjah študije statistika uporablja različne metode. Statistične metode so posebne tehnike in metode za preučevanje množičnih družbenih pojavov.

JAZ. Teoretični del.

1.1 Osnovno NS Koncepti o vrstah dinamike.

Vrstice dinamike- statistični podatki, ki odražajo časovni razvoj preučevanega pojava. Imenujejo se tudi časovne vrste, časovne vrste.

Vsaka vrstica zvočnikov ima dva glavna elementa:

1) indikator časa t;

2) ustrezne stopnje razvoja preučevanega pojava y;

Časovni odčitki v nizu dinamike so bodisi določeni datumi (trenutki) bodisi ločena obdobja (leta, četrtletja, meseci, dnevi).

Stopnje serije dinamike odražajo kvantitativno oceno (mero) razvoja preučevanega pojava skozi čas. Lahko jih izrazimo kot absolutne, relativne ali povprečne vrednosti.

Serija dinamike se razlikuje glede na naslednje značilnosti:

1) Po času. Glede na naravo obravnavanega pojava se lahko ravni serije dinamike nanašajo bodisi na določene datume (trenutke) v času bodisi na ločena obdobja. V skladu s tem so serije dinamike razdeljene na trenutne in intervalne.

Trenutni nizi dinamike odražajo stanje preučenih pojavov ob določenih datumih (trenutih) v času. Primer trenutne serije dinamike je naslednji podatek o seznamu zaposlenih v trgovini v letu 1991 (tab. 1):

Tabela 1

Navedeno število zaposlenih v trgovini v letu 1991

Značilnost trenutne serije dinamike je, da lahko njene ravni vključujejo iste enote preučevanega agregata. Čeprav v nizu trenutkov obstajajo intervali - intervali med sosednjimi datumi v nizu - vrednost določene ravni ni odvisna od dolžine obdobja med dvema datumoma. Tako je glavni del zaposlenih v trgovini, ki sestavlja plačilno listo od 01.01.1991 in nadaljuje z delom v tem letu, je prikazan v ravneh naslednjih obdobij. Zato lahko pri seštevanju ravni trenutne serije pride do ponavljajočega se štetja.

S pomočjo trenutnih nizov dinamike v trgovini se preučujejo zaloge blaga, stanje osebja, število opreme in drugi kazalniki, ki odražajo stanje proučevanih pojavov za posamezne datume (trenutke) časa.

Intervalne serije dinamike odražajo rezultate razvoja (delovanja) preučenih pojavov za določena obdobja (intervale) časa.

Primer intervalne serije so podatki o maloprodajnem prometu trgovine v letih 1987 - 1991. (tab. 2):

tabela 2

Obseg maloprodajnega prometa trgovine v letih 1987 - 1991

Maloprodajni promet, tisoč rubljev

Vsaka raven intervalne serije je že vsota nivojev za krajša časovna obdobja. Hkrati enota agregata, ki je del ene ravni, ni del drugih ravni.

Značilnost intervalne serije dinamike je, da je vsaka njena raven sestavljena iz podatkov za krajše intervale (podobdobja) časa. Na primer, če seštejemo promet za prve tri mesece v letu, dobimo njegov obseg za prvo četrtletje, če seštejemo promet za štiri četrtletja, dobimo njegovo vrednost za leto itd. Ob vseh drugih pogojih, raven intervalne serije je večja, čim daljša je dolžina intervala, ki mu ta raven pripada.

Lastnost seštevanja nivojev za zaporedne časovne intervale omogoča pridobitev niza dinamike večjih obdobij.

S pomočjo intervalnih nizov dinamike v trgovini se preučujejo spremembe v času prejema in prodaje blaga, višina distribucijskih stroškov in drugi kazalniki, ki odražajo rezultate delovanja preučevanega pojava za določena obdobja.

Struktura številnih dinamik:

Teoretično je mogoče predstaviti poljubno število dinamik v obliki komponent:

1) trend - glavni trend razvoja časovne vrste (do povečanja ali zmanjšanja njenih ravni);

2) ciklično (periodična nihanja, vključno s sezonskimi);

naključna nihanja.

1. 2. Metode glajenja in poravnave časovnih vrst.

Odprava naključnih nihanj v vrednostih nivojev serije se izvede z iskanjem "povprečnih" vrednosti. Metode za odpravo naključnih dejavnikov so razdeljene še v dve skupini:

1. Metode "mehanskega" glajenja nihanj s povprečjem vrednosti serije glede na druge sosednje ravni serije.

2. Metode "analitične" poravnave, tj. določitev najprej funkcionalnega izraza trenda serije, nato pa novih, izračunanih vrednosti serije.

1.2. 1 Mehanske metode anti-aliasinga .

Tej vključujejo:

a. Metoda povprečja za dve polovici serije ko je vrsta razdeljena na dva dela. Nato se izračunata dve vrednosti povprečnih ravni serije, s katerimi je grafično določen trend serije. Očitno takšen trend ne odraža v celoti osnovnega vzorca razvoja pojava.

b. Intervalna metoda hrapavosti, pri katerem se poveča dolžina časovnih intervalov in se izračunajo nove vrednosti ravni serije.

v. Metoda drsečega povprečja... Ta metoda se uporablja za karakterizacijo trenda razvoja preučevane statistične populacije in temelji na izračunu povprečnih ravni serije za določeno obdobje. Zaporedje za določanje drsečega povprečja:

Nastavite interval glajenja ali število ravni, vključenih v njem. Če se pri izračunu povprečja upoštevajo tri ravni, se drseče povprečje imenuje trimesečno, pet stopenj - petmesečno itd. Če se majhna, neenakomerna nihanja ravni v nizu dinamike zgladijo, se interval (število drsečega povprečja) poveča. Če je treba valove ohraniti, se število izrazov zmanjša.

Izračunajte prvo povprečno raven s preprosto aritmetično:

y1 = Sy1 / m, kjer

y1 - I-ta raven vrstice;

m je članstvo drsečega povprečja.

Prva stopnja se zavrže, stopnja, ki sledi zadnji stopnji, ki sodeluje pri prvem izračunu, pa se vključi v izračun povprečja. Postopek se nadaljuje, dokler v izračun y ne vključimo zadnje stopnje proučevane serije dinamike y n.

Številne dinamike, zgrajene iz povprečnih ravni, razkrivajo splošni trend razvoja pojava.

Negativna stran uporabe metode drsečega povprečja je nastanek premikov v nihanjih nivojev serije zaradi "drsenja" konsolidacijskih intervalov. Glajenje gibljivega povprečja lahko privede do "obratnih" nihanj, ko se konveksni "val" nadomesti z konkavnim.

Tema: Izglajevanje dinamičnih vrstic

Zaradi vplivov naključnih dejavnikov in variabilnosti ravni številnih dinamik v času je težko prepoznati splošni trend v razvoju pojava, torej zaznati trend.

Da bi zmanjšali vpliv začasnih nihanj, se številna dinamika zgladi, da se prepozna glavni trend.

Metode za analizo glavnega trenda v seriji dinamike so razdeljene v 2 skupini:

glajenje ali mehanska poravnava posameznih členov niza dinamike z uporabo dejanskih vrednosti sosednjih nivojev

poravnava z uporabo krivulje, ki jo nariše m / y na določenih ravneh, t.j. tako da izraža tendenco serije in jo osvobaja nepomembnih nihanj

Prepoznavanje trenda je potrebno za napovedovanje razvoja pojavov skozi čas.

Napovedovanje je ocena prihodnosti, ki temelji na poglobljeni analizi trendov razvoja družbeno-ekonomskih pojavov in njihovega medsebojnega vpliva.

Proces napovedovanja vključuje identifikacijo možnih razvojnih alternativ za njihovo informirano izbiro in optimalno odločanje

Metode za prepoznavanje in analizo trendov nivoja dinamo serije

Metoda konsolidacije intervalov je konsolidacija časovnega obdobja, do katerega se ravni serije

Preprosta metoda drsečega povprečja. Povprečna raven serije se izračuna iz števila prvih po vrstnem redu nivojev serije, nato povprečja enakega števila stopenj začenši od druge, nato od tretje stopnje itd. Če je število ravni, uporabljenih za izračun povprečja, liho, se povprečje zabeleži na nivoju, ki se nahaja na sredini. Če je število ravni sodo, se bo povprečje nanašalo na interval m / y po srednjih intervalih. Za odpravo tega premika se uporablja metoda centriranje.

Centriranje pomeni iskanje povprečja dveh sosednjih drsečih povprečij. Pomanjkljivost te metode je, da se zmanjša število dinamike na obeh straneh.

Analitična poravnava vključuje predstavitev ravni serije kot časovne funkcije

Za prikaz glavnega trenda razvoja pojava skozi čas se uporabljajo naslednje funkcije:

Ø Polinomi stopnje

Ø Razstavljavci

Ø Logistične krivulje

Polinomi

a 0,1,2,3, n - parametri polinomov

V statistični praksi imajo parametri polinomov nizke stopnje včasih posebno razlago značilnosti niza dinamike.

a 1 se interpretira kot značilnost povprečnih pogojev niza dinamike. in 1,2,3 kot sprememba pospeška.

V statistiki je bilo razvito pravilo za izbiro stopnje polinoma razvojnega modela, ki temelji na določanju vrednosti končnih razlik v nivojih serije. po pravilu:

Polinom prve stopnje (ravna črta) je uporabljen kot model takšne serije dinamike, kjer so prve razlike (absolutni prirastki) konstantne.

Polinom II stopnje se uporablja za negativno serijo dinamike s konstantnimi 2 razlikama (pospeški)

Polinom stopnje W se uporablja za številne dinamike s konstantnimi 3 razlikami (stopnje rasti)

Po izbiri vrste enačbe je treba določiti parametre enačbe. Najpogostejši način za določanje parametrov enačbe je metoda najmanjših kvadratov. Po tej metodi je treba sestaviti sistem normalnih enačb

polinom I stopnje

Pri ročni obdelavi lahko za poenostavitev štetja pri poravnavi časovne serije vnesemo simbol za časovne točke t, tako da je vsota t = 0 (St = 0)

Ko je poravnan s parabolo 2. reda, če je St = 0, ima sistem naslednjo obliko:

Uskladitev po analitičnih formulah se lahko uporablja za napovedovanje posameznih kazalnikov z ekstrapolacijo serije – iskanje ravni zunaj dane serije. Pri napovedovanju družbeno-ekonomskih pojavov je uporaba polinomov visoke stopnje težavna, ker:

Upoštevati je treba številne dejavnike parametrov

Zahtevana je dolga serija kazalnikov preteklih obdobij (najmanj 20), za katere so značilne enake faktorske značilnosti. Zbiranje takšnih primarnih informacij je možno le v stabilnem gospodarstvu v daljšem obdobju. Hkrati obstaja velika verjetnost, da teoretično izračunane vrednosti kazalnikov napovedi ne bodo ustrezale praktičnim, zato je mogoče polinome visoke stopnje uporabiti le za kratkoročno napovedovanje.

Polinom II stopnje kaže na prisotnost preobrata trenda, saj grafično je predstavljen s parabolo.