Netezirea seriilor cronologice.  Metode de netezire și aliniere a seriilor cronologice

Netezirea seriilor cronologice. Metode de netezire și aliniere a seriilor cronologice

1. 2. Metode de netezire și aliniere a seriilor cronologice.
Eliminarea fluctuațiilor aleatorii ale valorilor nivelurilor seriei se realizează prin găsirea valorilor „medii”. Metodele de eliminare a factorilor aleatori sunt împărțite în încă două grupuri:
1. Metode de netezire „mecanică” a fluctuațiilor prin medierea valorilor seriei în raport cu alte niveluri adiacente ale seriei.
2. Metode de aliniere „analitică”, adică determinarea mai întâi a expresiei funcționale a tendinței seriei și apoi a valorilor noi, calculate ale seriei.
1.2. 1 Metode anti-aliasing mecanice .
Acestea includ:
dar. Metoda de calculare a mediei peste două jumătăți ale seriei când rândul este împărțit în două părți. Apoi, se calculează două valori ale nivelurilor medii ale seriei, prin care se determină grafic tendința seriei. Evident, o astfel de tendință nu reflectă pe deplin regularitatea principală a dezvoltării fenomenului.
b. Metoda de grosiere a intervalului, la care se face o creștere a lungimii intervalelor de timp și se calculează noi valori ale nivelurilor seriei.
Consolidarea intervalelor este cea mai simplă metodă de netezire a nivelurilor unei serii pentru a releva tendința principală a schimbării lor. În acest caz, pentru intervalele mărite, se determină valoarea totală sau valoarea medie a indicatorului studiat. Această metodă este deosebit de eficientă dacă nivelurile inițiale ale seriei corespund unor perioade scurte de timp. De exemplu, dacă există date cu privire la încărcarea zilnică a mărfurilor pe o cale ferată timp de o lună, atunci într-o astfel de serie sunt probabil fluctuații semnificative ale nivelurilor, deoarece cu cât este mai scurtă perioada pentru care sunt prezentate datele, cu atât este mai mare influența factori aleatori.

Pentru a elimina această influență, se recomandă mărirea intervalelor de timp (de exemplu, până la 5 sau 10 zile) și calcularea volumului total sau mediu zilnic de încărcare (respectiv, timp de cinci zile sau decenii). Împreună cu intervalele de timp mărite, regularitatea schimbării nivelului va fi mai evidentă.

Exemplul 2.8. Să existe următoarele date despre producția producției la întreprindere pe luni pentru an (la prețuri comparabile):

Decizie... Să mărim intervalele la trei luni și să calculăm producția lunară totală și medie pe trimestre. Obținem următoarele rezultate:



Evident, noile date exprimă mai clar modelul modificărilor producției pe parcursul anului - o creștere de la un trimestru la altul.

în. Metoda medie mobilă... Această metodă este utilizată pentru a caracteriza tendința de dezvoltare a populației statistice studiate și se bazează pe calcularea nivelurilor medii ale seriei pentru o anumită perioadă. Secvența pentru determinarea mediei mobile:
- setați intervalul de netezire sau numărul de niveluri incluse în acesta. Dacă se iau în considerare trei niveluri la calcularea mediei, media mobilă se numește trei termeni, cinci niveluri - cinci termeni etc. Dacă fluctuațiile mici, neregulate ale nivelurilor dintr-o serie de dinamici sunt netezite, atunci intervalul (numărul mediei mobile) este crescut. Dacă valurile ar trebui păstrate, numărul termenilor este redus.
- Calculați primul nivel mediu prin aritmetică simplă:
y1 = Sy1 / m, unde
y1 - I-lea nivel al rândului;
m este calitatea de membru al mediei mobile.
- primul nivel este eliminat, iar nivelul care urmează ultimului nivel care participă la primul calcul este inclus în calculul mediei. Procesul continuă până când ultimul nivel al seriei studiate de dinamică yn este inclus în calculul lui y.

O serie de dinamici, construite de la nivelurile medii, relevă tendința generală de dezvoltare a fenomenului.

Latura negativă a utilizării metodei mediei mobile este formarea de schimbări ale fluctuațiilor nivelurilor seriei, datorită „alunecării” intervalelor de consolidare. Netezirea medie mobilă poate duce la oscilații „inverse” atunci când o „undă” convexă este înlocuită cu una concavă.
Recent, a fost calculată media mobilă adaptivă. Diferența sa constă în faptul că valoarea medie a caracteristicii, calculată așa cum este descris mai sus, nu se referă la mijlocul rândului, ci la ultima perioadă de timp din intervalul de agregare. Mai mult, se presupune că media adaptivă depinde de nivelul anterior într-o măsură mai mică decât de cel actual. Adică, cu cât sunt mai multe intervale de timp între nivelul seriei și valoarea medie, cu atât mai puțină influență are valoarea acestui nivel al seriei asupra valorii mediei.
g. Metoda medie exponențială... Media exponențială este o medie mobilă adaptivă calculată utilizând greutăți care depind de gradul de „îndepărtare” a nivelurilor individuale ale seriei față de medie. Valoarea greutății scade pe măsură ce nivelul se îndepărtează de-a lungul unei linii drepte cronologice de la valoarea medie în conformitate cu o funcție exponențială, de aceea o astfel de medie se numește exponențială. În practică, se utilizează netezirea exponențială multiplă a mai multor dinamici, care este utilizată pentru a prezice dezvoltarea fenomenului.
Concluzie: metodele incluse în primul grup, având în vedere metodele de calcul utilizate, oferă cercetătorului o idee foarte simplificată, inexactă, a unei tendințe într-o serie de dinamici. Cu toate acestea, aplicarea corectă a acestor metode necesită cercetătorului să aibă o profunzime a cunoștințelor despre dinamica diferitelor fenomene socio-economice.
1.2.2 Tehnici analitice de aliniere
Un mod mai precis de a afișa tendința unei serii temporale este alinierea analitică, adică alinierea utilizând formule analitice. În acest caz, seria temporală este exprimată ca o funcție y (t), în care timpul t este luat ca factor principal, iar modificările în argumentul funcției determină valorile calculate ale lui yt.
Nivelurile efective (sau empirice) ale unui număr de dinamici sunt numite datele inițiale privind schimbarea fenomenului, adică datele obținute empiric prin observare. Ele sunt desemnate yi. Nivelurile calculate (sau teoretice) ale seriei sunt valorile obținute ca urmare a substituirii valorilor t în ecuația tendinței și le denotă.
Scopul alinierii analitice a seriei temporale este de a determina dependența analitică sau grafică f (t). În practică, conform seriei temporale disponibile, se stabilește forma și se găsesc parametrii funcției f (t) și apoi se analizează comportamentul abaterilor de la tendință. Funcția f (t) este aleasă în așa fel încât să ofere o explicație semnificativă a procesului studiat.

Ministerul Educației al Federației Ruse

Institutul financiar și economic de corespondență în toată Rusia

Ramură Yaroslavl

Departamentul de Statistică

Munca cursului

după disciplină:

"Statistici"

sarcina numărul 19

Student: Kurashova Anastasia Yurievna

Specialitatea „Finanțe și credite”

3 curs, periferie

Șef: V.P.Sergeev

Yaroslavl, 2002

1. Introducere ………………………………………………………… 3 p.

2. Partea teoretică ……………………………………………… 4 p.

2.1 Concepte de bază despre seria dinamicii ………………………… ... 4 p.

2.2 Metode de netezire și aliniere a seriilor temporale ……………………………………………………………… .6 p.

2.2.1 Metode de „netezire mecanică” ……………………… 6 p.

2.2.2 Metode de aliniere „analitică” …………………. 8 pp.

3. Partea calculată …………………………………………………… 11 p.

4. Partea analitică ……………………………………………. .16 pp.

5. Concluzie ………………………………………………………. Pagina 25

6. Referințe ……………………………………………… 26 pagini.

7. Anexe ………………………………………………………. 27 pagini


Introducere

Informațiile statistice complete și fiabile reprezintă baza necesară pe care se bazează procesul de management economic. Toate informațiile cu semnificație economică națională sunt procesate și analizate în cele din urmă folosind statistici.

Datele statistice fac posibilă determinarea volumului produsului intern brut și a venitului național, identificarea principalelor tendințe în dezvoltarea sectoarelor economice, evaluarea nivelului inflației, analizarea stării piețelor financiare și a mărfurilor, studierea nivelul de trai al populației și alte fenomene și procese socio-economice.

Stăpânirea metodologiei statistice este una dintre condițiile pentru înțelegerea situației pieței, studierea tendințelor și prognozarea, luarea deciziilor optime la toate nivelurile de activitate.

Etapa finală, analitică a cercetării este dificilă, laborioasă și responsabilă. În această etapă se calculează indicatorii medii și indicatorii de distribuție, se analizează structura populației, se investighează dinamica și relația dintre fenomenele și procesele studiate.

În toate etapele studiului, statisticile folosesc metode diferite. Metodele statistice sunt tehnici și metode speciale pentru studierea fenomenelor sociale de masă.

I. Partea teoretică.

1.1 Concepte de bază despre seria dinamicii.

Seriile de dinamici sunt date statistice care reflectă dezvoltarea fenomenului studiat în timp. Se mai numesc serii de timp, serii de timp.

Fiecare rând de difuzoare are două elemente principale:

1) indicator al timpului t;

2) nivelurile corespunzătoare de dezvoltare a fenomenului studiat y;

Citirile de timp din seria dinamicii sunt fie anumite date (momente), fie perioade separate (ani, trimestre, luni, zile).

Nivelurile seriei de dinamici reflectă o evaluare cantitativă (măsură) a dezvoltării fenomenului studiat în timp. Ele pot fi exprimate ca valori absolute, relative sau medii.

Seria dinamicii diferă în funcție de următoarele caracteristici:

1) După timp. În funcție de natura fenomenului studiat, nivelurile seriei de dinamici se pot referi fie la anumite date (puncte) în timp, fie la perioade separate. În conformitate cu aceasta, seria dinamicii este împărțită în moment și interval.

Seria momentană de dinamică reflectă starea fenomenelor studiate la anumite date (momente) din timp. Un exemplu al unei serii momentane de dinamici sunt următoarele informații despre numărul de angajați ai magazinului din 1991 (tab. 1):

tabelul 1

Numărul listat de angajați ai magazinului în 1991

O caracteristică a seriei momentane de dinamică este că nivelurile sale pot include aceleași unități ale populației studiate. Deși există intervale în seria momentelor - intervale între datele adiacente din serie - valoarea unui anumit nivel nu depinde de durata perioadei dintre două date. Deci, partea principală a personalului magazinului, care alcătuiește salariul începând cu 01.01.1991 și continuă să lucreze în acest an, este afișată în nivelurile perioadelor următoare. Prin urmare, la însumarea nivelurilor seriei de momente, poate apărea numărarea repetată.

Prin intermediul unor serii momentane de dinamică în comerț, stocuri de mărfuri, starea personalului, numărul de echipamente și alți indicatori care reflectă starea fenomenelor studiate pentru date (momente) individuale de timp sunt studiate.

Seriile de intervale de dinamică reflectă rezultatele dezvoltării (funcționării) fenomenelor studiate pentru anumite perioade (intervale) de timp.

Un exemplu de serie de intervale îl constituie datele privind cifra de afaceri cu amănuntul a unui magazin din 1987 - 1991. (tab. 2):

masa 2

Volumul cifrei de afaceri cu amănuntul a magazinului în 1987 - 1991

Cifra de afaceri cu amănuntul, mii de ruble

885.7 932.6 980.1 1028.7 1088.4

Fiecare nivel al unei serii de intervale este deja o sumă de niveluri pentru perioade mai scurte de timp. În acest caz, o unitate a agregatului care face parte dintr-un nivel nu face parte din alte niveluri.

O caracteristică a seriei de intervale de dinamică este că fiecare dintre nivelurile sale este compus din date pentru intervale mai scurte (sub-perioade) de timp. De exemplu, însumând cifra de afaceri pentru primele trei luni ale anului, obținem volumul pentru primul trimestru și însumând cifra de afaceri pentru patru trimestre, obținem valoarea sa pentru anul etc. Toate celelalte lucruri fiind egale, nivelul seriei de intervale este cu atât mai mare, cu cât este mai lungă intervalul de care aparține acest nivel.

Proprietatea de a însuma nivelurile pentru intervale de timp succesive face posibilă obținerea seriei de dinamici a perioadelor mai extinse.

Prin intermediul seriilor de intervale de dinamică în comerț, se studiază modificările în momentul primirii și vânzării mărfurilor, valoarea costurilor de distribuție și alți indicatori care reflectă rezultatele funcționării fenomenului studiat pentru anumite perioade.

Structura unui număr de dinamici:

Orice număr de dinamici poate fi reprezentat teoretic sub formă de componente:

1) tendință - tendința principală în dezvoltarea unei serii temporale (spre o creștere sau scădere a nivelurilor sale);

2) ciclice (fluctuații periodice, inclusiv sezoniere);

fluctuații aleatorii.

1. 2. Metode pentru netezirea și alinierea seriilor temporale.

Eliminarea fluctuațiilor aleatorii ale valorilor nivelurilor seriei se realizează prin găsirea valorilor „medii”. Metodele de eliminare a factorilor aleatori sunt împărțite în încă două grupuri:

1. Metode de netezire „mecanică” a fluctuațiilor prin medierea valorilor seriei în raport cu alte niveluri adiacente ale seriei.

2. Metode de aliniere „analitică”, adică determinarea mai întâi a expresiei funcționale a tendinței seriei și apoi a valorilor noi, calculate ale seriei.

1.2. 1 Metode de netezire „mecanică”.

Acestea includ:

dar. Metodă de calculare a mediei peste două jumătăți ale unei serii, când seria este împărțită în două părți. Apoi, se calculează două valori ale nivelurilor medii ale seriei, prin care se determină grafic tendința seriei. Evident, o astfel de tendință nu reflectă pe deplin regularitatea principală a dezvoltării fenomenului.

b. Metoda de agregare a intervalelor, în care se mărește durata intervalelor de timp, și se calculează noi valori ale nivelurilor seriei.

în. Metoda mișcării mobile. Această metodă este utilizată pentru a caracteriza tendința de dezvoltare a populației statistice studiate și se bazează pe calcularea nivelurilor medii ale seriei pentru o anumită perioadă. Secvența pentru determinarea mediei mobile:

Setați intervalul de netezire sau numărul de niveluri incluse în acesta. Dacă se iau în considerare trei niveluri la calcularea mediei, media mobilă se numește trei termeni, cinci niveluri - cinci termeni etc. Dacă fluctuațiile mici, neregulate ale nivelurilor dintr-o serie de dinamici sunt netezite, atunci intervalul (numărul mediei mobile) este crescut. Dacă valurile ar trebui păstrate, numărul termenilor este redus.

Calculați primul nivel mediu prin aritmetică simplă:

y1 = Sy1 / m, unde

y1 - I-lea nivel al rândului;

m este calitatea de membru al mediei mobile.

Primul nivel este eliminat, iar nivelul care urmează ultimului nivel care participă la primul calcul este inclus în calculul mediei. Procesul continuă până când ultimul nivel al seriei studiate de dinamică y n este inclus în calculul lui y.

O serie de dinamici, construite de la nivelurile medii, relevă tendința generală de dezvoltare a fenomenului.

Latura negativă a utilizării metodei mediei mobile este formarea de schimbări ale fluctuațiilor nivelurilor seriei, datorită „alunecării” intervalelor de consolidare. Netezirea medie mobilă poate duce la oscilații „inverse” atunci când o „undă” convexă este înlocuită cu una concavă.

Recent, a fost calculată media mobilă adaptivă. Diferența sa constă în faptul că valoarea medie a caracteristicii, calculată așa cum este descris mai sus, nu se referă la mijlocul rândului, ci la ultima perioadă de timp din intervalul de agregare. Mai mult, se presupune că media adaptivă depinde de nivelul anterior într-o măsură mai mică decât de cel actual. Adică, cu cât sunt mai multe intervale de timp între nivelul seriei și valoarea medie, cu atât mai puțină influență are valoarea acestui nivel al seriei asupra valorii mediei.

d. Metoda medie exponențială. Media exponențială este o medie mobilă adaptivă calculată folosind greutăți care depind de gradul de „îndepărtare” a nivelurilor individuale ale seriei față de medie. Valoarea greutății scade pe măsură ce nivelul se îndepărtează de-a lungul unei linii drepte cronologice de la valoarea medie în conformitate cu o funcție exponențială, de aceea o astfel de medie se numește exponențială. În practică, se utilizează netezirea exponențială multiplă a mai multor dinamici, care este utilizată pentru a prezice dezvoltarea fenomenului.

Concluzie: metodele incluse în primul grup, având în vedere metodele de calcul utilizate, oferă cercetătorului o idee foarte simplificată, inexactă, a unei tendințe într-o serie de dinamici. Cu toate acestea, aplicarea corectă a acestor metode necesită cercetătorului să aibă o profunzime a cunoștințelor despre dinamica diferitelor fenomene socio-economice.

Metode de eșantionare de bază

Fiabilitatea concluziilor statistice și interpretarea semnificativă a rezultatelor depind de reprezentativitate eșantionare, adică completitudinea și adecvarea reprezentării proprietăților populației generale, în raport cu care acest eșantion poate fi considerat reprezentativ. Studiul proprietăților statistice ale unei populații poate fi organizat în două moduri: folosind continuuși discontinuu observare ... Observare continuă prevede o anchetă a tuturor unități studiat agregatul, dar observarea discontinuă (selectivă)- doar părți din el.

Există cinci modalități principale de organizare a eșantionului de observare:

1. selecție aleatorie simplă, în care obiectele sunt extrase aleatoriu dintr-o populație generală de obiecte (de exemplu, folosind un tabel sau un generator de numere aleatorii), fiecare dintre probele posibile având probabilitate egală. Astfel de probe sunt numite aleatoriu propriu-zis;

2. selecție ușoară folosind o procedură obișnuită se efectuează utilizând o componentă mecanică (de exemplu, data, ziua săptămânii, numărul apartamentului, litera alfabetului etc.) și probele obținute în acest mod sunt numite mecanic;

3. stratificat selecția constă în faptul că populația generală a volumului este subdivizată în subseturi sau straturi (straturi) ale volumului astfel încât. Straturile sunt obiecte omogene în ceea ce privește caracteristicile statistice (de exemplu, populația este împărțită în straturi pe grupe de vârstă sau clasă socială; întreprinderi - după industrie). În acest caz, probele sunt numite stratificat(in caz contrar, stratificat, tipic, zonat);

4.metode serial selecția este folosită pentru a forma serial sau probe imbricate... Sunt convenabile dacă este necesar să se examineze simultan un „bloc” sau o serie de obiecte (de exemplu, un lot de mărfuri, produse dintr-o anumită serie sau o populație din diviziunea administrativ-teritorială a țării). Selectarea loturilor poate fi efectuată într-un mod pur aleatoriu sau mecanic. În acest caz, se efectuează un sondaj complet al unui anumit lot de bunuri sau al unei întregi unități teritoriale (clădire rezidențială sau cartier);



5. combinate(în trepte) selecția poate combina mai multe metode de selecție simultan (de exemplu, stratificată și aleatorie sau aleatorie și mecanică); se numește un astfel de eșantion combinate.

Tipuri de selecție

De minte distinge între selecția individuală, de grup și combinată. Cand selecție individuală unitățile individuale ale populației generale sunt selectate în eșantion, cu selectarea grupului- grupuri (serii) de unități omogene calitativ și selecție combinată presupune o combinație a primului și celui de-al doilea tip.

De metodă selecție distinge repetate și nerepetate probă.

Irepetabil se apelează selecția, în care unitatea care a intrat în eșantion nu revine la populația inițială și nu participă la selecția ulterioară; în timp ce numărul de unități din populația generală N este redus în procesul de selecție. Cand repetat selecţie prinsîn eșantion, unitatea după înregistrare este returnată populației generale și, astfel, păstrează o șansă egală, împreună cu alte unități, de a fi utilizată în procedura de selecție ulterioară; în timp ce numărul de unități din populația generală N rămâne neschimbată (metoda este rar utilizată în cercetarea socio-economică). Cu toate acestea, cu un mare N (N → ∞) formule pentru irepetabil selecțiile se apropie de cele pentru repetat selecție și aproape mai des acestea din urmă sunt folosite ( N = const).

Probele sunt determinist și probabilist.

Eșantionare deterministă constă din elementele incluse în acesta fără a lua în considerare probabilitatea apariției lor, adică respondenții participă la sondaje din proprie inițiativă. Un exemplu tipic sunt eșantioanele nereprezentative. De exemplu, multe companii efectuează sondaje permițând vizitatorilor paginile lor web să completeze un sondaj și să îl trimită pe Internet. Astfel de chestionare permit colectarea unei cantități mari de informații într-o perioadă scurtă de timp, dar eșantioanele constau în răspunsuri de la utilizatorii de internet care iau parte la sondaj din proprie inițiativă. În multe cazuri, singurul tip de probe disponibile nu sunt probe complet aleatorii. În acest caz, opinia unui expert în domeniul anchetei devine extrem de importantă pentru obținerea unor rezultate semnificative. Probele în vrac și bucățile de date sunt un alt exemplu de probe deterministe.

Probarea probelor- este format din elemente, a căror probabilitate este cunoscută în prealabil. Există patru tipuri de probe de probabilitate: aleatoare simple, sistematice, stratificate și grupate.

Eșantionare simplă aleatorie... În cadrul unei simple selecții aleatorii de către simbol n denotă de obicei dimensiunea eșantionului, iar simbolul N denotă dimensiunea cadrului (populația). Fiecare element stem este numerotat de la 1 la N. Probabilitatea de a alege un anumit element stem la prima extracție este 1 / N.

Eșantionul aleator ar trebui să fie reprezentativ, adică reprezentant. Eșantion reprezentativ- acesta este un eșantion în care toate caracteristicile principale ale populației generale din care este extras acest eșantion sunt prezentate aproximativ în aceeași proporție sau cu aceeași frecvență cu care apare această caracteristică în această populație generală. Există două modalități principale de a prelua eșantioane: cu și fără backtracking. Selectarea returnată înseamnă că elementul selectat este returnat la bază și probabilitatea recuperării acestuia rămâne constantă.

O selecție fără returnare înseamnă că după extragere elementul nu este returnat la bază și, prin urmare, nu poate fi selectat din nou.

La formare eșantionare sistematică N elementele care formează baza sunt împărțite în k grupe cu volumul n. Cu alte cuvinte, k = N / n.

Numărul k este rotunjit la cel mai apropiat număr întreg. Pentru a obține un eșantion sistematic, primul său element trebuie selectat aleatoriu din primele k elemente ale primului grup preluate din cadru. Restul elementelor sunt formate selectând fiecare al k-lea element al întregii baze.

Pentru educație eșantionarea clusterelor baza, formată din N elemente, este împărțită în mai multe clustere astfel încât fiecare clustere să reflecte proprietățile întregii populații generale. Apoi se efectuează o selecție aleatorie simplă de clustere, în care sunt studiate toate elementele.


4)) Metode de grupare a datelor

Gruparea este împărțirea unei populații în grupuri care sunt omogene într-un fel sau combinarea unităților individuale ale populației în grupuri care sunt omogene într-un fel. Delimitarea persistentă a obiectelor se numește clasificare sau standard în care fiecare înregistrare de atribut poate fi atribuită unui singur grup sau subgrup. Metoda de grupare se bazează pe două categorii - atributul de grupare și intervalul.

O caracteristică de grupare este o caracteristică prin care unitățile individuale ale populației sunt combinate în grupuri omogene. Poate fi atât cantitativ, cât și calitativ. În unele cazuri, o grupare care pare a fi pur calitativă se dovedește în cele din urmă să se bazeze pe o trăsătură cantitativă. Aceasta este, de exemplu, clasificarea întreprinderilor industriale după industrie. Deoarece una și aceeași întreprindere produce produse de diferite tipuri, statisticile decid această problemă prin predominanța cantitativă a unui tip sau altul.

Intervalul conturează limitele cantitative ale grupurilor și reprezintă intervalul dintre valorile maxime și minime ale unei trăsături dintr-un grup. Intervalele sunt egale, inegale, închise (atunci când există o margine superioară și inferioară) și deschise (când una dintre margini lipsește).

Gruparile și clasificările statistice urmăresc scopul identificării populațiilor omogene calitativ, studierii structurii agregatului și studierea relației dintre factor și caracteristicile efective. Fiecare dintre aceste obiective corespunde unui tip special de grupare: tipologic, structural și analitic.

În funcție de numărul de caracteristici stabilite în baza grupării, se disting grupări simple și multidimensionale.

Gruparea simplă se realizează pe o singură bază. Dintre grupările simple, se remarcă seria de distribuție. Seria de distribuție - o grupare în care un indicator este utilizat pentru a caracteriza grupurile ordonate după valoarea unei caracteristici - dimensiunea grupului.

Să luăm un exemplu condiționat al unei serii discrete de distribuție a corespondenței elevilor după înălțime:

P / p Nr.
Înălțime, cm

Această serie este clasificată deoarece valorile de creștere sunt sortate în ordine crescătoare.

Să construim o serie de intervale de distribuție a elevilor după înălțime, pentru care este necesar să alegeți numărul optim de grupuri (intervale ale unei caracteristici) și să setați lungimea (intervalul) intervalului. Deoarece analiza ulterioară a seriei de distribuție compară frecvențele în diferite intervale, este necesar ca lungimea intervalelor să fie constantă (în caz contrar, pentru comparabilitate, frecvența va trebui împărțită la unitatea de interval - valoarea obținută se numește densitate ).

Numărul optim de grupuri este ales astfel încât diversitatea valorilor trăsăturii din agregat să fie suficient reflectată și, în același timp, regularitatea distribuției, forma sa nu este distorsionată de fluctuațiile aleatorii ale frecvențelor. Dacă există prea puține grupuri, atunci modelul de variație nu va apărea; dacă există prea multe grupuri, atunci hameiul de frecvență aleatoriu va distorsiona forma distribuției.

Exemplu. Analizați nivelul salariilor săptămânale (salariu) al lucrătorilor dintr-o firmă pe baza unui eșantion de 30 de lucrători

6500 4580 5670 7460 7650 8760 6960 6540 7490 3760 5430 6540 6750 4390 7830 6200 5700 6430 7950 2300 6490 5630 7890 5680 6430 5890 7900 5370 5890 3500

Datele, în această formă originală, sunt dificil de analizat. Pentru a le face semnificative, le prezentăm sub forma unui tabel de frecvențe. Pentru a face acest lucru, pentru a determina gama totală a tabelului de frecvențe, găsim cele mai mari și cele mai mici valori. În exemplu, cea mai mare valoare este 8760 tenge, iar cea mai mică valoare este 2300 tenge. În Excel, puteți utiliza funcțiile MAX și MIN în aceste scopuri.

Apoi, trebuie să împărțiți intervalul specificat în grupuri sau intervale de grupare. În multe cazuri, este recomandabil să se împartă în mai multe sau mai puține grupuri. La gruparea datelor, se pune întrebarea în câte grupuri va fi împărțită populația studiată. Nu există un răspuns standard la această întrebare. Dacă distribuția unei trăsături în limitele variației sale este suficient de uniformă sau aproape de normal, gama de fluctuații a trăsăturii este împărțită în intervale egale, a căror lungime este determinată de formula:

unde x max, x min sunt valorile maxime și minime ale atributului din agregat; k este numărul de grupuri. Numărul de grupuri poate fi determinat de formula Sturgess k = 1 + 3,322 lgN, unde N este numărul de unități din agregat. De obicei grupurile au aceeași lungime a intervalului. În exemplul nostru, intervalele de date pot fi determinate de formula:

k = 1 + 3.322lgN = 1 + 3.322xlg30 = 1 + 3.322x1.477 = 5.9

h = =

Valoarea rezultată ar trebui corectată pentru a facilita calculele, în exemplul nostru, 1000. Astfel, o vom prezenta sub forma tabelului 1.

Tabelul 1- Frecvența de grupare

Acest tabel arată că partea principală, din 30 de lucrători, 24 câștigă în intervalul 5000-8000 tenge. Când angajăm muncitori, le putem spune că, în medie, mulți muncitori câștigă de la 5.000 la 8.000. Datele brute pot fi tabelate cu margini deschise, după cum se arată mai jos:

Tabelul 2- Gruparea după greutate specifică

Din acest tabel 2 se poate observa că 80% dintre lucrătorii dintr-o companie de 30 de lucrători primesc de la 5.000 la 8.000 de tenge.

Intervalele sunt numite închise, în care sunt indicate ambele limite, deschise - intervale cu o limită. Intervale 2000 - acoperă salariile din 2000 și peste, dar sub prima cifră a intervalului grupului următor, adică sub 3000 tenge.

Prin utilizarea spațierii egale pentru a forma grupuri, numărul lor va crește inutil, iar multe grupuri vor fi mici. În aceste condiții, populația este împărțită în grupuri la intervale inegale.

Alocarea frecvenței

Pe măsură ce mărimea eșantionului crește, nici matricea ordonată, nici diagrama tulpină și frunze nu fac mai ușor prezentarea, analiza și interpretarea rezultatelor. Pentru seturile de date mari, ar trebui să creați tabele pivot prin clasificarea datelor în grupuri (sau categorii). Acest mod de prezentare a datelor se numește alocarea frecvenței.

Alocarea frecvenței este un tabel pivot care clasifică datele în grupuri sau categorii.

Când datele sunt grupate într-o distribuție de frecvență, procesul de analiză și interpretare a acestora devine mai ușor de gestionat și mai semnificativ. Atunci când alocați frecvențe, trebuie să alegeți cu atenție intervalul de grupare sau intervalul grupurilor și, de asemenea, să calculați limitele fiecărui grup, fără a le permite să se suprapună.

Numărul de grupuri selectate pentru gruparea datelor depinde în mod direct de mărimea eșantionului original. Cu cât selecția conține mai multe elemente, cu atât puteți crea mai multe grupuri. Cu toate acestea, de regulă, distribuția frecvenței ar trebui să conțină nu mai puțin de 5 și nu mai mult de 15 grupuri.

Fiecare grup care formează o distribuție de frecvență trebuie să aibă același interval. Pentru a calcula distribuția frecvenței, este necesar să se definească limitele grupurilor, astfel încât acestea să nu se intersecteze. Suprapunerea grupurilor nu este permisă. Tabelul 2 prezintă gruparea datelor. Principalul avantaj al acestui tabel este capacitatea de a calcula cu ușurință caracteristicile de bază ale datelor. De exemplu, intervalul aproximativ al salariilor săptămânale este limitat la numerele 2000 și 9000, numerele fiind grupate în general în intervalul 5000-8000.

Pentru o analiză mai aprofundată a distribuției frecvenței, poate fi trasată fie o distribuție relativă a frecvenței, fie o distribuție procentuală. Distribuția relativă a frecvenței se calculează prin împărțirea numărului de elemente din fiecare grup care formează distribuția frecvenței la numărul total de observații.


5)) Metode de grupare a datelor folosind funcția FRECVENȚĂ

Excel folosește funcția FRECVENȚĂ pentru a crea funcții de distribuție a eșantionului. Această funcție calculează frecvențele de apariție a unei variabile aleatorii în intervalele date de valori și le transmite ca o serie de frecvențe. Funcția FRECVENȚĂ se află în categoria Statistică Argument „Matrice de date” este un set de date pentru care sunt calculate frecvențele. Argument „Matrice de intervale” - acesta este setul de intervale în care valorile argumentului sunt grupate "matrice de date"(Figura 6)

Numărul de elemente (frecvențe) din matricea returnată este numărul de elemente din matricea de interval. Înainte de a apela funcția FRECVENȚĂ, trebuie construită o serie de intervale de valori

Urmând principiul „este mai bine să vezi o dată decât să auzi de o sută de ori”, imaginile grafice sunt adesea folosite pentru a analiza datele statistice, mai degrabă decât tabelele.

Pentru a crește vizibilitatea distribuțiilor empirice, se utilizează reprezentarea lor grafică. Cele mai frecvente reprezentări grafice sunt histograma, poligonul de frecvență și poligonul de frecvență cumulat. 2.3.1. grafic de bare

O histogramă este utilizată pentru a reprezenta grafic distribuțiile caracteristici care variază continuuși constă din dreptunghiuri adiacente, așa cum se arată în Fig. 2.1. Baza fiecărui dreptunghi este egală cu lățimea intervalului de grupare, iar înălțimea acestuia este astfel încât zonă dreptunghiul este proporțional cu frecvența (sau frecvența) de lovire a intervalului dat. Dacă rândul este fără intervale, atunci lățimea tuturor coloanelor este aleasă arbitrar, dar aceeași. Astfel, înălțimile dreptunghiurilor ar trebui să fie proporționale cu valorile

Unde n i- frecvență eu al treilea interval de grupare; Salut- lățime eu al treilea interval de grupare.

Pe graficul histogramei, baza dreptunghiurilor este reprezentată de-a lungul axei abscisei ( X), și înălțimea - de-a lungul ordonatei ( la) un sistem de coordonate dreptunghiular.

Cu toate acestea, în cazurile în care lățimea tuturor intervalelor de grupare este aceeași, forma histogramei nu se va schimba dacă valorile nu sunt reprezentate de-a lungul axei ordonate p i, și frecvențele intervalelor n i.

Poligon de frecvență

O altă reprezentare grafică comună este poligonul de frecvență.

Poligonul de frecvență este format dintr-o linie întreruptă care leagă punctele corespunzătoare valorilor mediane ale intervalelor de grupare și frecvențelor acestor intervale, valorile mediane sunt reprezentate de-a lungul axei Xși frecvențe - de-a lungul axei la.

Dintr-o comparație a celor două metode considerate de reprezentare grafică a distribuțiilor empirice, rezultă că, pentru a obține un poligon de frecvență din histograma construită, este necesar să conectați punctele medii ale vârfurilor dreptunghiurilor care formează histograma cu linie dreaptă. segmente. Este prezentat un exemplu de poligon de frecvență

Poligonul de frecvență este utilizat pentru a reprezenta distribuțiile caracteristicilor continue și discrete. În cazul unei distribuții continue, poligonul de frecvență este un mod mai preferabil de a grafica decât o histogramă, dacă graficul de distribuție empirică este descris printr-o dependență lină.


6)) Conceptul de serii de timp și tipurile lor. Componente ale seriei temporale

Conceptul de serii de timp și tipurile lor. Descrierea statistică a dezvoltării proceselor economice în timp se realizează utilizând serii temporale.

Serii cronologice este o serie de observații ale valorilor unui anumit indicator (caracteristică), ordonate în ordine cronologică, adică în ordine crescătoare a variabilei parametrului t-time. Observațiile individuale ale unei serii temporale se numesc nivelurile acelei serii.

Seriile de timp sunt împărțite în instantanee și în intervale. În seriile temporare momentane, nivelurile caracterizează valorile indicatorului ca în anumite momente din timp. De exemplu, seria temporală a prețurilor pentru anumite tipuri de bunuri, seria temporală a prețurilor acțiunilor, ale căror niveluri sunt fixate pentru numere specifice, sunt momentane. Exemple de serii temporare momentane pot fi, de asemenea, seria dimensiunii populației sau a valorii activelor fixe, deoarece valorile nivelurilor acestor serii sunt determinate anual pentru același număr.

În seriile de intervale, nivelurile caracterizează valoarea indicatorului pentru anumite intervale (perioade) de timp. Exemple de serii de acest tip sunt seriile temporale de producție în termeni fizici sau valorici pentru o lună, trimestru, an etc.

Uneori nivelurile unei serii nu sunt valori observate direct, ci valori derivate: medie sau relativă. Astfel de serii se numesc derivate. Nivelurile unor astfel de serii de timp sunt obținute prin intermediul unor calcule bazate pe indicatori direct observabili. Exemple de astfel de serii sunt seriile producției medii zilnice de produse industriale majore sau seriile de indici de preț.

Nivelurile seriei pot lua valori deterministe sau aleatorii. Un exemplu de serie cu valori deterministe ale nivelurilor este o serie de date secvențiale privind numărul de zile din luni. Bineînțeles, seriile cu valori aleatorii ale nivelurilor sunt supuse analizei și ulterior prognozei. În astfel de serii, fiecare nivel poate fi considerat ca o realizare a unei variabile aleatorii - discretă sau continuă.

Componente ale seriei temporale.În practica de prognoză, este general acceptat faptul că valorile nivelurilor seriilor temporale ale indicatorilor economici constau din următoarele componente: componente de tendință, sezoniere, ciclice și aleatorii.

O tendință este înțeleasă ca o schimbare care determină direcția generală de dezvoltare, tendința principală a seriei cronologice. Aceasta este o componentă sistematică a acțiunii pe termen lung. Împreună cu tendințele pe termen lung din seria temporală a proceselor economice, au loc deseori fluctuații mai mult sau mai puțin regulate -

componente periodice ale seriei dinamicii. Dacă perioada de fluctuații nu depășește 1 an, atunci acestea se numesc sezoniere. Cel mai adesea, condițiile naturale și climatice sunt considerate cauza apariției lor. Uneori, motivele fluctuațiilor sezoniere sunt de natură socială, de exemplu, o creștere a achizițiilor în perioada pre-vacanță, o creștere a plăților la sfârșitul trimestrului etc. Cu o perioadă mai lungă de fluctuații, se crede că există o componentă ciclică în seria temporală. Exemplele includ demografice, investiții și alte cicluri. Dacă eliminați tendința și componentele periodice din seria temporală, va rămâne o componentă neregulată.

Economiștii împart factorii sub influența cărora se formează componenta neregulată în 2 tipuri: _ factori de acțiune bruscă, bruscă; _ factorii actuali.

Primul tip de factori (de exemplu, dezastre naturale, epidemii etc.), de regulă, determină abateri mai semnificative în comparație cu fluctuațiile aleatorii - uneori astfel de abateri se numesc fluctuații catastrofale. Factorii de al doilea tip determină fluctuații aleatorii, care sunt rezultatul unui număr mare de cauze secundare. Influența fiecăruia dintre factorii actuali este nesemnificativă, dar efectul lor total se simte. Dacă seria temporală este reprezentată ca o sumă a componentelor corespunzătoare, atunci modelul rezultat se numește aditiv (1.1), dacă este sub forma unui produs , este multiplicativ (1.2) sau mixt (1.3):

Yt = ut + st + vt + et (1.1) Yt = ut _ st _ vt _ et (1.2) Yt = ut _ st _ vt + et (1.3),

unde yt sunt nivelurile seriei temporale;

ut este componenta de tendință; st este componenta sezonieră; vt este componenta ciclică; et este componenta aleatorie.


7)) Indicatori ai modificărilor nivelurilor unei serii de dinamici

Indicatori ai modificărilor nivelurilor unei serii de dinamici. Analiza ratei de dezvoltare a fenomenului în timp este caracterizată folosind indicatori statistici, care sunt obținuți prin compararea nivelurilor între ele. Acestea includ: creșterea absolută, rata de creștere și câștig, valoarea absolută a unu la sută din creștere

Câștig absolut () se calculează ca diferență între cele două niveluri ale seriei. În funcție de bază, comparațiile pot fi înlănțuite sau la fel de elementare. dacă k = 1, atunci nivelul de la i -1 este cel anterior pentru seria dată, iar creșterile absolute ale schimbării nivelului vor fi în lanț.

Rata de crestere- indicator relativ, calculat ca raportul celor două niveluri ale seriei. Intensitatea nivelurilor este evaluată de raportul dintre nivelul de raportare și valoarea inițială și este exprimată prin factorul de creștere și rata de creștere. Coeficientul de creștere arată de câte ori nivelul dat al seriei este mai mare decât nivelul de bază. Ca nivel de bază, în funcție de scopul studiului, se poate lua un nivel constant pentru toți sau pentru fiecare nivel ulterior care îl precedă.

rata de creștere inițială sau rate de creștere a lanțului

Rata de creștere- un indicator relativ care arată câte procente un nivel dat este mai mare decât altul, luat ca bază de comparație. Poate fi calculat în două moduri.

sau

Calculul mediilor din seria dinamicii. Caracteristica generalizată a seriei dinamice poate fi în primul rând nivelul mediu al seriei U. Se numește cronologic mediu. Pentru diferite tipuri de serii temporale, nivelul mediu este calculat diferit.

Într-o serie de intervale de valori absolute cu perioade egale, nivelul mediu este calculat ca medie simplă aritmetică a nivelurilor seriei. De exemplu

Nivelul mediu este determinat în același mod în seria valorilor medii. Atat de gresit. Nivelul mediu pentru seria momentului este calculat oarecum diferit. Pentru o serie de momente care conține n niveluri cu intervale egale între momente, nivelul mediu este determinat de formulă

Această medie este cunoscută în statistici ca medie cronologică pentru seria momentelor.

În cazul unor intervale inegale între date, media cronologică pentru seria momentelor poate fi calculată ca medie aritmetică a valorilor medii ale nivelurilor nu pentru fiecare pereche de momente, ponderată de distanța dintre date.

De exemplu. Să existe următoarele date despre disponibilitatea soldurilor de stocuri în depozit pentru anul 2005.

Data postării 01.01.2005 01.03.2005 01.06.2005 01.11.2005 01.01.2006
Resturi de bunuri u.

Apoi soldul mediu lunar de bunuri pentru 2005. va fi.

Creșterea medie absolută a nivelurilor este calculată ca medie aritmetică simplă a individului trepte de lanț

La 0 - ca bază pentru calcularea câștigurilor din 2002, deci există 5 perioade.

O importanță deosebită în analiza seriei de dinamici este dată calculului ratelor medii de creștere. Cel mai adesea, rata medie de creștere este calculată ca medie geometrică a ratelor de creștere a lanțului calculate în fiecare perioadă în raport cu cea precedentă.

Sau (1)

În același timp, atunci când se calculează rata medie de creștere, este uneori mai important să ne concentrăm asupra realizării sumei totale a nivelurilor și nu doar a nivelului final. De exemplu, când vine vorba de dinamica unor indicatori precum investiții, punerea în funcțiune a spațiului rezidențial, construcția de autostrăzi, atunci este important să se determine rata medie de creștere la care se atinge valoarea totală a indicatorului pentru perioada analizată și nu doar nivelul final. Apoi nivelul mediu este calculat prin formulă și se numește parabolic mediu

(2)

Valoarea obținută din partea dreaptă este determinată de tabelul care vizează obținerea sumei nivelurilor pentru perioada respectivă.

De exemplu, determinați rata medie de creștere a punerii în funcțiune a spațiului rezidențial pentru perioada 2000-2005

În primul rând, să calculăm rata medie de creștere folosind formula (1)

acestea. punerea în funcțiune anuală a spațiului rezidențial este redusă cu 0,3%. Aici trebuie efectuat calculul ratei medii anuale de creștere, concentrându-se pe cantitatea totală de punere în funcțiune a locuințelor pentru întreaga perioadă, apoi se folosește formula

pentru n = 5, căutăm o valoare apropiată de raportul pe care l-am obținut, acesta este 5.468 și corespunde cu k = 1.03 sau T = 103%, ceea ce înseamnă o creștere a punerii în funcțiune a spațiului rezidențial în perioada specificată anual de o medie de 3%. În mod similar, se rezolvă atunci când nivelurile scad

Rata medie de creștere este calculată pe baza ratei medii de creștere, scăzând 100% din ultima.

T pr = T p -100%. În exemplul anterior, rata medie de creștere este de 103%, apoi rata medie de creștere = 103% -100% = 3%.

Indicatorii schimbării nivelurilor unei serii pot fi folosiți la alegerea unei curbe analitice pentru alinierea unei serii. De exemplu, alinierea în linie dreaptă este eficientă pentru o serie de niveluri în care primele diferențe (trepte absolute) de niveluri sunt mai mult sau mai puțin constante. Parabola de ordinul 2 reflectă dezvoltarea cu o schimbare accelerată sau întârziată a nivelurilor seriei. în același timp, incrementele de lanț absolut în sine dezvăluie o anumită tendință de dezvoltare, dar incrementele de lanț absolut ale incrementelor de lanț absolut (diferențe de ordinul doi) sunt constante.

Dacă, cu un aranjament secvențial de t, valorile nivelurilor se schimbă exponențial, atunci o astfel de dezvoltare poate fi reflectată de o funcție exponențială.


8)) Caracteristicile generalizatoare ale unui număr de dinamici (nivelurile medii ale unei serii; indicatorii medii ai nivelurilor unei serii)

Seria de dinamici este seria de indicatori dispuși în ordine cronologică care caracterizează schimbarea oricărei valori în timp. Seria de dinamici include două elemente principale: indici de timp - t și indici de magnitudine corespunzători - Y.

Dinamica medie

1. Nivelul mediu

Caracterizează valoarea tipică a indicatorilor

Într-o serie de timp interval, este calculată ca o medie aritmetică simplă

Y_ (avg) = \ frac (\ sum Y_i) (n)

Într-o serie dinamică momentană cu intervale de timp egale între probe ca medie cronologică

Y_ (avg) = \ frac (\ frac (1) (2) Y_1 + Y_2 + ... + Y_ (n-1) + \ frac (1) (2) Y_n) (n-1)

2. Creșterea absolută medie

Indicator generalizator al ratei de schimbare absolută a valorilor seriei temporale

\ Delta_ (avg) Y = \ frac (\ Delta Y_b_i) (n-1)

3. Rata medie de creștere

Caracteristicile generalizatoare ale ratelor de creștere ale mai multor dinamici

T_ (avg) = (T_b_i) ^ (\ frac (1) (i-1)) (rădăcină de gradul i - 1)

4. Rata medie de creștere

Relația este aceeași ca între rata de creștere și rata de creștere

T_ (avg) \ Delta = T_ (avg) -1

Pentru generalizarea caracteristicilor dinamicii, se utilizează următoarele:

1 niveluri medii ale rândului;

2 indicatori medii ai modificărilor nivelurilor seriei:

Creștere absolută medie;

Rata medie de creștere;

Rata medie de creștere.

Nivelul mediu al seriei oferă o caracteristică generalizată a indicatorului pentru întreaga perioadă acoperită de seria dinamicii.

Nivelul mediu în intervalul și seria momentană de dinamică este determinat în moduri diferite. Într-o serie de intervale cu perioade egale (intervale), nivelul mediu este calculat folosind formula medie aritmetică simplă. De exemplu, nivelul mediu al producției de ulei, topirea fontei și așa mai departe anual (pe lună) pentru perioada examinată. Astfel, pentru a calcula media din seria de intervale, trebuie să adăugați membrii seriei și să împărțiți suma rezultată la numărul lor. Această medie este cunoscută în statistici ca medie caracteristică pentru seria instantanee. Astfel, media cronologică din seria momentană de dinamică este egală cu suma indicatorilor acestei serii (în acest caz, nivelurile inițiale și finale ar trebui luate la jumătate), împărțite la numărul de indicatori fără unul.

În cazul unor intervale de timp inegale între fapte (momente, date), nivelul mediu al seriei este determinat în următoarea succesiune: 1) se determină media pentru intervalele limitate de două date; 2) calcularea mediei totale din acestea; între timp, mediile pentru intervale mai lungi ar trebui luate cu greutăți care sunt multiple ale lungimii lor.

Ratele de creștere(Rata dinamicii TP) Este un indicator statistic relativ, definit ca raportul de la un nivel la altul din același nivel și care arată de câte ori un nivel este mai mult (mai puțin) decât altul.

În funcție de alegerea bazei de comparație, ratele de creștere sunt calculate ca înlănțuite, când fiecare nivel este comparat cu nivelul din perioada anterioară și ca de bază, când toate nivelurile seriei sunt comparate cu nivelul unuia dintre perioadele luate ca bază de comparație (de regulă, acesta este nivelul inițial al seriei, dar poate exista un nivel al oricărei alte perioade) În consecință ratele de creștere a lanțului(Trci) caracterizează intensitatea dezvoltării fenomenului în fiecare perioadă separată și linia de bază - intensitatea dezvoltării pentru orice perioadă de timp (separând nivelul dat de linia de bază). În ambele cazuri, rata de creștere poate fi exprimată sub formă de coeficienți dacă baza raportului este luată ca una, și sub formă de procente dacă baza este luată ca 100.

Rata de creștere (TP) arată câte procente s-a schimbat nivelul comparat cu nivelul, pentru baza de comparație. Acest indicator poate fi calculat: 1) calculând 100% și rata de creștere corespunzătoare sau 2) ca procent din creșterea absolută până la nivelul de bază în comparație cu care se calculează creșterea absolută. De aici concluzia că există o relație între indicatorii ratei de creștere și rata de creștere. Dacă nivelurile unui număr de dinamici sunt în scădere (descrescătoare), atunci indicatorii ratei de creștere au, respectiv, un „-” semn și cu semnul „+”, dacă nivelurile cresc. Astfel, rata de creștere caracterizează creșterea sau scăderea relativă a nivelului fenomenului.
Indicatorul valorii absolute a creșterii de 1% (A%) este determinat ca coeficientul împărțirii creșterii absolute la rata de creștere (pentru perioada corespunzătoare) A% =? Y: Tn (%).

Valoarea absolută a creșterii de 1% este egală cu o sutime din nivelul anterior. Este ușor de observat că calculul valorii absolute a câștigului de 1% are sens numai pentru câștigurile în lanț și ratele de creștere.
Pentru creșterea de bază, creșterile acumulate cu același nivel inițial și, prin urmare, pentru toate creșterile, aceeași valoare de 1% din creșterea va scădea.


9)) Metode de netezire a seriilor cronologice

Există mai multe metode de procesare a seriilor temporale și anume: metoda de consolidare a intervalelor, metoda mediei mobile și alinierea analitică. În toate metodele, în locul nivelurilor efective, la procesarea seriei, se calculează alte niveluri, în care într-un fel sau altul efectul factorilor aleatori este anulat și astfel fluctuațiile nivelului sunt reduse. Ca rezultat, acestea din urmă devin, așa cum ar fi, „aliniate”, „netezite” în raport cu datele reale originale. Astfel de tehnici de procesare se numesc netezirea sau aplatizarea seriilor temporale.

Ministerul Educației al Federației Ruse

Institutul financiar și economic de corespondență în toată Rusia

Ramură Yaroslavl

Departamentul de Statistică

Munca cursului

după disciplină:

"Statistici"

sarcina numărul 19

Student: Kurashova Anastasia Yurievna

Specialitatea „Finanțe și credite”

3 curs, periferie

Șef: V.P.Sergeev

Yaroslavl, 2002

Plan

1. Introducere ………………………………………………………… 3 p.

2. Partea teoretică ……………………………………………… 4 p.

2.1 Concepte de bază despre seria dinamicii ………………………… ... 4 p.

2.2 Metode de netezire și aliniere a seriilor temporale ……………………………………………………………… .6 p.

2.2.1 Metode de „netezire mecanică” ……………………… 6 p.

2.2.2 Metode de aliniere „analitică” …………………. 8 pp.

3. Partea calculată …………………………………………………… 11 p.

4. Partea analitică ……………………………………………. .16 pp.

5. Concluzie ………………………………………………………. Pagina 25

6. Referințe ……………………………………………… 26 pagini.

7. Anexe ………………………………………………………. 27 pagini

Introducere

Informațiile statistice complete și fiabile reprezintă baza necesară pe care se bazează procesul de management economic. Toate informațiile cu semnificație economică națională sunt procesate și analizate în cele din urmă folosind statistici.

Datele statistice fac posibilă determinarea volumului produsului intern brut și a venitului național, identificarea principalelor tendințe în dezvoltarea sectoarelor economice, evaluarea nivelului inflației, analizarea stării piețelor financiare și a mărfurilor, studierea nivelul de trai al populației și alte fenomene și procese socio-economice.

Stăpânirea metodologiei statistice este una dintre condițiile pentru înțelegerea situației pieței, studierea tendințelor și prognozarea, luarea deciziilor optime la toate nivelurile de activitate.

Etapa finală, analitică a cercetării este dificilă, laborioasă și responsabilă. În această etapă se calculează indicatorii medii și indicatorii de distribuție, se analizează structura populației, se investighează dinamica și relația dintre fenomenele și procesele studiate.

În toate etapele studiului, statisticile folosesc metode diferite. Metodele statistice sunt tehnici și metode speciale pentru studierea fenomenelor sociale de masă.

I. Partea teoretică.

1.1 De bază P Concepte despre rândurile dinamicii.

Rânduri de dinamică- date statistice care reflectă dezvoltarea în timp a fenomenului studiat. Se mai numesc serii de timp, serii de timp.

Fiecare rând de difuzoare are două elemente principale:

1) indicator al timpului t;

2) nivelurile corespunzătoare de dezvoltare a fenomenului studiat y;

Citirile de timp din seria dinamicii sunt fie anumite date (momente), fie perioade separate (ani, trimestre, luni, zile).

Nivelurile seriei de dinamici reflectă o evaluare cantitativă (măsură) a dezvoltării fenomenului studiat în timp. Ele pot fi exprimate ca valori absolute, relative sau medii.

Seria dinamicii diferă în funcție de următoarele caracteristici:

1) După timp. În funcție de natura fenomenului studiat, nivelurile seriei de dinamici se pot referi fie la anumite date (puncte) în timp, fie la perioade separate. În conformitate cu aceasta, seria dinamicii este împărțită în moment și interval.

Seria momentană de dinamică reflectă starea fenomenelor studiate la anumite date (momente) din timp. Un exemplu al unei serii momentane de dinamici sunt următoarele informații despre numărul de angajați ai magazinului din 1991 (tab. 1):

tabelul 1

Numărul listat de angajați ai magazinului în 1991

O caracteristică a seriei momentane de dinamică este că nivelurile sale pot include aceleași unități ale populației studiate. Deși există intervale în seria momentelor - intervale între datele adiacente din serie - valoarea unui anumit nivel nu depinde de durata perioadei dintre două date. Deci, partea principală a personalului magazinului, care alcătuiește salariul începând cu 01.01.1991 și continuă să lucreze în acest an, este afișată în nivelurile perioadelor următoare. Prin urmare, la însumarea nivelurilor seriei de momente, poate apărea numărarea repetată.

Prin intermediul unor serii momentane de dinamică în comerț, stocuri de mărfuri, starea personalului, numărul de echipamente și alți indicatori care reflectă starea fenomenelor studiate pentru date (momente) individuale de timp sunt studiate.

Seriile de intervale de dinamică reflectă rezultatele dezvoltării (funcționării) fenomenelor studiate pentru anumite perioade (intervale) de timp.

Un exemplu de serie de intervale îl constituie datele privind cifra de afaceri cu amănuntul a unui magazin din 1987 - 1991. (tab. 2):

masa 2

Volumul cifrei de afaceri cu amănuntul a magazinului în 1987 - 1991

Cifra de afaceri cu amănuntul, mii de ruble

Fiecare nivel al unei serii de intervale este deja o sumă de niveluri pentru perioade mai scurte de timp. În acest caz, o unitate a agregatului care face parte dintr-un nivel nu face parte din alte niveluri.

O caracteristică a seriei de intervale de dinamică este că fiecare dintre nivelurile sale este compus din date pentru intervale mai scurte (sub-perioade) de timp. De exemplu, însumând cifra de afaceri pentru primele trei luni ale anului, obținem volumul pentru primul trimestru și însumând cifra de afaceri pentru patru trimestre, obținem valoarea sa pentru anul etc. Toate celelalte lucruri fiind egale, nivelul seriei de intervale este cu atât mai mare, cu cât este mai lungă intervalul de care aparține acest nivel.

Proprietatea de a însuma nivelurile pentru intervale de timp succesive face posibilă obținerea seriei de dinamici a perioadelor mai extinse.

Prin intermediul seriilor de intervale de dinamică în comerț, se studiază modificările în momentul primirii și vânzării mărfurilor, valoarea costurilor de distribuție și alți indicatori care reflectă rezultatele funcționării fenomenului studiat pentru anumite perioade.

Structura unui număr de dinamici:

Orice număr de dinamici poate fi reprezentat teoretic sub formă de componente:

1) tendință - tendința principală în dezvoltarea unei serii temporale (spre o creștere sau scădere a nivelurilor sale);

2) ciclice (fluctuații periodice, inclusiv sezoniere);

fluctuații aleatorii.

1. 2. Metode de netezire și aliniere a seriilor cronologice.

Eliminarea fluctuațiilor aleatorii ale valorilor nivelurilor seriei se realizează prin găsirea valorilor „medii”. Metodele de eliminare a factorilor aleatori sunt împărțite în încă două grupuri:

1. Metode de netezire „mecanică” a fluctuațiilor prin medierea valorilor seriei în raport cu alte niveluri adiacente ale seriei.

2. Metode de aliniere „analitică”, adică determinarea mai întâi a expresiei funcționale a tendinței seriei și apoi a valorilor noi, calculate ale seriei.

1.2. 1 Metode anti-aliasing mecanice .

Acestea includ:

dar. Metoda de calculare a mediei peste două jumătăți ale seriei când rândul este împărțit în două părți. Apoi, se calculează două valori ale nivelurilor medii ale seriei, prin care se determină grafic tendința seriei. Evident, o astfel de tendință nu reflectă pe deplin regularitatea principală a dezvoltării fenomenului.

b. Metoda de grosiere a intervalului, la care se face o creștere a lungimii intervalelor de timp și se calculează noi valori ale nivelurilor seriei.

în. Metoda medie mobilă... Această metodă este utilizată pentru a caracteriza tendința de dezvoltare a populației statistice studiate și se bazează pe calcularea nivelurilor medii ale seriei pentru o anumită perioadă. Secvența pentru determinarea mediei mobile:

Setați intervalul de netezire sau numărul de niveluri incluse în acesta. Dacă se iau în considerare trei niveluri la calcularea mediei, media mobilă se numește trei termeni, cinci niveluri - cinci termeni etc. Dacă fluctuațiile mici, neregulate ale nivelurilor dintr-o serie de dinamici sunt netezite, atunci intervalul (numărul mediei mobile) este crescut. Dacă valurile ar trebui păstrate, numărul termenilor este redus.

Calculați primul nivel mediu prin aritmetică simplă:

y1 = Sy1 / m, unde

y1 - I-lea nivel al rândului;

m este calitatea de membru al mediei mobile.

Primul nivel este eliminat, iar nivelul care urmează ultimului nivel care participă la primul calcul este inclus în calculul mediei. Procesul continuă până când ultimul nivel al seriei studiate de dinamică y n este inclus în calculul lui y.

O serie de dinamici, construite de la nivelurile medii, relevă tendința generală de dezvoltare a fenomenului.

Latura negativă a utilizării metodei mediei mobile este formarea de schimbări ale fluctuațiilor nivelurilor seriei, datorită „alunecării” intervalelor de consolidare. Netezirea medie mobilă poate duce la oscilații „inverse” atunci când o „undă” convexă este înlocuită cu una concavă.

Subiect: Linii dinamice de netezire

Ca urmare a influențelor aleatorii ale factorilor și a variabilității nivelurilor unui număr de dinamici în timp, este dificil să se identifice tendința generală în dezvoltarea fenomenului, adică să se detecteze tendința.

Pentru a reduce influența fluctuațiilor temporare, o serie de dinamici sunt netezite pentru a identifica tendința principală.

Metodele de analiză a tendinței principale din seria dinamicii sunt împărțite în 2 grupe:

netezirea sau alinierea mecanică a membrilor individuali ai unei serii de dinamici folosind valorile efective ale nivelurilor adiacente

alinierea utilizând o curbă trasată de m / y la niveluri specifice, adică astfel încât să exprime tendința seriei și să o elibereze de fluctuații nesemnificative

Identificarea unei tendințe este necesară pentru a prezice dezvoltarea fenomenelor în timp.

Prognoza este o evaluare a viitorului bazată pe o analiză aprofundată a tendințelor în dezvoltarea fenomenelor socio-economice și a interacțiunii acestora.

Procesul de prognoză implică identificarea posibilelor alternative de dezvoltare pentru alegerea în cunoștință de cauză și luarea deciziilor optime

Metode de identificare și analiză a tendințelor la nivelul seriei dinamo

Metoda de consolidare a intervalelor este o consolidare a perioadei de timp căreia îi aparțin nivelurile seriei

Metoda simplă medie mobilă. Nivelul mediu al seriei se calculează din numărul primelor în ordinea nivelurilor seriei, apoi media aceluiași număr de niveluri începând de la al doilea, apoi de la al treilea nivel etc. Dacă numărul nivelurilor luate pentru calcularea mediei este impar, media se înregistrează la nivelul situat în mijloc. Dacă numărul de niveluri este par, atunci media se va referi la intervalul m / a cu intervalele medii. Pentru a elimina această schimbare, se utilizează o metodă de centrare.

Centrarea se referă la găsirea mediei a 2 medii mobile adiacente. Dezavantajul acestei metode este că numărul dinamicii este redus de ambele părți.

Alinierea analitică implică reprezentarea nivelului unei serii ca funcție temporală

Pentru a afișa tendința principală în dezvoltarea unui fenomen în timp, sunt utilizate următoarele funcții:

Ø Polinomii de grad

Ø Expozanți

Ø Curbele logistice

Polinomiale

a 0,1,2,3, n - parametrii polinoamelor

În practica statistică, parametrii polinoamelor de grad scăzut au uneori o interpretare specifică a caracteristicilor unei serii de dinamici.

un 1 este interpretat ca o caracteristică a condițiilor medii ale unei serii de dinamici. și 1,2,3 ca o schimbare a accelerației.

În statistici, a fost elaborată o regulă pentru alegerea gradului polinomului modelului de dezvoltare, pe baza determinării valorilor diferențelor finite în nivelurile seriei. Conform regulii:

Polinomul de gradul I (linie dreaptă) este folosit ca model al unei astfel de serii de dinamici, unde primele diferențe (trepte absolute) sunt constante.

Gradul Polinom II este utilizat pentru o serie de dinamici negative cu diferențe constante 2 (accelerații)

Polinomul de grad W este utilizat pentru o serie de dinamici cu diferențe constante 3 (rate de creștere)

După alegerea tipului de ecuație, este necesar să se determine parametrii ecuației. Cel mai comun mod de a determina parametrii unei ecuații este metoda celor mai mici pătrate. Conform acestei metode, este necesar să se compună un sistem de ecuații normale

polinom de gradul I

În procesarea manuală, pentru a simplifica numărarea la alinierea unei serii de timp, simbolul pentru punctele de timp t poate fi introdus astfel încât suma t = 0 (St = 0)

Când este aliniat cu o parabolă de ordinul 2, dacă St = 0, atunci sistemul are următoarea formă:

Alinierea prin formule analitice poate fi utilizată la prezicerea indicatorilor individuali prin extrapolarea unei serii - găsirea nivelurilor în afara seriei date. La prezicerea fenomenelor socio-economice, utilizarea polinoamelor de grad înalt este dificilă, deoarece:

Este necesară luarea în considerare a mai multor parametri factoriali

Este necesară o serie lungă de indicatori ai perioadelor trecute (cel puțin 20), caracterizați prin aceleași caracteristici ale factorilor. Colectarea acestor informații primare este posibilă numai într-o economie stabilă pe o perioadă lungă de timp. În același timp, există o mare probabilitate ca valorile teoretice calculate ale indicatorilor de prognoză să nu corespundă cu cele practice, prin urmare, polinoamele de grad înalt pot fi utilizate numai pentru prognozele pe termen scurt.

Un polinom de gradul II sugerează prezența unei inversări a tendinței, deoarece grafic este reprezentată printr-o parabolă.