Pogoji za sklenitev pogodbe o socialnem delu. Socialna pogodba o zaposlitvi: kje dobiti, kako skleniti in kakšne pravice daje? Navodila po korakih za pridobitev

Prebivalstvo- niz enot, ki imajo množični značaj, tipičnost, kvalitativno enotnost in prisotnost variacije.

Statistično populacijo sestavljajo materialno obstoječi objekti (zaposleni, podjetja, države, regije), je objekt.

Prebivalska enota- vsaka posebna enota statistična populacija.

Ena in ista statistična populacija je lahko po eni lastnosti homogena, po drugi pa heterogena.

Kvalitativna enotnost- podobnost vseh enot populacije za katero koli lastnost in različnost za vse ostale.

V statistični populaciji so razlike med eno in drugo enoto populacije pogosteje kvantitativne narave. Kvantitativne spremembe značilnih vrednosti različne enote zbirke imenujemo variacije.

Različica funkcije — kvantitativna sprememba lastnost (za kvantitativno lastnost) pri prehodu iz ene enote populacije v drugo.

znak je lastnina funkcija ali druga značilnost enot, predmetov in pojavov, ki jih je mogoče opazovati ali izmeriti. Znake delimo na kvantitativne in kvalitativne. Raznolikost in variabilnost vrednosti lastnosti v posameznih enotah populacije imenujemo variacija.

Atributne (kvalitativne) lastnosti niso merljive (sestava prebivalstva po spolu). Kvantitativne lastnosti imajo številčni izraz (sestava prebivalstva po starosti).

Kazalo- to je posplošujoča kvantitativno kvalitativna značilnost katerekoli lastnosti enot ali agregatov za namen posebne pogoječas in kraj.

Scorecard je niz kazalnikov, ki celovito odražajo preučevani pojav.

Na primer, upoštevajte plačo:

Znak - plače
Statistična populacija - vsi zaposleni
Enota populacije je vsak delavec
Kvalitativna homogenost - obračunana plača
Variacija funkcije - niz številk

Splošna populacija in vzorec iz nje

Osnova je niz podatkov, ki jih dobimo kot rezultat merjenja ene ali več lastnosti. Resnično opazovan niz predmetov, statistično predstavljen z nizom opazovanj naključna spremenljivka, je vzorčenje, in hipotetično obstoječe (premišljeno) - splošna populacija. Splošna populacija je lahko končna (število opazovanj N = konst) ali neskončno ( N = ∞), vzorec iz splošne populacije pa je vedno rezultat omejenega števila opazovanj. Število opazovanj, ki sestavljajo vzorec, se imenuje Velikost vzorca. Če je vzorec dovolj velik n→∞) upošteva se vzorec velik, drugače se imenuje vzorec omejena prostornina. Vzorec se upošteva majhna, če pri merjenju enodimenzionalne naključne spremenljivke velikost vzorca ne presega 30 ( n<= 30 ), in pri hkratnem merjenju več ( k) lastnosti v večdimenzionalnem prostoru n do k manj kot 10 (n/k< 10) . Vzorčni obrazci variacijske seriječe so njegovi člani statistika naročil, tj. vzorčne vrednosti naključne spremenljivke X so razvrščeni v naraščajočem vrstnem redu (uvrščeni), se kličejo vrednosti atributa opcije.

Primer. Skoraj enako naključno izbrano skupino objektov - komercialnih bank enega upravnega okrožja Moskve, lahko obravnavamo kot vzorec splošne populacije vseh komercialnih bank v tem okrožju in kot vzorec splošne populacije vseh komercialnih bank v Moskvi. , pa tudi vzorec poslovnih bank v državi itd.

Osnovne metode vzorčenja

Zanesljivost statističnih zaključkov in smiselna interpretacija rezultatov je odvisna od reprezentativnost vzorcev, tj. popolnost in ustreznost prikaza lastnosti splošne populacije, glede na katere se ta vzorec lahko šteje za reprezentativnega. Preučevanje statističnih lastnosti populacije lahko organiziramo na dva načina: z uporabo neprekinjeno in diskontinuirano. Neprekinjeno opazovanje vključuje pregled vseh enoteštudiral agregati, a nekontinuirano (selektivno) opazovanje- samo delno.

Obstaja pet glavnih načinov za organizacijo vzorčenja:

1. preprosta naključna izbira, pri katerem so predmeti naključno izbrani iz splošne populacije objektov (na primer z uporabo tabele ali generatorja naključnih števil), vsak od možnih vzorcev pa ima enako verjetnost. Takšni vzorci se imenujejo pravzaprav naključno;

2. enostavna izbira po rednem postopku se izvaja z mehansko komponento (na primer datumi, dnevi v tednu, številke stanovanj, črke abecede itd.) in tako pridobljene vzorce imenujemo mehanski;

3. stratificiran selekcija je sestavljena iz dejstva, da je splošna populacija obsega razdeljena na podskupine ali plasti (stratume) obsega, tako da . Stratumi so homogeni objekti glede na statistične značilnosti (npr. prebivalstvo je razdeljeno na stratume po starostni skupini ali družbenem razredu; podjetja po panogah). V tem primeru se kličejo vzorci stratificiran(sicer, stratificiran, tipičen, coniran);

4. metode serijski izbor se uporabljajo za oblikovanje serijski oz ugnezdeni vzorci. Primerni so, če je treba hkrati pregledati "blok" ali vrsto predmetov (na primer pošiljko blaga, izdelke določene serije ali prebivalstvo v teritorialno-upravni delitvi države). Izbor serij je lahko naključen ali mehanski. Hkrati se izvaja neprekinjen pregled določene serije blaga ali celotne teritorialne enote (stanovanjske stavbe ali četrti);

5. kombinirano(stopenjska) selekcija lahko združuje več selekcijskih metod hkrati (na primer stratificirano in naključno ali naključno in mehansko); tak vzorec imenujemo kombinirano.

Vrste izbire

Avtor: um obstajajo individualni, skupinski in kombinirani izbor. pri individualni izbor v vzorčni niz so izbrane posamezne enote splošne populacije, s izbor skupine so kvalitativno homogene skupine (serije) enot in kombinirani izbor vključuje kombinacijo prve in druge vrste.

Avtor: metoda izbor razlikovati ponavljajoče se in neponavljajoče vzorec.

Neponovljivo imenovana selekcija, pri kateri se enota, ki je padla v vzorec, ne vrne v prvotno populacijo in ne sodeluje pri nadaljnji selekciji; medtem ko število enot splošne populacije n med izbirnim postopkom. pri ponovljeno izbor ujeti v vzorcu se enota po registraciji vrne v splošno populacijo in tako obdrži enakovredno možnost, da se skupaj z drugimi enotami uporabi v nadaljnjem izbirnem postopku; medtem ko število enot splošne populacije n ostaja nespremenjena (metoda se redko uporablja v socioekonomskih študijah). Vendar pa z velikim N (N → ∞) formule za neponovljeno izbor so blizu tistim za ponovljeno izbor in slednje se uporabljajo skoraj pogosteje ( N = konst).

Glavne značilnosti parametrov generalne in vzorčne populacije

Osnova statističnih zaključkov študije je porazdelitev naključne spremenljivke, medtem ko opazovane vrednosti (x 1, x 2, ..., x n) imenujemo realizacije naključne spremenljivke X(n je velikost vzorca). Porazdelitev naključne spremenljivke v splošni populaciji je teoretična, idealne narave, njen vzorčni analog pa je empirično distribucija. Nekatere teoretične porazdelitve so podane analitično, tj. njim opcije določi vrednost porazdelitvene funkcije na vsaki točki v prostoru možnih vrednosti naključne spremenljivke. Zato je za vzorec težko in včasih nemogoče določiti porazdelitveno funkcijo opcije se ocenijo iz empiričnih podatkov, nato pa se nadomestijo v analitični izraz, ki opisuje teoretično porazdelitev. V tem primeru je predpostavka (oz hipoteza) o vrsti porazdelitve je lahko statistično pravilna ali napačna. V vsakem primeru pa empirična porazdelitev, rekonstruirana iz vzorca, le približno označuje pravo. Najpomembnejši parametri distribucije so pričakovana vrednost in disperzija.

Po svoji naravi so distribucije neprekinjeno in diskretna. Najbolj znana zvezna porazdelitev je normalno. Selektivni analogi parametrov in zanj so: srednja vrednost in empirična varianca. Med diskretnimi v socialno-ekonomskih študijah se najpogosteje uporablja alternativni (dihotomni) distribucija. Parameter pričakovanja te porazdelitve izraža relativno vrednost (oz deliti) enote populacije, ki imajo preučevano značilnost (označeno s črko ); delež populacije, ki te lastnosti nima, je označen s črko q (q = 1 - p). Varianca alternativne porazdelitve ima tudi empirično analogijo.

Glede na vrsto porazdelitve in način izbire populacijskih enot se značilnosti parametrov porazdelitve izračunavajo različno. Glavne za teoretične in empirične porazdelitve so podane v tabeli. 9.1.

Vzorčni delež k n je razmerje med številom enot vzorčne populacije in številom enot generalne populacije:

k n = n/N.

Vzorčni delež w je razmerje enot, ki imajo preučevano lastnost x na velikost vzorca n:

w = n n / n.

Primer. V seriji blaga, ki vsebuje 1000 enot, s 5% vzorcem frakcija vzorca k n v absolutni vrednosti je 50 enot. (n = N*0,05); če sta v tem vzorcu najdena 2 izdelka z napako, potem frakcija vzorca w bo 0,04 (w = 2/50 = 0,04 ali 4 %).

Ker se vzorčna populacija razlikuje od splošne populacije, obstajajo vzorčne napake.

Tabela 9.1 Glavni parametri generalne in vzorčne populacije

Napake vzorčenja

Pri kateri koli (trdni in selektivni) lahko pride do napak dveh vrst: registracije in reprezentativnosti. Napake registracija lahko ima naključen in sistematično značaj. Naključen napake so sestavljene iz številnih različnih neobvladljivih vzrokov, so nenamerne narave in se običajno med seboj uravnotežijo (na primer spremembe odčitkov instrumentov zaradi temperaturnih nihanj v prostoru).

Sistematično napake so pristranske, saj kršijo pravila izbire objektov v vzorcu (npr. odstopanja v meritvah pri spreminjanju nastavitev merilne naprave).

Primer. Za oceno socialnega statusa prebivalstva v mestu je načrtovano pregledati 25% družin. Če pa bi izbor vsakega četrtega stanovanja temeljil na njegovem številu, potem obstaja nevarnost, da bi izbrali vsa stanovanja samo enega tipa (npr. enosobna stanovanja), kar bi povzročilo sistematsko napako in popačilo rezultate; izbira številke stanovanja z žrebom je bolj zaželena, saj bo napaka naključna.

Napake reprezentativnosti neločljivo povezani le s selektivnim opazovanjem, se jim ni mogoče izogniti in nastanejo kot posledica dejstva, da vzorec ne reproducira v celoti splošnega. Vrednosti kazalnikov, pridobljenih iz vzorca, se razlikujejo od kazalnikov enakih vrednosti v splošni populaciji (ali pridobljenih med stalnim opazovanjem).

Napaka vzorčenja je razlika med vrednostjo parametra v splošni populaciji in njeno vzorčno vrednostjo. Za povprečno vrednost kvantitativnega atributa je enako: , za delež (alternativni atribut) pa - .

Vzorčne napake so neločljivo povezane samo z vzorčnimi opazovanji. Večje kot so te napake, bolj se empirična porazdelitev razlikuje od teoretične. Parametri empirične porazdelitve in so naključne spremenljivke, zato so napake vzorčenja tudi naključne spremenljivke, lahko imajo različne vrednosti za različne vzorce, zato je običajno izračunati povprečna napaka.

Povprečna napaka vzorčenja je vrednost, ki izraža standardni odklon vzorčne sredine od matematičnega pričakovanja. Ta vrednost, ob upoštevanju načela naključnega izbora, je odvisna predvsem od velikosti vzorca in od stopnje variacije lastnosti: večja in manjša ko je variacija lastnosti (torej vrednost ), manjša je vrednost povprečna napaka vzorčenja. Razmerje med variancami generalne in vzorčne populacije je izraženo s formulo:

tiste. za dovolj velike lahko domnevamo, da . Povprečna vzorčna napaka prikazuje možna odstopanja parametra vzorčne populacije od parametra generalne populacije. V tabeli. 9.2 prikazuje izraze za izračun povprečne vzorčne napake za različne metode organiziranja opazovanja.

Tabela 9.2 Povprečna napaka (m) vzorčnega povprečja in deleža za različne vrste vzorcev

Kje je povprečje varianc vzorca znotraj skupine za neprekinjeno značilnost;

Povprečje razpršitev deleža znotraj skupine;

— število izbranih serij, — skupno število serij;

kjer je povprečje te serije;

- splošno povprečje v celotnem vzorcu za neprekinjeno značilnost;

kjer je delež lastnosti v th seriji;

— skupni delež lastnosti v celotnem vzorcu.

Vendar pa je velikost povprečne napake mogoče oceniti le z določeno verjetnostjo Р (Р ≤ 1). Ljapunov A.M. dokazal, da se porazdelitev vzorčnih povprečij in s tem njihovih odstopanj od splošnega povprečja z dovolj velikim številom približno drži normalnega zakona porazdelitve, pod pogojem, da ima splošna populacija končno povprečje in omejeno varianco.

Matematično je ta izjava za srednjo vrednost izražena kot:

in za ulomek bo izraz (1) imel obliko:

kje - tukaj je mejna napaka vzorčenja, ki je večkratnik povprečne napake vzorčenja , in faktor večkratnosti je Studentov kriterij ("faktor zaupanja"), ki ga je predlagal W.S. Gosset (psevdonim "Študent"); vrednosti za različne velikosti vzorcev so shranjene v posebni tabeli.

Vrednosti funkcije Ф(t) za nekatere vrednosti t so:

Zato lahko izraz (3) beremo takole: z verjetnostjo P = 0,683 (68,3 %) lahko trdimo, da razlika med vzorčno in splošno sredino ne bo presegla ene vrednosti srednje napake m(t=1), z verjetnostjo P = 0,954 (95,4 %)— da ne presega vrednosti dveh srednjih napak m (t = 2), z verjetnostjo P = 0,997 (99,7 %)- ne bo presegla treh vrednosti m (t = 3) . Tako je določena verjetnost, da bo ta razlika presegla trikratno vrednost srednje napake stopnjo napake in ni več kot 0,3% .

V tabeli. 9.3 so podane formule za izračun mejne vzorčne napake.

Tabela 9.3 Mejna napaka vzorčenja (D) za povprečje in delež (p) za različne vrste vzorčenja

Razširitev vzorčnih rezultatov na populacijo

Končni cilj vzorčnega opazovanja je opredelitev splošne populacije. Pri majhnih velikostih vzorcev lahko empirične ocene parametrov ( in ) znatno odstopajo od njihovih resničnih vrednosti ( in ). Zato je treba določiti meje, znotraj katerih so prave vrednosti ( in ) za vzorčne vrednosti parametrov ( in ).

Interval zaupanja nekega parametra θ splošne populacije imenujemo naključni obseg vrednosti tega parametra, ki je z verjetnostjo blizu 1 ( zanesljivost) vsebuje pravo vrednost tega parametra.

mejna napaka vzorcev Δ vam omogoča, da določite mejne vrednosti značilnosti splošne populacije in njihove intervali zaupanja, ki so enake:

Spodnja črta interval zaupanja dobljeno z odštevanjem mejna napaka iz vzorčnega povprečja (delež), zgornjega pa z dodajanjem.

Interval zaupanja za povprečje uporablja mejno vzorčno napako in se za dano stopnjo zaupanja določi s formulo:

To pomeni, da z dano verjetnostjo R, ki se imenuje stopnja zaupanja in je enolično določena z vrednostjo t, lahko trdimo, da je prava vrednost povprečja v območju od , dejanska vrednost delnice pa se giblje v razponu od

Pri izračunu intervala zaupanja za tri standardne stopnje zaupanja P=95 %, P=99 % in P=99,9 % vrednost izbere . Uporaba glede na število prostostnih stopenj. Če je velikost vzorca dovolj velika, potem vrednosti, ki ustrezajo tem verjetnostim t so enaki: 1,96, 2,58 in 3,29 . Tako nam mejna napaka vzorčenja omogoča določitev mejnih vrednosti značilnosti splošne populacije in njihovih intervalov zaupanja:

Porazdelitev rezultatov selektivnega opazovanja na splošno populacijo v socialno-ekonomskih študijah ima svoje značilnosti, saj zahteva popolnost reprezentativnosti vseh njegovih vrst in skupin. Osnova za možnost takšne porazdelitve je izračun relativna napaka:

kje Δ % - relativna mejna vzorčna napaka; , .

Obstajata dve glavni metodi za razširitev vzorčnega opazovanja na populacijo: neposredna pretvorba in metoda koeficientov.

Esenca neposredno pretvorbo je pomnožiti povprečje vzorca!!\overline(x) z velikostjo populacije.

Primer. Naj povprečno število malčkov v mestu ocenimo z vzorčno metodo in znaša na osebo. Če je v mestu 1000 mladih družin, potem število potrebnih mest v občinskem vrtcu dobimo tako, da to povprečje pomnožimo z velikostjo splošne populacije N = 1000, tj. bo 1200 sedežev.

Metoda koeficientov je priporočljivo uporabiti v primeru, ko se izvaja selektivno opazovanje, da se razjasnijo podatki neprekinjenega opazovanja.

Pri tem se uporablja formula:

kjer so vse spremenljivke velikost populacije:

Zahtevana velikost vzorca

Tabela 9.4 Zahtevana velikost vzorca (n) za različne vrste organizacije vzorčenja

Pri načrtovanju vzorčnega raziskovanja z vnaprej določeno vrednostjo dovoljene vzorčne napake je treba pravilno oceniti zahtevano Velikost vzorca. Ta znesek se lahko določi na podlagi dovoljene napake pri selektivnem opazovanju na podlagi podane verjetnosti, ki zagotavlja sprejemljivo stopnjo napake (ob upoštevanju načina organizacije opazovanja). Formule za določitev zahtevane velikosti vzorca n je mogoče zlahka dobiti neposredno iz formul za mejno vzorčno napako. Torej, iz izraza za mejno napako:

velikost vzorca je neposredno določena n:

Ta formula kaže, da z zmanjševanjem mejne napake vzorčenja Δ bistveno poveča zahtevano velikost vzorca, ki je sorazmerna z varianco in kvadratom Studentovega t-testa.

Za določeno metodo organizacije opazovanja se zahtevana velikost vzorca izračuna po formulah v tabeli. 9.4.

Primeri praktičnih izračunov

Primer 1. Izračun srednje vrednosti in intervala zaupanja za zvezno kvantitativno značilnost.

Za oceno hitrosti poravnave z upniki v banki je bil opravljen naključni vzorec 10 plačilnih dokumentov. Njihove vrednosti so se izkazale za enake (v dnevih): 10; 3; petnajst; petnajst; 22; 7; osem; ena; 19; dvajset.

Zahtevano z verjetnostjo P = 0,954 določi mejno napako Δ vzorčno povprečje in meje zaupanja povprečnega časa izračuna.

rešitev. Povprečno vrednost izračunamo po formuli iz tabele. 9.1 za vzorčno populacijo

Disperzijo izračunamo po formuli iz tabele. 9.1.

Povprečna kvadratna napaka dneva.

Napaka povprečja se izračuna po formuli:

tiste. srednja vrednost je x ± m = 12,0 ± 2,3 dni.

Zanesljivost povprečja je bila

Omejitveni pogrešek se izračuna po formuli iz tabele. 9.3 za ponovno izbiro, ker velikost populacije ni znana, in za P = 0,954 stopnja zaupanja.

Tako je srednja vrednost `x ± D = `x ± 2m = 12,0 ± 4,6, tj. njegova prava vrednost je v razponu od 7,4 do 16,6 dni.

Uporaba študentove tabele. Aplikacija nam omogoča sklep, da je za n = 10 - 1 = 9 prostostnih stopinj dobljena vrednost zanesljiva s stopnjo pomembnosti a £ 0,001, tj. dobljena srednja vrednost se znatno razlikuje od 0.

Primer 2. Ocena verjetnosti (generalni delež) r.

Z mehansko vzorčno metodo raziskovanja socialnega položaja 1000 družin je bilo ugotovljeno, da je delež družin z nizkimi dohodki. w = 0,3 (30 %)(vzorec je bil 2% , tj. n/N = 0,02). Zahtevano s stopnjo zaupanja p = 0,997 določite indikator R družine z nizkimi dohodki po vsej regiji.

rešitev. Glede na predstavljene vrednosti funkcije Ф(t) najti za določeno stopnjo zaupanja P = 0,997 pomen t=3(glej formulo 3). Napaka mejnega deleža w določite s formulo iz tabele. 9.3 za neponavljajoče se vzorčenje (mehansko vzorčenje se vedno ne ponavlja):

Omejitev relativne napake vzorčenja v % bo:

Verjetnost (splošni delež) družin z nizkimi dohodki v regiji bo p=w±Δw, meje zaupanja p pa se izračunajo na podlagi dvojne neenakosti:

w — Δw ≤ p ≤ w — Δw, tj. prava vrednost p je znotraj:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Tako lahko z verjetnostjo 0,997 trdimo, da se delež družin z nizkimi dohodki med vsemi družinami v regiji giblje od 28,6 % do 31,4 %.

Primer 3 Izračun srednje vrednosti in intervala zaupanja za diskretno značilnost, določeno z nizom intervalov.

V tabeli. 9.5. Nastavljena je porazdelitev aplikacij za izdelavo naročil glede na čas njihove izvedbe s strani podjetja.

Tabela 9.5 Porazdelitev opazovanj po času nastanka

rešitev. Povprečni čas dokončanja naročila se izračuna po formuli:

Povprečni čas bo:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 meseca

Enak odgovor dobimo, če uporabimo podatke o p i iz predzadnjega stolpca tabele. 9.5 z uporabo formule:

Upoštevajte, da se sredina intervala za zadnjo gradacijo najde tako, da se umetno dopolni s širino intervala prejšnje gradacije, ki je enaka 60 - 36 = 24 mesecev.

Disperzija se izračuna po formuli

kje x i- sredina intervalne serije.

Zato!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) in standardna napaka je .

Napaka povprečja se izračuna po formuli za mesece, tj. povprečje je!!\overline(x) ± m = 23,1 ± 13,4.

Omejitveni pogrešek se izračuna po formuli iz tabele. 9,3 za ponovno izbiro, ker velikost populacije ni znana, za stopnjo zaupanja 0,954:

Torej je povprečje:

tiste. njegova prava vrednost se giblje v razponu od 0 do 50 mesecev.

Primer 4 Za določitev hitrosti poravnave z upniki N = 500 podjetij družbe v komercialni banki je treba izvesti selektivno študijo z metodo naključnega neponovljivega izbora. Določite zahtevano velikost vzorca n tako, da z verjetnostjo P = 0,954 napaka povprečja vzorca ne preseže 3 dni, če so ocene poskusa pokazale, da je bil standardni odklon s 10 dni.

rešitev. Za določitev števila potrebnih študij n uporabimo formulo za neponovljiv izbor iz tabele. 9.4:

V njem je vrednost t določena iz za stopnjo zaupanja Р = 0,954. Enako je 2. Srednja kvadratna vrednost s = 10, velikost populacije N = 500 in mejna napaka povprečja Δ x = 3. Če nadomestimo te vrednosti v formulo, dobimo:

tiste. dovolj je narediti vzorec 41 podjetij, da se oceni zahtevani parameter - hitrost poravnave z upniki.

100 r bonus za prvo naročilo

Izberite vrsto dela Diplomsko delo Seminarsko delo Izvleček Magistrsko delo Poročilo o praksi Članek Poročilo Pregled Testno delo Monografija Reševanje problemov Poslovni načrt Odgovori na vprašanja Ustvarjalno delo Esej Risanje Sestavki Prevod Predstavitve Tipkanje Drugo Povečanje unikatnosti besedila Kandidatsko delo Laboratorijsko delo Pomoč na- linija

Vprašajte za ceno

Splošna populacija je celotna statistična zbirka predmetov in / ali pojavov družbenega življenja, preučenih z metodo vzorčenja, ki imajo skupne kvalitativne lastnosti ali kvantitativne spremenljivke.

Skupno število objektov opazovanja (ljudi, gospodinjstev, podjetij, naselij itd.) z določenim naborom značilnosti (spol, starost, dohodek, število, promet itd.), omejenih v prostoru in času. Primeri populacij:
- Vsi prebivalci Moskve (10,6 milijona ljudi po popisu leta 2002)
- Moskovčani (4,9 milijona ljudi po popisu leta 2002)
- Pravne osebe Rusije (2,2 milijona v začetku leta 2005)
- Maloprodaja živilskih izdelkov (20 tisoč v začetku leta 2008) itd.

Pravilna definicija G.S. in njegove značilnosti so izjemno pomembne za izbiro raziskovalnega načrta – strategije za konstruiranje reprezentativnega vzorca ( cm.). Najpomembnejše značilnosti G.S. sta njegov obseg in razpoložljivost elementov, ki jih je treba opredeliti.

Z vidika prostornine je običajno izločiti končno in neskončno G.S. Ta delitev je povsem tehnična, nastane zaradi posebnosti postopkov ocenjevanja obsega in napak reprezentativnega verjetnostnega (naključnega) vzorca. Za končne se štejejo G.S., katerih število je primerljivo velikosti vzorca. Če velikost vzorca presega nekaj odstotkov populacije F.S., je treba napako vzorčenja oceniti s prilagoditvijo za velikost F.S.

Imenujemo neskončne G.S., katerih prostornina je v primerjavi z prostornino reprezentativnega naključnega vzorca nesorazmerno velika. Strogo gledano, vsi G.S. v družboslovju končni (tudi če jih je več milijard), v praksi pa G.S. se lahko šteje za neskončno, če velikost vzorca, ki zagotavlja sprejemljivo stopnjo napake, ne presega 1-2% njegovega števila. Včasih je koncept neskončnosti neposredno povezan z obsegom G.S., na primer več kot sto tisoč predmetov.

G.S., katerih pripadnost je očitna ali zlahka ugotovljena, se imenujejo specifične. Za določene G.S. ni težko določiti prostornine in pridobiti razmeroma popoln seznam njihovih elementov - vzorčni okvir (glej sl. Osnova vzorčenja). Na primer, seznam odraslih prebivalcev mesta lahko dobite iz tabele naslovov, sezname študentov v velikem mestu pa lahko dobite na univerzah. Če določen G.S. je zelo velika (na primer število prebivalcev države), je mogoče dobiti sezname za vse njene strukturne dele. Izdelava reprezentativnega vzorca naključnega ( cm.) za določene G.S. tehnično vedno možno; težave lahko nastanejo zaradi pomanjkanja časa, usposobljenega kadra ali materialnih sredstev.

G.S., katerih pripadnost je mogoče ugotoviti le na podlagi ciljnih postopkov ali posebnih študij, se imenujejo hipotetični. Takemu G.S. vključujejo na primer občinstvo QMS (nemogoče je vedeti, ali je oseba videla določeno reklamo, razen če ga o tem vprašate), ljubitelje določenih vrst akvarijskih rib, strokovnjake za ozek problem itd. Za določitev prostornine nekega hipotetičnega G.S. potrebne so tudi posebne študije. Možnost konstruiranja reprezentativnega vzorca naključnih ( cm.) za hipotetičnega G.S. velik obseg je v mnogih primerih problematičen.

POPULACIJSKI PARAMETER- statistični izraz, ki se uporablja za označevanje katere koli kvantitativne značilnosti splošne populacije ( cm.). Pričakovana vrednost ( cm.), varianca ( cm.), verjetnost ( cm.) pozitiven odgovor, korelacijski koeficient med dvema naključnima spremenljivkama ( cm.) so G.S.P. Podobne značilnosti vzorca ( cm.) imenujemo statistika vzorčenja ( cm.).

Vzorec (vzorčna populacija) - niz primerov (predmetov, objektov, dogodkov, vzorcev), z uporabo določenega postopka, izbranih iz splošne populacije za sodelovanje v študiji.
Del predmetov iz populacije, izbranih za študijo, da bi lahko sklepali o celotni populaciji. Da se sklep, pridobljen s preučevanjem vzorca, razširi na celotno populacijo, mora imeti vzorec lastnost reprezentativnosti.

Značilnosti vzorca:

Kvalitativne značilnosti vzorca - koga točno izberemo in kakšne metode konstrukcije vzorca uporabimo za to.

Kvantitativna značilnost vzorca je, koliko primerov izberemo, z drugimi besedami, velikost vzorca.

Velikost vzorca— število primerov, vključenih v vzorec. Zaradi statističnih razlogov je priporočljivo, da je število primerov vsaj 30–35.

Niz homogenih predmetov se pogosto preučuje v povezavi z neko lastnostjo, ki jih označuje, merjeno kvantitativno ali kvalitativno.

Na primer, če obstaja serija delov, je lahko velikost dela po GOST kvantitativni znak, standardnost dela pa je lahko znak kakovosti.

Po potrebi se preveri skladnost s standardi, včasih se zatečejo k popolni raziskavi, vendar se v praksi to redko uporablja. Na primer, če splošna populacija vsebuje ogromno število preučevanih predmetov, potem je praktično nemogoče izvesti kontinuirano raziskavo. V tem primeru se iz celotne populacije izbere določeno število objektov (elementov) in jih pregleda. Tako obstajata splošna in vzorčna populacija.

Splošno ime je celota vseh predmetov, ki so predmet pregleda ali študije. Splošna populacija praviloma vsebuje končno število elementov, če pa je prevelika, se za poenostavitev matematičnih izračunov predpostavlja, da je celotna populacija sestavljena iz neštetega števila predmetov.

Vzorec ali vzorčna populacija je del izbranih elementov iz celotne populacije. Vzorčenje je lahko večkratno ali neponovljivo. V prvem primeru se vrne splošni populaciji, v drugem pa ne. V praksi se pogosteje uporablja neponavljajoča naključna izbira.

Populacija in vzorec morata biti med seboj povezana po reprezentativnosti. Z drugimi besedami, da bi značilnosti vzorčne populacije lahko zanesljivo določale značilnosti celotne populacije, je nujno, da jih elementi vzorca čim bolj natančno predstavljajo. Z drugimi besedami, vzorec mora biti reprezentativen (reprezentativen).

Vzorec bo bolj ali manj reprezentativen, če bo naključno izbran iz zelo velikega števila celotne populacije. To lahko trdimo na podlagi tako imenovanega zakona velikih števil. V tem primeru imajo vsi elementi enako verjetnost, da bodo vključeni v vzorec.

Obstajajo različne možnosti izbire. Vse te metode načeloma lahko razdelimo na dve možnosti:

Možnost 1. Elementi so izbrani, ko populacija ni razdeljena na dele. Ta različica vključuje preproste naključne ponovljene in neponovljene izbire.
Možnost 2. Splošna populacija je razdeljena na dele in izbor elementov je narejen. Ti vključujejo tipične, mehanske in serijske izbire.

Enostavno naključno - izbira, pri kateri se elementi naključno ekstrahirajo enega za drugim iz celotne populacije.

Tipičen je izbor, pri katerem elementi niso izbrani iz celotne populacije, temveč iz vseh njenih "tipičnih" delov.

Mehansko - to je taka izbira, ko je celotna populacija razdeljena na več skupin, ki so enake številu elementov, ki naj bi bili v vzorcu, in v skladu s tem je iz vsake skupine izbran en element. Na primer, če je treba izbrati 25% delov, ki jih izdela stroj, se izbere vsak četrti del, če pa so potrebni 4% delov, se izbere vsak petindvajseti del in tako naprej. Hkrati je treba povedati, da včasih mehanska izbira morda ne bo zadostovala

Serija - to je taka selekcija, pri kateri so elementi izbrani iz celotne populacije v "serijah", podvrženih stalnim raziskavam, in ne enega za drugim. Na primer, ko se deli izdelujejo z velikim številom avtomatskih strojev, se popolna raziskava izvede samo v zvezi z izdelki več strojev. Serijska selekcija se uporablja, če ima preučevana lastnost malo variabilnosti v različnih serijah.

Za zmanjšanje napake se uporabljajo ocene generalne populacije s pomočjo vzorca. Poleg tega je selektivni nadzor lahko enostopenjski in večstopenjski, kar poveča zanesljivost raziskave.

Prebivalstvo (v angleščini - prebivalstvo) - celota vseh predmetov (enot), glede katerih namerava znanstvenik narediti zaključke pri preučevanju določenega problema.

Splošno populacijo sestavljajo vsi predmeti, ki jih preučujemo. Sestava splošne populacije je odvisna od ciljev študije. Včasih je splošna populacija celotno prebivalstvo določene regije (na primer, ko se proučuje razmerje med potencialnimi volivci in kandidatom), najpogosteje je postavljenih več kriterijev, ki določajo predmet proučevanja. Na primer moški, stari od 30 do 50 let, ki vsaj enkrat na teden uporabljajo brivnik določene znamke in imajo dohodek vsaj 100 dolarjev na družinskega člana.

Vzorecoz vzorčni okvir- niz primerov (predmetov, objektov, dogodkov, vzorcev), z uporabo določenega postopka, izbranih iz splošne populacije za sodelovanje v študiji.

Značilnosti vzorca:

· Kvalitativne značilnosti vzorca - koga točno izberemo in kakšne metode konstrukcije vzorca uporabimo za to.

· Kvantitativna značilnost vzorca je, koliko primerov izberemo, z drugimi besedami, velikost vzorca.

Potreba po vzorčenju

· Predmet študija je zelo širok. Na primer, potrošniki izdelkov globalnega podjetja so ogromno geografsko razpršenih trgov.

· Obstaja potreba po zbiranju primarnih informacij.

Velikost vzorca

Velikost vzorca- število primerov, vključenih v vzorec. Zaradi statističnih razlogov je priporočljivo, da je število primerov vsaj 30–35.

Odvisni in neodvisni vzorci

Pri primerjavi dveh (ali več) vzorcev je pomemben parameter njuna odvisnost. Če je mogoče vzpostaviti homomorfni par (to je, ko en primer iz vzorca X ustreza enemu in samo enemu primeru iz vzorca Y in obratno) za vsak primer v dveh vzorcih (in ta osnova razmerja je pomembna za lastnost, izmerjeni v vzorcih), se takšni vzorci imenujejo odvisen. Primeri odvisnih izbir:

· par dvojčkov

· dve meritvi katere koli lastnosti pred in po eksperimentalni izpostavljenosti,

· možje in žene

· itd.

Če takega razmerja med vzorci ni, se upoštevajo ti vzorci neodvisen, na primer:

· moški in ženske,

· psihologi in matematiki.

Skladno s tem so odvisni vzorci vedno enako veliki, velikost neodvisnih vzorcev pa se lahko razlikuje.

Vzorce primerjamo z različnimi statističnimi kriteriji:

· Študentov t-test

· Wilcoxonov test

· Mann-Whitneyjev U test

· Kriterij znakov

· in itd.

Reprezentativnost

Vzorec se lahko šteje za reprezentativnega ali nereprezentativnega.

Primer nereprezentativnega vzorca

V ZDA za enega najbolj znanih zgodovinskih primerov nereprezentativnega vzorčenja velja incident, ki se je zgodil med predsedniškimi volitvami leta 1936. Časopis Litrery Digest, ki je uspešno napovedal dogodke na več prejšnjih volitvah, je napačno ocenil svoje napovedi, tako da je poslal deset milijonov testnih glasovnic svojim naročnikom, pa tudi ljudem, izbranim iz telefonskih imenikov po vsej državi, in ljudem s seznamov avtomobilskih registracij. Na 25 % vrnjenih glasovnic (skoraj 2,5 milijona) so bili glasovi razdeljeni takole:

· 57 % volivcev je dalo prednost republikanskemu kandidatu Alfu Landonu

· 40 % jih je izbralo takratnega demokratskega predsednika Franklina Roosevelta

Kot je znano, je Roosevelt zmagal na dejanskih volitvah z več kot 60% glasov. Napaka Litreary Digest je bila naslednja: da bi povečali reprezentativnost vzorca – ker so vedeli, da se ima večina njihovih naročnikov za republikance – so vzorec razširili z ljudmi, izbranimi iz telefonskih imenikov in registracijskih seznamov. Niso pa upoštevali sodobne realnosti in so v resnici rekrutirali še več republikancev: med veliko depresijo si je telefone in avtomobile lahko privoščil predvsem srednji in višji sloj (torej večina republikancev, ne demokratov).

Vrste načrtov za gradnjo skupin iz vzorcev

Obstaja več glavnih vrst skupinskih gradbenih načrtov:

1. Študija z eksperimentalno in kontrolno skupino, ki sta postavljeni v različne pogoje.

2. Študija z eksperimentalno in kontrolno skupino z uporabo strategije izbire v parih

3. Študija z uporabo samo ene skupine - eksperimentalne.

4. Študija z uporabo mešanega (faktorskega) načrta - vse skupine so postavljene v različne pogoje.

Vzorčne vrste

Vzorci so razdeljeni na dve vrsti:

· verjetnostni

· neverjetnost

Verjetnostni vzorci

1. Preprosto verjetnostno vzorčenje:

oPreprosto ponovno vzorčenje. Uporaba takšnega vzorca temelji na predpostavki, da je za vsakega anketiranca enako verjetno, da bo vključen v vzorec. Na podlagi seznama splošne populacije se sestavijo kartončki s številkami respondentov. Postavijo jih v komplet, premešajo in iz njih naključno vzamejo karto, zapišejo številko in jo vrnejo nazaj. Nadalje postopek ponovimo tolikokrat, kolikor vzorca potrebujemo. Minus: ponavljanje izbirnih enot.

Postopek za izdelavo preprostega naključnega vzorca vključuje naslednje korake:

1. pridobiti morate popoln seznam članov splošne populacije in ta seznam oštevilčiti. Takšen seznam, spomnimo se, imenujemo vzorčni okvir;

2. določiti pričakovano velikost vzorca, to je pričakovano število respondentov;

3. iz tabele naključnih števil izluščimo toliko števil, kolikor potrebujemo vzorčnih enot. Če vzorec vključuje 100 ljudi, se iz tabele vzame 100 naključnih števil. Te naključne številke lahko ustvari računalniški program.

4. iz osnovnega seznama izberi tista opažanja, katerih številke ustrezajo zapisanim naključnim številom

· Preprost naključni vzorec ima očitne prednosti. Ta metoda je zelo enostavna za razumevanje. Rezultate študije je mogoče razširiti na preučevano populacijo. Večina pristopov k statističnemu sklepanju vključuje zbiranje informacij z uporabo preprostega naključnega vzorca. Vendar ima preprosta metoda naključnega vzorčenja vsaj štiri pomembne omejitve:

1. Pogosto je težko ustvariti vzorčni okvir, ki bi omogočal preprost naključni vzorec.

2. Enostaven naključni vzorec lahko povzroči veliko populacijo ali populacijo, porazdeljeno po velikem geografskem območju, kar bistveno poveča čas in stroške zbiranja podatkov.

3. Za rezultate uporabe preprostega naključnega vzorca je pogosto značilna nizka natančnost in večja standardna napaka kot za rezultate uporabe drugih verjetnostnih metod.

4. Zaradi uporabe SRS se lahko oblikuje nereprezentativen vzorec. Čeprav vzorci, dobljeni s preprostim naključnim izborom, v povprečju ustrezno predstavljajo splošno populacijo, nekateri izmed njih izjemno napačno predstavljajo proučevano populacijo. Verjetnost za to je še posebej velika pri majhnem vzorcu.

· Preprosto neponavljajoče se vzorčenje. Postopek sestave vzorca je enak, le kart s številkami respondentov ne vrnemo nazaj v komplet.

1. Sistematično verjetnostno vzorčenje. Je poenostavljena različica preprostega verjetnostnega vzorca. Na podlagi seznama splošne populacije se v določenem intervalu (K) izberejo anketiranci. Vrednost K je določena naključno. Najbolj zanesljiv rezultat dosežemo s homogeno splošno populacijo, sicer lahko velikost koraka in nekateri notranji ciklični vzorci sovpadajo (mešanje vzorcev). Proti: enako kot pri preprostem verjetnostnem vzorcu.

2. Serijsko (gnezdeno) vzorčenje. Vzorčne enote so statistične serije (družina, šola, tim itd.). Izbrani elementi so predmet stalnega pregleda. Izbor statističnih enot je lahko organiziran glede na vrsto naključnega ali sistematičnega vzorčenja. Proti: Možnost večje homogenosti kot v splošni populaciji.

3. Zonski vzorec. V primeru heterogene populacije je pred uporabo verjetnostnega vzorčenja s katero koli selekcijsko tehniko priporočljivo populacijo razdeliti na homogene dele, tak vzorec imenujemo conski vzorec. Območne skupine so lahko naravne tvorbe (na primer mestna okrožja) in katera koli značilnost, na kateri temelji študija. Znak, na podlagi katerega se izvaja delitev, se imenuje znak stratifikacije in coniranja.

4. "Priročna" izbira. Postopek »priročnega« vzorčenja je sestavljen iz vzpostavljanja stikov s »priročnimi« vzorčnimi enotami – s skupino študentov, športno ekipo, s prijatelji in sosedi. Če je treba pridobiti informacije o odzivih ljudi na nov koncept, je tak vzorec povsem smiseln. "Priročno" vzorčenje se pogosto uporablja za predhodno testiranje vprašalnikov.

Neverjetni vzorci

Izbor v tak vzorec ne poteka po načelih naključja, temveč po subjektivnih kriterijih - dostopnost, tipičnost, enaka zastopanost itd.

1. Kvotno vzorčenje - vzorčenje je zgrajeno kot model, ki reproducira strukturo splošne populacije v obliki kvot (razmerjev) proučevanih značilnosti. Število vzorčnih elementov z različno kombinacijo proučevanih lastnosti se določi tako, da ustreza njihovemu deležu (deležu) v splošni populaciji. Torej, če imamo na primer splošno populacijo 5000 ljudi, od tega 2000 žensk in 3000 moških, potem bomo imeli v kvotnem vzorcu 20 žensk in 30 moških oziroma 200 žensk in 300 moških. Kvotni vzorci najpogosteje temeljijo na demografskih kriterijih: spol, starost, regija, dohodek, izobrazba in drugo. Proti: običajno takšni vzorci niso reprezentativni, saj nemogoče je upoštevati več družbenih parametrov hkrati. Prednosti: lahko dostopen material.

2. Metoda snežne kepe. Vzorec je sestavljen na naslednji način. Vsakega anketiranca, začenši s prvim, prosimo, da kontaktira svoje prijatelje, sodelavce, znance, ki bi ustrezali pogojem izbire in bi lahko sodelovali v študiji. Tako se vzorec, razen v prvem koraku, oblikuje s sodelovanjem samih preučevanih predmetov. Metoda se pogosto uporablja, ko je treba poiskati in intervjuvati težko dosegljive skupine anketirancev (na primer anketiranci z visokim dohodkom, anketiranci, ki pripadajo isti poklicni skupini, anketiranci, ki imajo podobne hobije/strasti itd.). )

3. Spontano vzorčenje - vzorčenje tako imenovanega "prvega prišleka". Pogosto se uporablja v televizijskih in radijskih anketah. Velikost in sestava spontanih vzorcev nista vnaprej znani, določa pa jo le en parameter – aktivnost anketirancev. Slabosti: nemogoče je ugotoviti, kakšno splošno populacijo anketiranci predstavljajo, posledično pa ni mogoče ugotoviti reprezentativnosti.

4. Anketa na poti – pogosto se uporablja, če je študijska enota družina. Na karti naselja, v katerem se bo anketa izvajala, so vse ulice oštevilčene. S pomočjo tabele (generatorja) naključnih števil se izberejo velika števila. Za vsako veliko številko se šteje, da je sestavljena iz 3 komponent: številka ulice (2-3 prve številke), hišna številka, številka stanovanja. Na primer, številka 14832: 14 je številka ulice na zemljevidu, 8 je hišna številka, 32 je številka stanovanja.

5. Zonsko vzorčenje z izbiro tipičnih objektov. Če se po coniranju iz vsake skupine izbere tipičen objekt, tj. objekt, ki se približuje povprečju glede na večino značilnosti, preučenih v študiji, se tak vzorec imenuje consko z izbiro tipičnih predmetov.

Strategije oblikovanja skupine

Izbor skupin za njihovo sodelovanje v psihološkem eksperimentu poteka z uporabo različnih strategij, ki so potrebne, da se zagotovi čim večja skladnost z notranjo in zunanjo veljavnostjo.

· Randomizacija (naključna izbira)

· Izbira po parih

· Stratometrična izbira

· Približno modeliranje

· Vključevanje pravih skupin

Randomizacija, oz naključni izbor, se uporablja za ustvarjanje preprostih naključnih vzorcev. Uporaba takšnega vzorca temelji na predpostavki, da je za vsakega člana populacije enako verjetno, da bo vključen v vzorec. Na primer, če želite narediti naključni vzorec 100 študentov, lahko položite koščke papirja z imeni vseh študentov v klobuk in nato iz njega vzamete 100 kosov papirja - to bo naključni izbor (Goodwin J. , stran 147).

Izbira po parih- strategijo konstruiranja vzorčnih skupin, pri kateri so skupine preiskovancev sestavljene iz preiskovancev, enakovrednih po stranskih parametrih, pomembnih za poskus. Ta strategija je učinkovita za poskuse z uporabo eksperimentalnih in kontrolnih skupin z najboljšo možnostjo - privabljanje parov dvojčkov (mono- in dizigotnih), saj vam omogoča ustvarjanje ...

Stratometrična izbira - randomizacija z dodelitvijo stratumov (ali grozdov). S to metodo vzorčenja se splošna populacija razdeli na skupine (stratume), ki imajo določene značilnosti (spol, starost, politične preference, izobrazba, višina dohodka itd.), Izberejo pa se subjekti z ustreznimi značilnostmi.

Približno modeliranje - oblikovanje omejenih vzorcev in posploševanje zaključkov o tem vzorcu na širšo populacijo. Na primer, ko sodelujejo v študiji študentov 2. letnika univerze, se podatki te študije razširijo na "osebe, stare od 17 do 21 let." Dopustnost tovrstnih posploševanj je izjemno omejena.

Približno modeliranje je oblikovanje modela, ki za jasno opredeljen razred sistemov (procesov) s sprejemljivo natančnostjo opisuje njegovo obnašanje (ali želene pojave).

Prebivalstvo- celota vseh predmetov (enot), o katerih namerava znanstvenik sklepati pri preučevanju določenega problema. Splošno populacijo sestavljajo vsi predmeti, ki jih preučujemo. Sestava splošne populacije je odvisna od ciljev študije. Včasih je splošna populacija celotno prebivalstvo določene regije (na primer, ko se proučuje odnos potencialnih volivcev do kandidata), najpogosteje je postavljenih več meril, ki določajo predmet študije. Na primer ženske, stare od 18 do 29 let, ki vsaj enkrat na teden uporabljajo kreme za roke določenih znamk in imajo dohodek vsaj 150 dolarjev na družinskega člana.

Vzorec- niz primerov (predmetov, objektov, dogodkov, vzorcev), z uporabo določenega postopka, izbranih iz splošne populacije za sodelovanje v študiji.

Velikost vzorca;
Odvisni in neodvisni vzorci;
Reprezentativnost:
1. Primer nereprezentativnega vzorca;
Vrste načrtov za gradnjo skupin iz vzorcev;
Strategije oblikovanja skupine:
1. randomizacija;
2. Izbira po parih;
3. Stratometrična izbira;
4. Približno modeliranje.

Velikost vzorca- število primerov, vključenih v vzorec. Zaradi statističnih razlogov je priporočljivo, da je število primerov vsaj 30–35.

Odvisni in neodvisni vzorci

Pri primerjavi dveh (ali več) vzorcev je pomemben parameter njuna odvisnost. Če je mogoče vzpostaviti homomorfni par (to je, ko en primer iz vzorca X ustreza enemu in samo enemu primeru iz vzorca Y in obratno) za vsak primer v dveh vzorcih (in ta osnova odnosa je pomembna za značilnost merjeno na vzorcih), take vzorce imenujemo odvisni. Primeri odvisnih vzorcev: pari dvojčkov, dve meritvi lastnosti pred in po eksperimentalni izpostavljenosti, možje in žene itd.

Če takega razmerja med vzorci ni, se ti vzorci štejejo za neodvisne, na primer: moški in ženske, psihologi in matematiki.

Skladno s tem so odvisni vzorci vedno enako veliki, velikost neodvisnih vzorcev pa se lahko razlikuje.

Vzorce primerjamo z različnimi statističnimi kriteriji:

Studentov t-test;
Wilcoxonov T-test;
U-test Mann-Whitney;
Kriteriji znakov itd.

Reprezentativnost

Vzorec se lahko šteje za reprezentativnega ali nereprezentativnega.

Primer nereprezentativnega vzorca

V Združenih državah so eden najbolj znanih zgodovinskih primerov nereprezentativnega vzorčenja predsedniške volitve leta 1936. telefonski imeniki po vsej državi in ljudje na seznamih registracij avtomobilov. Na 25 % vrnjenih glasovnic (skoraj 2,5 milijona) so bili glasovi razdeljeni takole:

57 % volivcev je dalo prednost republikanskemu kandidatu Alfu Landonu

40 % jih je izbralo takratnega demokratskega predsednika Franklina Roosevelta

Kot je znano, je Roosevelt zmagal na dejanskih volitvah z več kot 60% glasov. Napaka Litreary Digest je bila naslednja: da bi povečali reprezentativnost vzorca – ker so vedeli, da se ima večina njihovih naročnikov za republikance – so vzorec razširili z ljudmi, izbranimi iz telefonskih imenikov in registracijskih seznamov. Niso pa upoštevali realnosti svojega časa in so v resnici novačili še več republikancev: med veliko depresijo si je lahko privoščil predvsem srednji in višji razred (to je večina republikancev, ne demokratov). lastne telefone in avtomobile.

Vrste načrtov za gradnjo skupin iz vzorcev

Obstaja več glavnih vrst skupinskih gradbenih načrtov:

Študija z eksperimentalno in kontrolno skupino, ki sta postavljeni v različne pogoje;
Študija z eksperimentalnimi in kontrolnimi skupinami z uporabo strategije izbire v parih;
Študija z uporabo samo ene skupine - eksperimentalne;
Študija z uporabo mešanega (faktorskega) načrta - vse skupine so postavljene v različne pogoje.

Strategije oblikovanja skupine

Izbor skupin za sodelovanje v psihološkem eksperimentu poteka z uporabo različnih strategij, ki so potrebne za zagotovitev največje možne skladnosti z notranjo in zunanjo veljavnostjo:

Randomizacija (naključna izbira);
Izbira po parih;
Stratometrična izbira;
Približno modeliranje;
Vključevanje pravih skupin.

Randomizacija

Randomizacija ali naključna izbira se uporablja za ustvarjanje preprostih naključnih vzorcev. Uporaba takšnega vzorca temelji na predpostavki, da je za vsakega člana populacije enako verjetno, da bo vključen v vzorec. Če želite na primer narediti naključni vzorec 100 študentov, lahko papirje z imeni vseh študentov položite v klobuk in nato iz njega vzamete 100 kosov papirja - to bo naključni izbor

Izbira po parih

Selekcija po parih je strategija za sestavo vzorčnih skupin, pri kateri so skupine subjektov sestavljene iz subjektov, ki so enakovredni po stranskih parametrih, pomembnih za poskus. Ta strategija je učinkovita za poskuse z uporabo eksperimentalnih in kontrolnih skupin z najboljšo možnostjo - privabljanje parov dvojčkov (mono- in dizigotnih), saj vam omogoča ustvarjanje.

Stratometrična izbira

Stratometrična selekcija - randomizacija z izbiro stratumov (ali grozdov). S to metodo vzorčenja se splošna populacija razdeli na skupine (stratume), ki imajo določene značilnosti (spol, starost, politične preference, izobrazba, višina dohodka itd.), Izberejo pa se subjekti z ustreznimi značilnostmi.

Približno modeliranje

Približno modeliranje - sestava omejenih vzorcev in posploševanje zaključkov o tem vzorcu na večjo populacijo. Na primer, ko sodelujejo v študiji študentov 2. letnika univerze, se podatki te študije razširijo na "osebe, stare od 17 do 21 let." Dopustnost tovrstnih posploševanj je izjemno omejena.