Stratificirano vzorčenje proti vzorčenju grozdov
V statistiki, zlasti pri izvajanju raziskav, je pomembno, da dobimo nepristranski vzorec, zato so rezultat in napovedi, ki jih dajemo prebivalstvu, bolj natančni. Toda v preprostem naključnem vzorčenju obstaja možnost izbire članov pristranskega vzorca; z drugimi besedami, ne predstavlja prebivalstva pošteno. Zato se stratificirano vzorčenje in grozdno vzorčenje uporabljata za premagovanje pristranskosti in vprašanj učinkovitosti pri preprostem naključnem vzorčenju.
Stratificirano vzorčenje
Stratificirano naključno vzorčenje je metoda vzorčenja, pri kateri se populacija najprej razdeli na sloje (Stratum je homogena podskupina populacije). Nato se iz vsakega sloja odvzame preprost naključni vzorec. Rezultati iz vseh kombiniranih slojev so vzorec. Sledijo primeri možnih slojev prebivalstva
• Za populacijo države, moške in ženske sloje
• za ljudi, ki delajo v mestnih, rezidenčnih in nerezidenčnih slojih
• za študente na visoki šoli, beli, črni, latinoamerični in azijski sloji
• Za občinstvo razprave o teologiji, protestantskih, katoliških, judovskih, muslimanskih slojih
V tem procesu se populacija namesto odvzemanja vzorcev naključno neposredno iz populacije loči na skupine z lastnimi značilnostmi elementov (homogene skupine). Nato se iz skupine odvzamejo naključni vzorci. Količina naključnih vzorcev, odvzetih iz vsake skupine, je odvisna od števila elementov v skupini.
To omogoča vzorčenje, ne da bi vzorec ene skupine večje od števila vzorcev, potrebnih za določeno skupino. Če je število elementov iz določene skupine večje od zahtevane količine, lahko napačna distribucija povzroči napačne razlage.
Stratificirano vzorčenje omogoča uporabo različnih statističnih metod za vsak sloj, kar pomaga izboljšati učinkovitost in natančnost ocene.
Vzorčenje grozda
Klasterno naključno vzorčenje je metoda vzorčenja, pri kateri se populacija najprej razdeli na grozde (Grozd je heterogena podskupina populacije). Nato vzamemo preprost naključni vzorec grozdov. Vzorec tvorijo vsi člani izbranih skupin. Ta metoda se pogosto uporablja, kadar so naravne skupine očitne in na voljo.
Za primere razmislite o anketi za oceno vključenosti srednješolcev v obšolske dejavnosti. Namesto izbire naključnih študentov iz študentske populacije je izbira razreda kot vzorca za anketo grozdno vzorčenje. Nato se opravi razgovor z vsakim članom razreda. V tem primeru so razredi grozdi študentske populacije.
Pri vzorčenju grozdov so grozdi izbrani naključno, ne posamezniki. Domnevamo, da je vsak grozd sam po sebi nepristranski prikaz populacije, kar pomeni, da je vsak grozd heterogen.
Kakšna je razlika med stratificiranim vzorčenjem in grozdnim vzorčenjem?
• Pri stratificiranem vzorčenju se populacija z atributom vzorcev razdeli na homogene skupine, imenovane strata. Nato se izberejo člani iz vsakega sloja in število vzorcev, odvzetih iz teh slojev, je sorazmerno s prisotnostjo slojev v populaciji.
• V vzorčenju grozdov se populacija razvrsti v skupine, pretežno na podlagi lokacije, nato pa se skupina naključno izbere.
• Pri vzorčenju grozda je grozd izbran naključno, pri stratificiranih članih vzorčenja pa so izbrani naključno.
• V stratificiranem vzorčenju vsaka uporabljena skupina (sloji) vključuje homogene člane, medtem ko je v vzorčenju grozda grozd heterogen..
• Stratificirano vzorčenje je počasnejše, medtem ko je vzorčenje grozdov relativno hitrejše.
• Stratificirani vzorci imajo manj napak zaradi faktoringa v prisotnosti vsake skupine v populaciji in prilagajanja metod za boljšo oceno.
• Vzorčenje grozdov je značilno višji odstotek napak.