Prebivalstvo vs vzorčno standardno odstopanje
V statistiki se za opisovanje podatkov, ki ustrezajo njegovi osrednji nagnjenosti, razpršenosti in poševnosti, uporablja več indeksov. Standardni odklon je eden najpogostejših ukrepov razširjanja podatkov iz središča podatkovnega niza.
Zaradi praktičnih težav ne bo mogoče uporabiti podatkov celotne populacije, ko se preskusi hipoteza. Zato uporabljamo vrednosti podatkov iz vzorcev za sklepanje o populaciji. V takšnih razmerah se ti imenujejo ocenjevalci, saj ocenjujejo vrednosti parametrov populacije.
Izjemno pomembno je, da pri sklepanju uporabimo nepristranske ocenjevalce. Za ocenjevalca velja, da je nepristranski, če je pričakovana vrednost tega ocenjevalca enaka populacijskemu parametru. Primer vzorca uporabljamo kot nepristranski ocenjevalec povprečne populacije. (Matematično lahko pokažemo, da je pričakovana vrednost vzorčnega povprečja enaka povprečni populaciji). V primeru ocenjevanja standardnega odklona populacije je vzorčni standardni odklon tudi nepristranski ocenjevalec.
Kaj je standardni odklon populacije?
Kadar se lahko upoštevajo podatki celotne populacije (na primer pri popisu), je mogoče izračunati standardni odklon prebivalstva. Za izračun standardnega odklona populacije se najprej izračunajo odstopanja vrednosti podatkov od povprečne populacije. Korenski povprečni kvadrat (kvadratna srednja vrednost) odklonov se imenuje populacijski standardni odklon.
V razredu 10 učencev je mogoče podatke o študentih zlahka zbrati. Če se hipoteza preizkuša na tej populaciji študentov, potem ni treba uporabiti vzorčnih vrednosti. Na primer, uteži 10 študentov (v kilogramih) so 70, 62, 65, 72, 80, 70, 63, 72, 77 in 79. Potem je povprečna teža desetih ljudi (v kilogramih) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, kar je 71 (v kilogramih). To je povprečje prebivalstva.
Zdaj za izračun standardnega odklona prebivalstva izračunamo odstopanja od povprečne vrednosti. Odstopanja od povprečja so (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 in (79 - 71) = 8. Vsota kvadratov odstopanja je ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Standardni odklon prebivalstva je √ (366/10) = 6,05 (v kilogramih). 71 je natančna povprečna teža učencev razreda in 6,05 natančen standardni odklon teže od 71.
Kaj je vzorčni standardni odklon?
Kadar se za oceno parametrov populacije uporabljajo podatki iz vzorca (velikosti n), se izračuna standardni odklon vzorca. Najprej se izračunajo odstopanja vrednosti podatkov od povprečne vrednosti vzorca. Ker se vzorčna sredina uporablja namesto povprečne populacije (kar je neznano), kvadratna srednja vrednost ni primerna. Da bi nadomestili uporabo vrednosti vzorca, se vsota kvadratov odstopanj deli s (n-1) namesto s n. Standardni odklon vzorca je kvadratni koren tega. V matematičnih simbolih je S = √ ∑ (xjaz-ẍ)2 / (n-1), kjer je S standardni odklon vzorca, ẍ je vzorec srednja vrednost in xjazso podatkovne točke.
Zdaj pa predpostavimo, da so v prejšnjem primeru prebivalci učenci celotne šole. Nato bo razred le vzorec. Če se ta vzorec uporabi pri oceni, bo standardni odklon vzorca √ (366/9) = 6,38 (v kilogramih), saj je bilo 366 razdeljeno na 9 namesto na 10 (velikost vzorca). Dejstvo, ki ga je treba opaziti, je, da to ni zajamčena natančna vrednost standardnega odstopanja populacije. To je zgolj ocena.
Kakšna je razlika med standardnim odstopanjem populacije in standardnim odstopanjem vzorca? • Standardni odklon populacije je natančna vrednost parametra, ki se uporablja za merjenje disperzije iz središča, medtem ko je vzorčni standardni odklon nepristranski ocenjevalec. • Standardni odklon prebivalstva se izračuna, ko so znani vsi podatki o vsakem posamezniku prebivalstva. Drugače se izračuna standardni standardni odklon vzorca. • Standardni odklon prebivalstva je izražen z σ = √ ∑ (xi-µ)2/ n kjer je µ povprečna populacija in n je velikost populacije, toda vzorčni standardni odklon je dan S = √ ∑ (xi-ẍ)2 / (n-1) kjer je mean povprečna vrednost vzorca in n velikost vzorca.
|