Uvod
Standardno Dletalstvo (SD) in Standard Egroza (SE) so na videz podobne terminologije; vendar so v pojmu tako raznoliki, da jih v literaturi o statistiki skoraj zamenljivo uporabljamo. Obe pojmi je običajno pred znakom plus-minus (+/-), ki označuje dejstvo, da definirajo simetrično vrednost ali predstavljajo obseg vrednosti. Oba izraza se ne spreminjata s povprečjem (povprečjem) niza izmerjenih vrednosti.
Zanimivo je, da SE nima nobene zveze s standardi, z napakami ali s posredovanjem znanstvenih podatkov.
Podroben pogled na izvor in razlago SD in SE bo razkril, zakaj se poklicni statistiki in tisti, ki ga uporabljajo previdno, ponavadi zmotijo.
Standardno odstopanje (SD)
SD je a opisno statistika, ki opisuje širjenje distribucije. Kot metrika je koristno, ko se podatki običajno distribuirajo. Vendar pa je manj uporaben, kadar so podatki zelo nagnjeni ali dvomasti, ker ne opisujejo dobro oblike porazdelitve. Običajno pri poročanju o značilnostih vzorca uporabljamo SD, ker ga nameravamo opišite koliko se podatki gibljejo okoli povprečja. Druge uporabne statistike za opis širjenja podatkov so interkvartilni razpon, 25. in 75.centtil in razpon podatkov.
Slika 1. SD je merilo širjenja podatkov. Če so podatki vzorec iz običajno porazdeljene distribucije, pričakujemo, da bo dve tretjini podatkov ležalo znotraj 1 standardnega odklona od povprečne vrednosti.
Varianta je a opisno tudi statistična in je opredeljena kot kvadrat standardnega odklona. Običajno se pri opisovanju rezultatov ne poroča, vendar gre za bolj matematično določljivo formulo (ok.k.a. vsoto odstopanj v kvadratu) in igra vlogo pri izračunu statistike.
Na primer, če imamo dve statistiki P & V z znanimi variacijami var(P) & var(Q), potem varianta vsote P + Q je enako vsoti odstopanj: var(P) +var(Q). Zdaj je očitno, zakaj statistiki radi govorijo o odstopanjih.
Toda standardni odmiki imajo pomemben pomen za širjenje, zlasti kadar se podatki običajno distribuirajo: Interval povprečje +/ - 1 SD lahko pričakujemo, da bo zajel 2/3 vzorca in povprečno interval +- 2 SD lahko pričakujemo, da bo zajelo 95% vzorca.
SD podaja, v kolikšni meri se posamezni odgovori na vprašanje razlikujejo ali "odstopajo" od povprečja. SD pripoveduje raziskovalcu, kako razširjeni so odzivi - ali so skoncentrirani na srednjo vrednost ali so razpršeni daleč naokoli? Ali so vsi vaši anketiranci ocenili vaš izdelek sredi lestvice ali so ga nekateri odobrili in nekateri ne odobrili?
Razmislite o poskusu, v katerem vprašani prosijo, da izdelek oceni na podlagi nizov atributov na 5-stopenjski lestvici. Povprečna vrednost za skupino desetih vprašanih (z oznako „A“ do „J“ spodaj) za „dobra vrednost za denar“ je bila 3,2, SD pa 0,4, povprečna vrednost za „zanesljivost izdelka“ pa 3,4, SD pa 2,1.
Na prvi pogled (samo z vidika sredstev) se zdi, da je zanesljivost ocenjena višje od vrednosti. Toda višji SD za zanesljivost bi lahko pokazal (kot kaže razdelitev spodaj), da so bili odzivi zelo polarizirani, kjer večina anketirancev ni imela težav z zanesljivostjo (atribut je ocenil s 5), manjši, vendar pomemben segment anketirancev je imel težava z zanesljivostjo in je atribut ocenil "1". Če pogledamo samo sredino, pripovedujemo le del zgodbe, vendar se raziskovalci pogosteje osredotočajo na to. Pomembno je upoštevati porazdelitev odgovorov in SD zagotavlja dragocen opisni ukrep tega.
Anketiranec | Dobra vrednost za denar | Zanesljivost izdelka |
A | 3 | 1 |
B | 3 | 1 |
C | 3 | 1 |
D | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 |
H | 3 | 5 |
jaz | 3 | 5 |
J | 3 | 5 |
Pomeni | 3.2 | 3.4 |
Std Dev. | 0,4 | 2.1 |
Prva anketa: Anketiranci ocenjujejo izdelek na 5-stopenjski lestvici
Dve zelo različni porazdelitvi odgovorov na 5-točkovno ocenjevalno lestvico lahko dobita isto srednjo vrednost. Razmislite o naslednjem primeru, ki prikazuje odzivne vrednosti za dve različni oceni.
V prvem primeru (ocena "A") je SD nič, ker so bili VSE odzivi točno povprečna vrednost. Posamezni odzivi sploh niso odstopali od povprečja.
V oceni „B“ je povprečna odstopanje višja, čeprav je skupinska vrednost enaka (3.0) kot pri prvi distribuciji. Standardni odklon 1,15 kaže, da so bili posamezni odzivi v povprečju nekaj več kot 1 točko od povprečja.
Anketiranec | Ocena "A" | Ocena „B“ |
A | 3 | 1 |
B | 3 | 2 |
C | 3 | 2 |
D | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
G | 3 | 3 |
H | 3 | 4 |
jaz | 3 | 4 |
J | 3 | 5 |
Pomeni | 3.0 | 3.0 |
Std Dev. | 0,00 | 1.15 |
Druga anketa: Anketiranci ocenjujejo izdelek na 5-stopenjski lestvici
Drug način gledanja na SD je z načrtovanjem distribucije kot histograma odzivov. Porazdelitev z nizkim SD-jem bi prikazala kot visoko ozko obliko, medtem ko bi velik SD označila s širšo obliko.
SD na splošno ne označuje "pravilno ali napačno" ali "boljše ali slabše" - nižji SD ni nujno bolj zaželen. Uporablja se izključno kot opisna statistika. Opisuje porazdelitev glede na srednjo vrednost.
Ttehnično odpoved odgovornosti v zvezi s SD
Razmišljanje o SD kot "povprečnem odstopanju" je odličen način konceptualnega razumevanja njegovega pomena. Vendar pa se v resnici ne izračuna kot povprečje (če bi ga imenovali "povprečno odstopanje"). Namesto tega je "standardiziran", nekoliko zapleten način izračunavanja vrednosti s pomočjo vsote kvadratov.
Za praktične namene računanje ni pomembno. Večina tabelarnih programov, preglednic ali drugih orodij za upravljanje podatkov bo izračunala SD za vas. Pomembneje je razumeti, kaj sporočajo statistike.
Standardna napaka
Standardna napaka je inferential statistika, ki se uporablja pri primerjanju vzorčnih sredstev (povprečja) med populacijami. To je merilo natančnost povprečne vrednosti vzorca Povprečni vzorec je statistika, pridobljena iz podatkov, ki imajo osnovno porazdelitev. Ne moremo ga predstaviti na enak način kot podatke, saj smo izvedli en poskus in imajo samo eno vrednost. Statistična teorija nam pravi, da je povprečna vrednost vzorca (za velik "dovolj" vzorec in v nekaj rednih pogojih) približno normalno porazdeljena. Standardni odklon te normalne porazdelitve imenujemo standardna napaka.
Slika 2. Porazdelitev na dnu reprepošlje distribucijo podatkov, medtem ko je razdelitev na vrhu teoretična porazdelitev vzorčnega povprečja. SD 20 je merilo širjenja podatkov, medtem ko je SE 5 merilo negotovosti glede vzorca.
Ko želimo primerjati rezultate iz dvo vzorčnega eksperimenta Zdravljenja A v primerjavi z zdravljenjem B, moramo oceniti, kako natančno smo izmerili sredstva.
Pravzaprav nas zanima, kako natančno smo izmerili razliko med obema sredstvima. Temu merilu pravimo standardna napaka razlike. Morda ne boste presenečeni, ko boste izvedeli, da je standardna napaka razlike v vzorčnem sredstvu funkcija standardnih napak sredstev:
Zdaj, ko ste razumeli, da sta standardna napaka srednje (SE) in standardni odklon distribucije (SD) dve različni zverini, se morda sprašujete, kako sta se zmedla. Medtem ko se konceptualno razlikujejo, imajo matematično preprost odnos:
,kjer je n število podatkovnih točk.
Opazite, da je standardna napaka odvisna od dveh komponent: standardnega odklona vzorca in velikosti vzorca n. To ima smiselnost: večji kot je standardni odklon vzorca, manj natančno lahko ocenimo resnično srednjo vrednost.
Večja kot je velikost vzorca, več informacij o prebivalstvu in natančneje lahko ocenimo resnično srednjo vrednost.
SE je pokazatelj zanesljivosti srednje vrednosti. Majhna SE je pokazatelj, da je povprečna vrednost vzorca natančnejši odraz dejanske povprečne populacije. Večja velikost vzorca bo običajno povzročila manjši SE (medtem ko velikost vzorca neposredno ne vpliva na SD).
Večina raziskav vključuje raziskavo vzorcev iz populacije. Nato sklepamo o populaciji na podlagi rezultatov, pridobljenih iz tega vzorca. Če je bil odvzet drugi vzorec, se rezultati verjetno ne bodo natančno ujemali s prvim vzorcem. Če je bila za en vzorec povprečna vrednost bonitetnega atributa 3,2, je lahko za drugi vzorec enake velikosti 3,4. Če bi iz naše populacije vzeli neskončno število vzorcev (enake velikosti), bi lahko opazovana sredstva prikazali kot porazdelitev. Nato bi lahko izračunali povprečje vseh naših vzorčnih sredstev. To bi bilo enako dejanskemu povprečju prebivalstva. Izračunamo lahko tudi SD porazdelitve vzorčnih sredstev. SD te porazdelitve vzorčnih sredstev je SE vsake povprečne vrednosti vzorca.
Tako imamo svoje najpomembnejše opazovanje: SE je SD povprečje prebivalstva.
Vzorec | Pomeni |
1. | 3.2 |
2 | 3.4 |
3. oz | 3.3 |
4 | 3.2 |
5 | 3.1 |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
Pomeni | 3.3 |
Std Dev. | 0,13 |
Tabela, ki prikazuje odnos med SD in SE
Zdaj je jasno, da če nam SD te porazdelitve pomaga razumeti, kako daleč je vzorec od resnične povprečne populacije, potem lahko to uporabimo, da razumemo, kako natančen je vsak posamezen vzorec v primerjavi z resnično srednjo vrednostjo. To je bistvo SE.
V resnici smo iz naše populacije vzeli le en vzorec, vendar lahko s pomočjo tega rezultata ocenimo zanesljivost našega opazovanega povprečja vzorca.
Pravzaprav nam SE pravi, da smo lahko 95% prepričani, da je naša opažena vrednost vzorca plus ali minus približno 2 (dejansko 1,96) Standardne napake iz populacije pomenijo.
Spodnja tabela prikazuje porazdelitev odgovorov iz prvega (in edinega) vzorca, ki smo ga uporabili za naše raziskave. SE 0,13, ki je sorazmerno majhen, nam kaže, da je naša povprečna vrednost relativno blizu resnični srednji celotni populaciji. Mejna vrednost napake (pri 95-odstotni zanesljivosti) je za naše povprečje (približno) dvakrat večja od vrednosti (+/- 0,26), kar nam pove, da je resnična srednja vrednost najverjetneje med 2,94 in 3,46.
Anketiranec | Ocena |
A | 3 |
B | 3 |
C | 3 |
D | 3 |
E | 4 |
F | 4 |
G | 3 |
H | 3 |
jaz | 3 |
J | 3 |
Pomeni | 3.2 |
Std Napaka | 0,13 |
Povzetek
Številni raziskovalci ne razumejo razlikovanja med standardnim odstopanjem in standardno napako, čeprav so običajno vključeni v analizo podatkov. Čeprav so dejanski izračuni za standardno odstopanje in standardne napake videti zelo podobni, predstavljajo dva zelo različna, vendar dopolnjujoča se ukrepa. SD nam pove o obliki naše distribucije, kako blizu so posamezne vrednosti podatkov od srednje vrednosti. SE nam pove, kako blizu je povprečnega vzorca resničnemu povprečju celotne populacije. Skupaj pomagajo zagotoviti popolnejšo sliko, kot nam jo lahko pove samo sredina.