Standardno odstopanje v primerjavi z variacijo

Standardni odklon in variance so statistični ukrepi razpršenosti Standardni odklonVariantaMatematična formula Kvadratni koren Variance Povprečje kvadratov odstopanj vsake vrednosti od povprečja v vzorcu. Simbol Grška črka sigma - σ Brez namenskega simbola; izraženo s standardnim odklonom ali drugimi vrednostmi. Vrednosti glede na dani niz podatkov Ista lestvica kot vrednosti v danem naboru podatkov; torej izraženo v istih enotah. Lestvica je večja od vrednosti v danem nizu podatkov; niso izraženi v isti enoti kot vrednosti same. So vrednosti negativne ali pozitivne? Vedno negativna Vedno negativna Prijava v resničnem svetu Vzorčenje prebivalstva; prepoznavanje odpuščav Statistične formule, finance.

Vsebina: Standardno odstopanje proti varianti

  • 1 Pomembni pojmi
  • 2 simbola
  • 3 formule
  • 4 Primer
    • 4.1 Zakaj kvadratna odstopanja?
  • 5 aplikacij v resničnem svetu
    • 5.1 Iskanje odpuščenih
  • 6 Vzorčno standardno odstopanje
  • 7 Reference

Pomembni pojmi

  • Pomeni: povprečje vseh vrednosti v naboru podatkov (dodajte vse vrednosti in delite njihovo vsoto s številom vrednosti).
  • Odklon: oddaljenost vsake vrednosti od srednje vrednosti. Če je srednja vrednost 3, ima vrednost 5 odklon 2 (odštejemo povprečje od vrednosti). Odstopanje je lahko pozitivno ali negativno.

Simboli

Formula za standardno odstopanje in odstopanje je pogosto izražena z uporabo:

  • x̅ = povprečje ali povprečje vseh podatkovnih točk v težavi
  • X = posamezna podatkovna točka
  • N = število točk v podatkovnem nizu
  • ∑ = vsota [kvadratov odstopanj]

Formule

Varijanca niza n enako verjetne vrednosti lahko zapišemo kot:

Standardni odklon je kvadratni koren variance:

Formule z grškimi črkami so videti zastrašujoče, vendar je to manj zapleteno, kot se zdi. Povedano v preprostih korakih:

  1. poiščite povprečje vseh podatkovnih točk
  2. ugotovite, kako daleč je vsaka točka od povprečja (to je odstopanje)
  3. kvadrat vsako odstopanje (tj. razlika vsake vrednosti od srednje vrednosti)
  4. seštevek kvadratov razdelite na število točk.

To daje variacijo. Vzemite kvadratni koren variance in poiščite standardni odklon.

Ta odličen video z Akademije Khan razlaga koncepte variacije in standardnega odklona:

Primer

Recimo, da podatkovni niz vključuje višino šestih maslačkov: 3 palce, 4 palce, 5 palcev, 4 palce, 11 palcev in 6 palcev.

Najprej poiščite sredino podatkovnih točk: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5,5

Torej povprečna višina je 5,5 palca. Zdaj potrebujemo odklone, zato ugotovimo razliko vsake rastline od povprečja: -2,5, -1,5, -,5, -1,5, 5,5, 1,5

Zdaj kvadrat vsako odstopanje in poiščite njihovo vsoto: 6,25 + 2,25 + .25 + 2,25 + 30,25 + 2,25 = 43,5

Zdaj delite vsoto kvadratov na število podatkovnih točk, v tem primeru rastline: 43,5 / 6 = 7,25

Torej, varianca tega nabora podatkov znaša 7,25, kar je precej poljubno število. Če ga želite pretvoriti v meritev v realnem svetu, vzemite kvadratni koren 7,25 in poiščite standardni odklon v palcih.

Standardni odklon je približno 2,69 palca. To pomeni, da je za vzorec vsaka marjetica v vrednosti 2,69 cm od povprečne vrednosti (5,5 palca) "normalna".

Zakaj kvadratna odstopanja?

Odstopanja so kvadratna, da preprečimo, da bi negativne vrednosti (odstopanja pod povprečjem) preklicale pozitivne vrednosti. To deluje, ker negativno število kvadratov postane pozitivna vrednost. Če ste imeli preprost nabor podatkov z odstopanjem od povprečja +5, +2, -1 in -6, se vsota odstopanj izkaže kot nič, če vrednosti niso kvadratne (tj. 5 + 2 - 1 - 6 = 0).

Aplikacije v resničnem svetu

Variacija je izražena kot matematična disperzija. Ker gre za poljubno število glede na izvirne meritve nabora podatkov, ga je težko predstaviti in uporabiti v resničnem smislu. Iskanje variacije je običajno le zadnji korak, preden ugotovimo standardni odklon. Vrednosti odstopanj se včasih uporabljajo v finančnih in statističnih formulah.

Standardni odklon, ki je izražen v izvirnih enotah nabora podatkov, je veliko bolj intuitiven in bližje vrednosti izvirnega nabora podatkov. Najpogosteje se uporablja za analizo demografskih podatkov ali vzorcev populacije, da bi dobili občutek, kaj je normalno v populaciji.

Iskanje odbitkov

Normalna porazdelitev (Bell krivulja) s pasovi, ki ustrezajo 1σ

Pri normalni porazdelitvi približno 68% populacije (ali vrednosti) spada pod 1 standardno deviacijo (1σ) od povprečne vrednosti, približno 94% pa pod 2σ. Vrednosti, ki se razlikujejo od povprečja za 1.7σ ali več, se običajno štejejo za odpuščene.

V praksi sistemi kakovosti, kot je Six Sigma, poskušajo zmanjšati število napak, tako da napake postanejo bolj zunanje. Izraz "šest sigma proces" izhaja iz pojma, da če ima šest standardnih odstopanj med povprečjem procesa in najbližjo mejo specifikacije, praktično noben element ne bo ustrezal specifikacijam.[1]

Vzorčni standardni odklon

V aplikacijah v resničnem svetu uporabljeni nabori podatkov ponavadi predstavljajo vzorce prebivalstva in ne celotne populacije. Za delne vzorce se uporabi rahlo spremenjena formula.

"Vzorec standardnega odklona" se uporablja, če imate samo vzorec, vendar želite dati izjavo o standardnem odmiku populacije, iz katerega je odvzet vzorec

Edina različica formule standardnega odmika vzorca od formule standardnega odstopanja je v imenovalcu "-1".

Z uporabo primera za prhljaj bi bila ta formula potrebna, če bi vzorčili samo 6 maslačkov, vendar smo želeli uporabiti ta vzorec, da bi navedli standardno odstopanje za celotno polje z več stotinami..

Vsoto kvadratov bi zdaj delili s 5 namesto 6 (n - 1), kar daje odstopanje 8,7 (namesto 7,25) in vzorčni standardni odklon 2,95 palca, namesto 2,69 palca za prvotni standardni odklon. Ta sprememba se uporablja za iskanje meje napake v vzorcu (v tem primeru 9%).

Reference

  • Preprost primer izračunavanja standardnega odstopanja - AppSpot
  • Standardne odstopne formule - Math is Fun
  • Absolutno odstopanje in odstopanje - Laerd statistika
  • Standardno odstopanje in odstopanje - Math is Fun
  • Wikipedija: Standardni odklon
  • Wikipedia: Variance # Properties
  • Razpon, variance in standardni odmik kot merila disperzije - Akademija Khan
  • Načini, mediani in sredstva: združujoča perspektiva