Varianta proti kovarijanci
Odstopanje in kovarienca sta dva ukrepa, ki se uporabljata v statistiki. Variance so merilo razpršitve podatkov, kovariance pa kažejo stopnjo spremembe dveh naključnih spremenljivk skupaj. Varianta je precej intuitiven pojem, kovarija pa je matematično definirana na začetku ne tako intuitivno.
Več o Variance
Variance so merilo razpršenosti podatkov od srednje vrednosti distribucije. Pove, kako daleč so podatkovne točke od sredine porazdelitve. Je eden glavnih opisnikov porazdelitve verjetnosti in eden od trenutkov porazdelitve. Variacija je tudi parameter populacije, odstopanje vzorca iz populacije pa deluje kot ocenjevalec variacije populacije. Z ene perspektive je opredeljen kot kvadrat standardnega odklona.
V navadnem jeziku ga lahko opišemo kot povprečje kvadratov razdalje med posamezno podatkovno točko in srednjo porazdelitvijo. Za izračun odstopanja se uporablja naslednja formula.
Var (X) = E [(X-µ)2 ] za prebivalstvo in
Var (X) = E [(X-‾x)2 ] za vzorec
Nadalje lahko poenostavimo, da dobimo Var (X) = E [X2 ] - (E [X])2.
Variance ima nekaj lastnosti podpisovanja in se pogosto uporablja v statistiki za poenostavitev uporabe. Odstopanje ni negativno, ker je kvadrat razdalj. Vendar razpon variance ni omejen in je odvisen od posamezne porazdelitve. Variacija konstantne naključne spremenljivke je nič, odstopanje pa se ne spremeni glede na lokacijski parameter.
Več o Covariance
V statistični teoriji je kovariacija merilo, koliko se dve naključni spremenljivki spremenita skupaj. Z drugimi besedami, kovariacija je merilo jakosti korelacije med dvema naključnima spremenljivkama. Prav tako se lahko šteje za posplošitev koncepta variance dveh naključnih spremenljivk.
Kovariacija dveh naključnih spremenljivk X in Y, ki sta skupaj porazdeljeni s končnim sekundnim zagonom, je znana kot σXY= E [(X-E [X]) (Y-E [Y])]. Iz tega lahko varianto vidimo kot poseben primer kovarijance, kjer sta dve spremenljivki enaki. Cov (X, X) = Var (X)
Z normalizacijo kovariance lahko dobimo koeficient linearne korelacije ali Pearsonov korelacijski koeficient, ki je opredeljen kot ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Grafično gledano je kovarija med dvojico podatkovnih točk videti kot območje pravokotnika s podatkovnimi točkami v nasprotnih točkah. Lahko ga razlagamo kot merilo ločitve med dvema podatkovnima točkama. Če upoštevamo pravokotnike za celotno populacijo, lahko prekrivanje pravokotnikov, ki ustrezajo vsem podatkovnim točkam, šteje kot moč ločitve; variance obeh spremenljivk. Kovaranca je v dveh dimenzijah zaradi dveh spremenljivk, a poenostavitev v eno spremenljivko daje varianco ene same kot ločitev v eni dimenziji.
Kakšna je razlika med variance in kovariance?
• Variacija je merilo širjenja / razpršenosti v populaciji, medtem ko je kovarijanca obravnavana kot merilo variacije dveh naključnih spremenljivk ali jakosti korelacije.
• Variance je mogoče obravnavati kot poseben primer kovarijance.
• variance in kovariance so odvisni od obsega podatkovnih vrednosti in jih ni mogoče primerjati; zato se normalizirajo. Kovaranca se normalizira v korelacijski koeficient (deljenje s produktom standardnih odstopanj dveh naključnih spremenljivk) in varianca se normalizira v standardni odklon (z upoštevanjem kvadratnega korena)