Korelacija in regresija sta statistični orodji, ki obravnavata dve ali več spremenljivk. Čeprav se oba nanašata na isto temo, med njima obstajata razlika. Razlike med obema so razložene spodaj.
Izraz korelacija glede na dve ali več spremenljivk pomeni, da so spremenljivke na nek način povezane. Korelacijska analiza določa, ali obstaja povezava med dvema spremenljivkama in moč odnosa. Če sta dve spremenljivki x (neodvisne) in y (odvisni) tako povezani, da spremlja nihanje velikosti neodvisne spremenljivke z nihanjem velikosti odvisne spremenljivke, potem naj bi se obe spremenljivki povezali.
Korelacija je lahko linearna ali nelinearna. Linearna korelacija je tista, kjer so spremenljivke tako povezane, da bi sprememba vrednosti ene spremenljivke dosledno spreminjala vrednost druge spremenljivke. V linearni korelaciji bi se razpršene točke, povezane z ustreznimi vrednostmi odvisnih in neodvisnih spremenljivk, združile okoli nehorizontalne ravne črte, čeprav bi vodoravna ravna črta tudi kazala linearno razmerje med spremenljivkami, če bi lahko ravna premica povezala točke, ki predstavljajo spremenljivke.
Po drugi strani pa regresijska analiza uporablja obstoječe podatke za določitev matematičnega razmerja med spremenljivkami, ki se lahko uporabi za določitev vrednosti odvisne spremenljivke glede na katero koli vrednost neodvisne spremenljivke.
Korelacija je povezana z merjenjem moči povezovanja ali intenzitete odnosa, kadar se regresija nanaša na napovedovanje vrednosti odvisne spremenljivke glede na znano vrednost neodvisne spremenljivke. To je mogoče razložiti z naslednjimi formulami.
Korelacijski koeficient ali korelacijski koeficient (r) med x & y se ugotovi z naslednjo formulo;
r = covariance (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σy so standardna odstopanja x in y oziroma, - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Korelacijski koeficient r je čisto število in neodvisno od merske enote. Torej, če je x višina (palcev) in y teža (lbs.) Ljudi določenega območja, potem r ni niti v palcih niti v lbs, ampak preprosto število.
Regresijska enačba se ugotovi z naslednjo formulo;
Regresijska enačba y na x (če želite izvedeti oceno y) je y - y '= byx (x-x‾), byx se imenuje regresijski koeficient y na x. Regresijska enačba x na y (če želite izvedeti oceno x) je x - x '= bxy (y-y‾), bxy se imenuje regresijski koeficient x na y.
Korelacijska analiza ne predvideva odvisnosti nobene spremenljivke od druge spremenljivke, prav tako ne poskuša ugotoviti razmerja med njima. Preprosto oceni stopnjo povezanosti spremenljivk. Z drugimi besedami, korelacijska analiza preizkuša soodvisnost spremenljivk. Regresijska analiza na drugi strani opisuje odvisnost odvisne spremenljivke ali odzivne spremenljivke od neodvisne ali pojasnjevalne spremenljivke. Regresijska analiza predvideva, da med pojasnjevalnimi in odzivnimi spremenljivkami obstaja enosmerna vzročna zveza in ne upošteva, ali je ta vzročna zveza pozitivna ali negativna. Za korelacijo sta vrednosti odvisnih in neodvisnih spremenljivk naključni, za regresijske vrednosti neodvisnih spremenljivk pa ni treba, da so naključne.
1. Korelacijska analiza je test medsebojne odvisnosti dveh spremenljivk. Regresijska analiza daje matematično formulo za določitev vrednosti odvisne spremenljivke glede na vrednost neodvisnih spremenljivk / s.
2. Korekcijski koeficient ni odvisen od izbire izvora in obsega, toda regresijski koeficient ni tako.
Za korelacijo morajo biti vrednosti obeh spremenljivk naključne, vendar to ni tako za koeficient regresije.
1. Das, N. G., (1998), Statistične metode, Kalkuta
2. Korelacija in regresija, na voljo na spletni strani www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regresija in korelacija, na voljo na www.abyss.uoregon.edu