Regresija proti korelaciji
V statistiki je pomembno določiti razmerje med dvema naključnima spremenljivkama. Omogoča predvidevanje ene spremenljivke glede na druge. Regresijska analiza in korelacija se uporabljata pri vremenskih napovedih, obnašanju finančnih trgov, vzpostavljanju fizičnih odnosov s poskusi in v veliko bolj resničnih scenarijih sveta.
Kaj je regresija?
Regresija je statistična metoda, ki se uporablja za risanje razmerja med dvema spremenljivkama. Kadar se podatki zbirajo, so pogosto spremenljivke, ki so odvisne od drugih. Natančen odnos med temi spremenljivkami je mogoče ugotoviti le z regresijskimi metodami. Določitev tega odnosa pomaga razumeti in napovedati vedenje ene spremenljivke do druge.
Najpogostejša uporaba regresijske analize je ocena vrednosti odvisne spremenljivke za določeno vrednost ali obseg vrednosti neodvisnih spremenljivk. Na primer s pomočjo regresije lahko na podlagi podatkov, zbranih iz naključnega vzorca, ugotovimo razmerje med ceno blaga in porabo. Regresijska analiza proizvaja regresijsko funkcijo nabora podatkov, ki je matematični model, ki najbolje ustreza razpoložljivim podatkom. To lahko enostavno predstavimo s parcelo. Grafično je regresija enakovredna iskanju najboljše prilegajoče krivulje za nabor podatkov daj. Funkcija krivulje je regresijska funkcija. Z uporabo matematičnega modela je mogoče predvideti povpraševanje po določeni ceni.
Zato se regresijska analiza pogosto uporablja pri napovedovanju in napovedovanju. Uporablja se tudi za vzpostavljanje odnosov v eksperimentalnih podatkih na področju fizike, kemije in mnogih naravoslovnih in inženirskih strok. Če je odnos ali regresijska funkcija linearna funkcija, potem je postopek znan kot linearna regresija. V razcepu se lahko predstavlja kot ravna črta. Če funkcija ni linearna kombinacija parametrov, je regresija nelinearna.
Kaj je korelacija?
Korelacija je merilo moči odnosa med dvema spremenljivkama. Korelacijski koeficient količinsko opredeli stopnjo spremembe ene spremenljivke na podlagi spremembe druge spremenljivke. V statistiki je korelacija povezana s pojmom odvisnosti, ki je statistično razmerje med dvema spremenljivkama.
Pearsonov korelacijski koeficient ali samo korelacijski koeficient r je vrednost med -1 in 1 (-1≤r≤ + 1). To je najpogosteje uporabljeni korelacijski koeficient in velja le za linearno razmerje med spremenljivkami. Če je r = 0, ni razmerja in če je r≥0, je razmerje neposredno sorazmerno; to pomeni, da se vrednost ene spremenljivke povečuje s povečanjem druge. Če je r≤0, je razmerje obratno sorazmerno; t.j. ena spremenljivka se zmanjšuje, ko se druga povečuje.
Zaradi pogoja linearnosti lahko korelacijski koeficient r uporabimo tudi za določitev prisotnosti linearnega razmerja med spremenljivkami.
Kakšna je razlika med regresijo in korelacijo?
Regresija daje obliko razmerja med dvema naključnima spremenljivkama, korelacija pa stopnjo moči odnosa.
Regresijska analiza ustvarja regresijsko funkcijo, ki pomaga ekstrapolirati in napovedati rezultate, medtem ko korelacija lahko daje le informacije v katero smer se lahko spremeni.
Natančnejše modele linearne regresije dobimo z analizo, če je korelacijski koeficient višji. (| r | ≥0,8)