Razlika med korelacijo in regresijo

Korelacija in regresija sta dve analizi, ki temeljita na multivariatni porazdelitvi. Multivariatna porazdelitev je opisana kot porazdelitev večih spremenljivk. Korelacija je opisan kot analiza, ki nam omogoča povezavo ali odsotnost razmerja med dvema spremenljivkama 'x' in 'y'. Na drugem koncu, Regresija analiza napoveduje vrednost odvisne spremenljivke na podlagi znane vrednosti neodvisne spremenljivke, ob predpostavki, da je povprečna matematična povezava med dvema ali več spremenljivkami.

Razlika med korelacijo in regresijo je eno najpogostejših vprašanj v intervjujih. Poleg tega ima veliko ljudi dvoumnost pri razumevanju teh dveh. Torej, v celoti preberite ta članek, da boste jasno razumeli to dvoje.

Vsebina: Korelacija V regresija

  1. Primerjalna tabela
  2. Opredelitev
  3. Ključne razlike
  4. Zaključek

Primerjalna tabela

Osnove za primerjavoKorelacijaRegresija
PomenKorelacija je statistični ukrep, ki določa soodnos ali povezanost dveh spremenljivk.Regresija opisuje, kako je neodvisna spremenljivka številčno povezana z odvisno spremenljivko.
UporabaPredstaviti linearno razmerje med dvema spremenljivkama.Prilagoditev najboljši vrstici in ocena ene spremenljivke na podlagi druge spremenljivke.
Odvisne in neodvisne spremenljivkeBrez razlikeObe spremenljivki sta različni.
OznačujeKorelacijski koeficient kaže, v kolikšni meri se dve spremenljivki premikata skupaj.Regresija kaže vpliv spremembe enote znane spremenljivke (x) na ocenjeno spremenljivko (y).
CiljDa bi našli numerično vrednost, ki izraža razmerje med spremenljivkami.Oceniti vrednosti naključne spremenljivke na podlagi vrednosti fiksne spremenljivke.

Opredelitev korelacije

Izraz korelacija je kombinacija dveh besed "Co" (skupaj) in razmerja (povezava) med dvema količinama. Korelacija je, kadar v času preučevanja dveh spremenljivk opazimo, da se sprememba enote ene spremenljivke ponovno prikaže z enakovredno spremembo druge spremenljivke, to je neposredno ali posredno. Ali drugače, za spremenljivke pravijo, da niso povezane, če gibanje v eni spremenljivki ne pomeni nobenega premika v drugi spremenljivki v določeni smeri. To je statistična tehnika, ki predstavlja moč povezave med pari spremenljivk.

Korelacija je lahko pozitivna ali negativna. Ko se obe spremenljivki premikata v isto smer, to pomeni, da bo povečanje ene spremenljivke povzročilo ustrezno povečanje druge spremenljivke in obratno, se šteje, da so spremenljivke pozitivno povezane. Na primer: dobiček in naložbe.

Nasprotno, ko se dve spremenljivki gibljeta v različnih smereh, tako da bo povečanje ene spremenljivke povzročilo zmanjšanje druge spremenljivke in obratno, je ta položaj znan kot negativna korelacija. Na primer: Cena in povpraševanje po izdelku.

Ukrepi korelacije so navedeni pod:

  • Karl Pearson-ov koeficient korelacije produktnega trenutka
  • Spearmanov koeficient korelacije
  • Scatter diagram
  • Koeficient sočasnih odstopanj

Opredelitev regresije

Statistična tehnika za oceno spremembe spremenljivke, odvisne od metrike, zaradi spremembe ene ali več neodvisnih spremenljivk, ki temelji na povprečnem matematičnem razmerju med dvema ali več spremenljivkami, je znana kot regresija. Ima pomembno vlogo v številnih človeških dejavnostih, saj je močno in prilagodljivo orodje, ki se uporablja za napovedovanje preteklih, sedanjih ali prihodnjih dogodkov na podlagi preteklih ali sedanjih dogodkov. Na primer: Na podlagi preteklih evidenc je mogoče oceniti prihodnji dobiček podjetja.

V preprosti linearni regresiji obstajata dve spremenljivki x in y, pri čemer je y odvisen od x ali recimo, na katerega vpliva x. Tu se y imenuje kot odvisna ali merila spremenljivk in x je neodvisna ali prediktorjeva spremenljivka. Vrstica regresije y na x je izražena kot pod:

y = a + bx

kjer je a = konstanta,
b = koeficient regresije,
V tej enačbi sta a in b dva regresijska parametra.

Ključne razlike med korelacijo in regresijo

Spodnje točke podrobno razlagajo razliko med korelacijo in regresijo:

  1. Statistični ukrep, ki določa soodnos ali povezanost dveh količin, je znan kot Korelacija. Regresija opisuje, kako je neodvisna spremenljivka številčno povezana z odvisno spremenljivko.
  2. Korelacija se uporablja za predstavljanje linearnega razmerja med dvema spremenljivkama. Nasprotno, regresija se uporablja za prilagoditev najboljše črte in oceno ene spremenljivke na podlagi druge spremenljivke.
  3. Pri korelaciji ni razlike med odvisnimi in neodvisnimi spremenljivkami, tj. Korelacija med x in y je podobna y in x. Nasprotno pa je regresija y na x drugačna od x na y.
  4. Korelacija kaže na moč povezanosti spremenljivk. Regresija nasprotno od odseva vpliv spremembe enote neodvisne spremenljivke na odvisno spremenljivko.
  5. Cilj korelacije je iskanje numerične vrednosti, ki izraža razmerje med spremenljivkami. Za razliko od regresije, katere cilj je predvideti vrednosti naključne spremenljivke na podlagi vrednosti fiksne spremenljivke.

Zaključek

Z zgornjo razpravo je razvidno, da obstaja velika razlika med tema dvema matematičnima pojmoma, čeprav se ta dva preučujeta skupaj. Korelacija se uporablja, kadar želi raziskovalec vedeti, ali so spremenljive raziskave povezane ali ne, če je odgovor, kakšna je moč njihove povezave. Pearsonov korelacijski koeficient velja za najboljše merilo korelacije. V regresijski analizi se vzpostavi funkcionalno razmerje med dvema spremenljivkama, da se lahko v prihodnosti napovedujejo dogodki.