Linearna proti logistični regresiji
Pri statistični analizi je pomembno ugotoviti razmerje med spremenljivkami, ki jih zadeva študija. Včasih je to lahko edini namen analize. Eno močno orodje za ugotavljanje obstoja odnosa in prepoznavanje razmer je regresijska analiza.
Najpreprostejša oblika regresijske analize je linearna regresija, kjer je razmerje med spremenljivkami linearno razmerje. V statističnem smislu razkriva razmerje med pojasnjevalno spremenljivko in spremenljivko odziva. Na primer s pomočjo regresije lahko na podlagi podatkov, zbranih iz naključnega vzorca, ugotovimo razmerje med ceno blaga in porabo. Regresijska analiza bo ustvarila regresijsko funkcijo nabora podatkov, ki je matematični model, ki najbolje ustreza razpoložljivim podatkom. To lahko enostavno predstavimo s parcelo. Grafična regresija je enakovredna iskanju najboljše prilagodljive krivulje za dani niz podatkov. Funkcija krivulje je regresijska funkcija. Z uporabo matematičnega modela je mogoče za določeno ceno predvideti uporabo blaga.
Zato se regresijska analiza pogosto uporablja pri napovedovanju in napovedovanju. Uporablja se tudi za določitev razmerij v eksperimentalnih podatkih na področju fizike, kemije ter v mnogih naravoslovnih in inženirskih disciplinah. Če je odnos ali regresijska funkcija linearna funkcija, potem je postopek znan kot linearna regresija. V razcepu se lahko predstavlja kot ravna črta. Če funkcija ni linearna kombinacija parametrov, je regresija nelinearna.
Logistična regresija je primerljiva z multivariatno regresijo in ustvarja model za razlago vpliva več prediktorjev na spremenljivko odziva. Vendar mora biti v logistični regresiji spremenljivka končnega rezultata kategorična (običajno razdeljena; to je par dosegljivih rezultatov, kot sta smrt ali preživetje, čeprav posebne tehnike omogočajo modeliranje bolj kategoriziranih informacij). Neprekinjena spremenljivka rezultatov se lahko spremeni v kategorično spremenljivko, ki se uporablja za logistično regresijo; vendar se strinjanje neprekinjenih spremenljivk na ta način večinoma odvrača, ker zmanjšuje natančnost.
Za razliko od linearne regresije, glede na srednjo vrednost, napovedovalskih spremenljivk v logistični regresiji ni treba prisiliti v linearno povezavo, skupno porazdelitev ali v enakovredno odstopanje znotraj vsake skupine. Kot rezultat, razmerje med napovednikom in izhodnimi spremenljivkami verjetno ne bo linearna funkcija.
Kakšna je razlika med logistično in linearno regresijo?
• Pri linearni regresiji se domneva linearna relacija med pojasnjevalno spremenljivko in odzivno spremenljivko, parametri, ki izpolnjujejo model, pa z analizo ugotovijo natančno razmerje.
• Za kvantitativne spremenljivke se izvede linearna regresija in posledična funkcija je kvantitativna.
• V logistični regresiji so uporabljeni podatki lahko kategorični ali količinski, rezultat pa je vedno kategoričen.