Razlika med T-TEST in ANOVA

T-TEST v primerjavi z ANOVO

Zbiranje in izračun statističnih podatkov za pridobitev povprečne vrednosti je pogosto dolg in mučen postopek. T-test in enosmerna analiza variance (ANOVA) sta dva najpogostejša testa, ki se uporabljata v ta namen.

T-test je test statistične hipoteze, kjer testna statistika sledi študentovi razdelitvi t, če je ničelna hipoteza podprta. Ta preskus se uporablja, kadar testna statistika sledi normalni porazdelitvi in ​​je znana vrednost terminala skaliranja v testni statistiki. Če izraz za skaliranje ni znan, ga nato nadomestimo z oceno na podlagi razpoložljivih podatkov. Testna statistika bo sledila študentovi t-distribuciji.

William Sealy Gosset je predstavil t-statistiko leta 1908. Gosset je bil kemik pivovarne Guinness v Dublinu na Irskem. Guinnessova pivovarna je vodila politiko zaposlovanja najboljših diplomantov iz Oxforda in Cambridgea, izbirala je med tistimi, ki bi lahko zagotovili uporabo biokemije in statistike za uveljavljene industrijske procese podjetja. William Sealy Gosset je bil eden takšnih diplomantov. V tem procesu je William Sealy Gosset zasnoval t-test, ki je bil prvotno zasnovan kot način spremljanja kakovosti stout (temnega piva, ki ga pivovarna proizvaja) na stroškovno učinkovit način. Gosset je test objavil pod imenom peresa "Student" v Biometriki, okoli leta 1908. Razlog za ime peresa je Guinnessovo vztrajanje, saj je podjetje želelo ohraniti svojo politiko uporabe statistike kot del svojih "poslovnih skrivnosti"..

Statistični podatki T-testa običajno sledijo obliki T = Z / s, kjer sta Z in s funkcije podatkov. Spremenljivka Z je zasnovana tako, da je občutljiva na alternativno hipotezo; Če je alternativna hipoteza resnična, je velikost spremenljivke Z večja. Medtem je 's' parameter za skaliranje, ki omogoča določitev porazdelitve T. Predpostavke, na katerih temelji t-test, so: a) Z sledi običajni normalni porazdelitvi pod ničelno hipotezo; b) ps2 sledi razdelitvi Ï 2 s p stopinjami svobode pod ničelno hipotezo (kjer je p pozitivna konstanta); in c) vrednost Z in s sta neodvisna. Pri določeni vrsti t-testa so ti pogoji posledice populacije, ki se preučuje, pa tudi načina vzorčenja podatkov..

Po drugi strani je analiza variance (ANOVA) zbirka statističnih modelov. Medtem ko so raziskovalci in statistiki že dolgo uporabljali načela ANOVA, je šele leta 1918 sir Ronald Fisher v članku z naslovom "Korelacija med sorodniki o domnevi mendeljskega dedovanja" pripravil predlog za formalizacijo variacijske analize. . Od takrat se je ANOVA razširila na področje uporabe in uporabe. ANOVA je pravzaprav napačno ime, saj ne izhaja iz razlik v variantah, ampak iz razlik med sredstvi skupin. Vključuje pridružene postopke, pri katerih je opažena odstopanja v določeni spremenljivki razdeljena na komponente, ki jih je mogoče pripisati različnim virom variacije.

V bistvu ANOVA zagotavlja statistični test, s katerim se ugotovi, ali so sredstva iz več skupin enaka in posledično posploši t-test na več kot dve skupini. ANOVA je lahko bolj uporaben kot t-test z dvema vzorcema, saj ima manjše možnosti, da bi naredil napako tipa I. Na primer, če bi imeli večkratni dve vzorčni t-testi, bi imeli večjo možnost, da bi naredili napako kot ANOVA istih spremenljivk, ki so vključene, da bi dosegle povprečje. Model je enak, testna statistika pa razmerje F. Preprosteje povedano, t-testi so le poseben primer ANOVE: če ANOVA izvede enak rezultat več t-testov. Obstajajo trije razredi modelov ANOVA: a) modeli s fiksnimi učinki, ki predpostavljajo, da podatki prihajajo iz običajnih populacij, ki se razlikujejo le v svojih sredstvih; b) modeli naključnih učinkov, ki predpostavljajo, da podatki opisujejo hierarhijo različnih populacij, katerih razlike omejuje hierarhija; in c) modele z mešanim učinkom, ki so prisotni tako s fiksnimi kot tudi naključnimi učinki.

Povzetek:

  1.  T-test se uporablja pri določanju, ali sta dve povprečni ali enaki ali enaki. ANOVA je prednostna pri primerjavi treh ali več povprečnih vrednosti.
  2.  T-test ima več možnosti, da naredi napako, več sredstev se uporablja, zato se ANOVA uporablja pri primerjavi dveh ali več načinov.