Forskel mellem T-TEST og ANOVA Forskel mellem

Anonim

T-TEST vs. ANOVA

Indsamling og beregning af statistiske data for at erhverve gennemsnittet er ofte en lang og kedelig proces. T-testen og envejsanalysen af ​​varians (ANOVA) er de to mest almindelige test, der anvendes til dette formål.

T-testen er en statistisk hypotesetest, hvor teststatistik følger en Students t-distribution, hvis nulhypotesen understøttes. Denne test anvendes, når teststatistik følger en normal fordeling, og værdien af ​​en skaleringsperiode i teststatistik er kendt. Hvis skaleringstiden er ukendt, erstattes den derefter af et skøn baseret på de tilgængelige data. Teststatistik vil følge en Students t-distribution.

William Sealy Gosset introducerede t-statistikken i 1908. Gosset var kemiker for Guinness bryggeriet i Dublin, Irland. Guinness-bryggeriet havde politikken med at rekruttere de bedste kandidater fra Oxford og Cambridge og vælge fra dem, der kunne levere ansøgninger om biokemi og statistik til virksomhedens etablerede industriprocesser. William Sealy Gosset var en sådan kandidat. I processen udviklede William Sealy Gosset t-testen, som oprindeligt var tænkt som en måde at overvåge kvaliteten af ​​stout (den mørke øl bryggeriet producerer) på en omkostningseffektiv måde. Gosset offentliggjorde testen under pennens navn 'Student' i Biometrika omkring 1908. Årsagen til pennens navn var Guinness 'insistering, da selskabet ønskede at holde deres politik om at udnytte statistikker som en del af deres' handelshemmeligheder '.

T-teststatistik følger generelt formularen T = Z / s, hvor Z og s er dataens funktioner. Z-variablen er designet til at være følsom for den alternative hypotese; Effekten af ​​Z-variablen er faktisk større, når den alternative hypotese er sand. I mellemtiden er 's' en skaleringsparameter, der gør det muligt at bestemme fordelingen af ​​T. De antagelser, der ligger til grund for en t-test, er at a) Z følger en normal normalfordeling under nullhypotesen; b) ps2 følger en Ï ‡ 2 fordeling med p frihedsgrader under null hypotesen (hvor p er en positiv konstant); og c) Z-værdien og s-værdien er uafhængige. I en bestemt type t-test er disse forhold konsekvenser af den befolkning, der studeres, samt den måde, hvorpå dataene samples.

På den anden side er analysen af ​​varians (ANOVA) en samling af statistiske modeller. Mens ANOVA's principper har været brugt af forskere og statistikere i lang tid, var det først i 1918, at Sir Ronald Fisher lavede et forslag om at formalisere variansanalysen i en artikel med titlen "Korrelationen mellem slægtninge ved tilstedeværelsen af ​​Mendelian Arv".Siden da er ANOVA blevet udvidet i sit anvendelsesområde og anvendelsesområde. ANOVA er faktisk en misdannelse, da den ikke er afledt af forskellene i afvigelser, men snarere af forskellene mellem grupper af grupper. Den indeholder de tilhørende procedurer, hvor den observerede varians i en bestemt variabel er opdelt i komponenter, som kan henføres til forskellige kilder til variation.

I hovedsagen giver en ANOVA en statistisk test for at bestemme, om midlerne fra flere grupper er alle ens, og som et resultat generaliserer t-test til mere end to grupper. En ANOVA kan være mere nyttig end en to-prøve t-test, da den har en mindre chance for at begå en type I-fejl. For eksempel ville have flere to-prøve-t-tests have større chance for at begå en fejl end en ANOVA af de samme variable involveret for at opnå gennemsnittet. Modellen er den samme, og teststatistik er F-forholdet. I enklere vendinger er t-test bare et specielt tilfælde af ANOVA: at gøre en ANOVA vil få det samme resultat af flere t-test. Der er tre klasser af ANOVA modeller: a) Faste effekter modeller, der antager dataene kommer fra normale populationer, kun adskiller sig på deres måde; b) Tilfældige virkningsmodeller, der antager dataene, beskriver et hierarki af varierende populationer, hvis forskelle er begrænset af hierarkiet; og c) Mixed-effect modeller, der er situationer, hvor både de faste og tilfældige effekter er til stede.

Sammendrag:

  1. T-testen bruges til at bestemme, om to gennemsnit eller midler er ens eller forskellige. ANOVA foretrækkes ved sammenligning af tre eller flere gennemsnit eller midler.
  2. En t-test har større sandsynlighed for at begå en fejl, jo flere midler anvendes, hvorfor ANOVA bruges ved sammenligning af to eller flere midler.