Forskel mellem regression og ANOVA: regression vs ANOVA sammenlignet

Anonim

Regression vs ANOVA

Regression og ANOVA (Variansanalyse) er to metoder i den statistiske teori til at analysere adfærden af ​​en variabel i forhold til en anden. I regression er det ofte variationen af ​​afhængig variabel baseret på uafhængig variabel, mens det i ANOVA er variationen af ​​attributterne af to prøver fra to populationer.

Mere om regression

Regression er en statistisk metode, der bruges til at tegne forholdet mellem to variabler. Ofte når data indsamles, kan der være variabler, som er afhængige af andre. Det nøjagtige forhold mellem disse variabler kan kun etableres ved hjælp af regressionsmetoder. At bestemme dette forhold hjælper med at forstå og forudsige adfærden af ​​en variabel til den anden.

Den mest almindelige anvendelse af regressionsanalysen er at estimere værdien af ​​den afhængige variabel for en given værdi eller rækkevidde af de afhængige variabler. Ved hjælp af regression kan vi for eksempel fastslå forholdet mellem råvarepris og forbrug baseret på data indsamlet fra en tilfældig stikprøve. Regressionsanalyse vil producere en regressionsfunktion af datasættet, hvilket er en matematisk model, som bedst passer til de tilgængelige data. Dette kan let repræsenteres af et scatterplot. Grafisk regression svarer til at finde den bedste passende kurve for det givne datasæt. Kurvens funktion er regressionsfunktionen. Ved hjælp af den matematiske model kan brugen af ​​en vare forudsiges til en given pris.

Derfor anvendes regressionsanalysen i vid udstrækning til forudsigelse og prognoser. Det bruges også til at etablere relationer i eksperimentelle data inden for fysik, kemi og mange naturvidenskabelige og tekniske discipliner. Hvis forholdet eller regressionsfunktionen er en lineær funktion, er processen kendt som en lineær regression. I scatter plot kan den repræsenteres som en lige linje. Hvis funktionen ikke er en lineær kombination af parametrene, er regressionen ikke-lineær.

Mere om ANOVA (Variansanalyse)

ANOVA indebærer ikke eksplicit analyse af en relation mellem to eller flere variabler. Det kontrollerer snarere, om to eller flere prøver fra forskellige populationer har samme gennemsnit. For eksempel overveje testresultaterne af en eksamensbevis for en karakter i skolen. Selv om testene er forskellige, kan præstationer være ens fra klasse til klasse. En metode til at verificere dette er ved at sammenligne midlerne til hver klasse.ANOVA eller Analysis Of Variance tillader denne hypotese at blive testet. I det grundlæggende kan ANOVA betragtes som en forlængelse af t-testen, hvor midlerne fra de to prøver, der er trukket fra to populationer, sammenlignes.

Grundlæggende ide om ANOVA er at overveje variationen i prøven og variationen mellem prøverne. Variationen inden for prøven kan tilskrives tilfældigheden, mens variationen mellem prøver kan tilskrives både tilfældighed og andre eksterne faktorer. Variationsanalysen er baseret på tre modeller; fast effekter model, tilfældige effekter model og mixed effects model.

Hvad er forskellen mellem regression og ANOVA?

• ANOVA er analysen af ​​variation mellem to eller flere prøver, mens regression er analysen af ​​en relation mellem to eller flere variabler.

• ANOVA-teorien anvendes ved hjælp af tre grundlæggende modeller (model med faste effekter, random effects model og mixed effects model), mens regression anvendes med to modeller (lineær regressionsmodel og multipel regressionsmodel).

• ANOVA og regression er begge to versioner af den generelle lineære model (GLM). ANOVA er baseret på kategoriske forudsigelsesvariabler, mens regression er baseret på kvantitative forudsigelsesvariabler.

• Regression er den mere fleksible teknik, og den bruges til prognoser og forudsigelser, mens ANOVA bruges til at sammenligne ligestilling mellem to eller flere populationer.