Forskel mellem regression og korrelation: regression vs korrelation sammenlignet

Anonim

Regression vs korrelation

I statistik, bestemmelse Forholdet mellem to tilfældige variabler er vigtigt. Det giver evnen til at lave forudsigelser om en variabel i forhold til andre. Regressionsanalyse og korrelation anvendes i vejrudsigter, finansmarkedsadfærd, etablering af fysiske relationer med eksperimenter og i meget mere virkelige verdensscenarier.

Hvad er regression?

Regression er en statistisk metode, der bruges til at tegne forholdet mellem to variabler. Ofte når data indsamles, kan der være variabler, som er afhængige af andre. Det nøjagtige forhold mellem disse variabler kan kun etableres ved hjælp af regressionsmetoderne. At bestemme dette forhold hjælper med at forstå og forudsige adfærden af ​​en variabel til den anden.

Mest anvendte regressionsanalyser er at estimere værdien af ​​den afhængige variabel for en given værdi eller rækkevidde af værdier af de uafhængige variabler. Ved hjælp af regression kan vi for eksempel fastslå forholdet mellem råvarepris og forbrug baseret på data indsamlet fra en tilfældig prøve. Regressionsanalyse producerer regressionsfunktionen i et datasæt, hvilket er en matematisk model, som bedst passer til de tilgængelige data. Dette kan let repræsenteres af et scatterplot. Grafisk er regression ækvivalent med at finde den bedste passende kurve for det givne datasæt. Kurvens funktion er regressionsfunktionen. Ved hjælp af den matematiske model kan efterspørgslen fra en vare forudsiges til en given pris.

Derfor anvendes regressionsanalysen i vid udstrækning til forudsigelse og prognoser. Det bruges også til at etablere relationer i eksperimentelle data inden for fysik, kemi og mange naturvidenskabelige og tekniske discipliner. Hvis forholdet eller regressionsfunktionen er en lineær funktion, er processen kendt som en lineær regression. I scatter plot kan den repræsenteres som en lige linje. Hvis funktionen ikke er en lineær kombination af parametrene, er regressionen ikke-lineær.

Hvad er korrelation?

Korrelation er et mål for styrken af ​​forholdet mellem to variabler. Korrelationskoefficienten kvantificerer graden af ​​ændring i en variabel baseret på ændringen i den anden variabel. I statistikken er korrelation forbundet med begrebet afhængighed, hvilket er det statistiske forhold mellem to variabler.

Pearsons korrelationskoefficient eller kun korrelationskoefficienten r er en værdi mellem -1 og 1 (-1≤r≤ + 1). Det er den mest anvendte korrelationskoefficient og er kun gyldig for et lineært forhold mellem variablerne. Hvis r = 0, eksisterer der intet forhold, og hvis r≥0 er forholdet direkte proportionalt; jeg. e. værdien af ​​en variabel stiger med stigningen af ​​den anden. Hvis r≤0 er forholdet omvendt proportional; jeg. e. en variabel falder som den anden øges.

På grund af linearitetsbetingelsen kan korrelationskoefficienten r også anvendes til at fastslå tilstedeværelsen af ​​et lineært forhold mellem variablerne.

Hvad er forskellen mellem regression og korrelation?

Regression giver formen af ​​forholdet mellem to tilfældige variabler, og korrelationen giver forholdets styrke.

Regressionsanalyse producerer en regressionsfunktion, som hjælper med at ekstrapolere og forudsige resultater, mens korrelation kun kan give information om, hvilken retning det kan ændre sig.

De mere præcise lineære regressionsmodeller er givet ved analysen, hvis korrelationskoefficienten er højere. (| r | ≥0. 8)