Forskel mellem prøvevariant og populationsvariation Forskel mellem

Anonim

Forklaring

I statistikken benævnes prøveudtagning henviser til udvælgelse af en del af aggregerede statistiske data med det formål at opnå relevant information om hele. Den samlede eller samlede statistiske information om en bestemt karakter af alle de medlemmer, der er omfattet af undersøgelsen, kaldes "befolkning" eller "univers". (Das, N. G., 2010). Den valgte del af befolkningen, der bruges til at opnå karakteristika for befolkningen eller universet, betegnes som "prøve". Befolkningen er taget af enkelte enheder eller medlemmer, og nogle af enhederne er inkluderet i prøven. Samlet antal enheder af befolkningen hedder befolkningsstørrelse, og den af ​​prøven kaldes prøvestørrelse. Befolkning og prøve kan være endelige eller uendelige, og de kan ligeledes eksistere eller hypotetiske.

Variance: Variance er en numerisk værdi, der viser, hvor bredt de enkelte tal i et sæt data distribuerer sig om gennemsnittet. Det er så langt hvert tal er fra middelværdien og dermed fra hinanden. En variant af nulværdi betyder, at alle data er ens. Mere variansen, mere er værdierne spredt ud om gennemsnitlige og dermed fra hinanden. Mindre varians, mindre er værdierne spredt ud om gennemsnit, dermed fra hinanden, og varians kan ikke være negativ.

Forskel mellem populationsvariation og prøvevariation

Hovedforskellen mellem populationsvariation og prøvevariation vedrører variansberegning. Variansen beregnes i fem trin. Første middel er beregnet, så beregner vi afvigelser fra middelværdien, og for det tredje er afvigelserne kvadreret, for det fjerde summeres de kvadreret afvigelser og til sidst deles summen af ​​antallet af elementer, for hvilke variansen beregnes. Således variance = Σ (xi-x -) / n. Hvor xi = ith. Nummer, x- = middel og n = antal emner …

Nu, når variansen skal beregnes ud fra befolkningsdata, er n lig med antallet af elementer. Således, hvis variationen i blodtryk hos alle de 1000 personer skal beregnes ud fra data om blodtryk hos alle 1000 personer, så n = 1000. Men når variansen beregnes ud fra prøvedata, skal 1 fratrækkes n, inden der deles summen af ​​de kvadratiske afvigelser. Således i eksemplet ovenfor, hvis prøvedata har 100 poster, vil nævneren være 100 - 1 = 99.

På grund af dette er værdien af ​​varians beregnet ud fra prøvedata højere end den værdi, der kunne være fundet ud af befolkningsdata. Logikken med at gøre det er at kompensere vores manglende information om befolkningsdataene. Det er umuligt at finde ud af variationer i højder hos mennesker, for vores absolutte mangel på information om højder hos alle levende mennesker, for ikke at tale om fremtiden.Selv hvis vi tager et moderat eksempel, som befolkningsdata på højder af alle de levende mænd i USA, er det fysisk muligt, men omkostningerne og den tid, der er involveret i dette, vil besejre formålet med beregningen. Dette er grunden til, at stikprøvedata tages for de fleste statistiske formål, og det ledsages af manglende information om flertallet af data. For at kompensere dette er værdien af ​​varians og standardafvigelse, som er kvadreret af varians, højere i tilfælde af prøvedata end variation fra populationsdata.

Dette fungerer som et automatisk skjold for analytikere og beslutningstagere. Logikken gælder for beslutninger om kapitalbudgettering, personlig og erhvervsmæssig finansiering, konstruktion, trafikstyring og mange anvendelige felter. Dette hjælper stakeholderen til at være på den sikre side, mens han træffer beslutning eller for andre påvirkninger.

Sammendrag: Befolkningsvariant refererer til værdien af ​​variansen, der beregnes ud fra befolkningsdata, og prøvevariancen er variansen beregnet ud fra prøvedata. På grund af denne værdien af ​​nævneren i formel for varians i tilfælde af prøvedata er 'n-1', og det er 'n' for befolkningsdata. Som følge heraf er både varians og standardafvigelse afledt af prøvedata mere end dem, der er fundet ud fra befolkningsdata.