Forskel mellem befolkning og stikprøvestandardafvigelse
Befolkning vs prøve standardafvigelse
I statistikker anvendes flere indekser til at beskrive et datasæt svarende til dens centrale tendens, spredning og skævhed. Standardafvigelse er et af de mest almindelige målinger af spredning af data fra datasættets centrum.
På grund af praktiske vanskeligheder vil det ikke være muligt at udnytte data fra hele befolkningen, når en hypotese testes. Derfor anvender vi dataværdier fra prøver for at frembringe afledninger om befolkningen. I en sådan situation kaldes disse estimatorer, da de estimerer befolkningsparameterværdierne.
Det er ekstremt vigtigt at bruge upartiske estimatorer i inference. En estimator siges at være upartisk, hvis den forventede værdi af denne estimator er lig med befolkningsparameteren. For eksempel bruger vi stikprøveværdien som en upartisk estimator for populationsmiddelet. (Matematisk kan det påvises, at den forventede værdi af stikprøveværdien er lig med populationens gennemsnit). I tilfælde af estimering af befolkningsstandardafvigelsen er prøvestandardafvigelsen også en upartisk estimator.
Hvad er befolkningsstandardafvigelse?
Når data fra hele befolkningen kan tages i betragtning (for eksempel i tilfælde af en folketælling) er det muligt at beregne befolkningsstandardafvigelsen. For at beregne standardafvigelsen for befolkningen beregnes først afvigelserne af dataværdier fra populationens middelværdi. Rødmiddelkvadratet (kvadratisk gennemsnit) af afvigelser kaldes populationsstandardafvigelsen.
I en klasse på 10 studerende kan data om eleverne nemt indsamles. Hvis der testes en hypotese på denne population af studerende, er der ikke behov for at anvende prøveværdier. For eksempel måles vægten af de 10 elever (i kg) til 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Så er den gennemsnitlige vægt af de ti personer (i kilo) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, hvilket er 71 (i kilogram). Dette er befolkningens middelværdi.
For at beregne befolkningsstandardafvigelsen beregner vi afvigelser fra middelværdien. De respektive afvigelser fra middelværdien er (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 og (79 - 71) = 8. Summen af kvadrater af afvigelse er -1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 < + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Befolkningsstandardafvigelsen er √ (366/10) = 6,05 (i kg). 71 er den nøjagtige middelvægt af eleverne i klassen og 6.05 er den nøjagtige standardafvigelse fra vægt fra 71. Hvad er prøve standardafvigelse?
Når data fra en prøve (af størrelse n) bruges til at estimere befolkningens parametre, beregnes prøvestandardafvigelsen. For det første beregnes afvigelserne af dataværdier fra middelværdien. Da prøveværdien er anvendt i stedet for populationsmiddelet (hvilket er ukendt), er det ikke hensigtsmæssigt at tage det kvadratiske middel. For at kompensere for brugen af prøve gennemsnit er summen af kvadraterne af afvigelser opdelt af (n-1) i stedet for n. Prøvestandardafvigelsen er kvadratroden af dette. I matematiske symboler er S = √ (Σ (x
i -ẍ) 2 / (n-1)}, hvor S er prøve standardafvigelsen, ẍ er prøven gennemsnit og x i s er datapunkterne. Antag nu, at befolkningen i det foregående eksempel er eleverne i hele skolen. Så vil klassen kun være en prøve. Hvis denne prøve anvendes i estimatet, vil prøveafvigelsen være √ (366/9) = 6.38 (i kg), idet 366 blev divideret med 9 i stedet for 10 (stikprøvestørrelsen). Det faktum at observere er, at dette ikke er garanteret at være den nøjagtige standardværdiforvigelsesværdi. Det er kun et skøn for det.
Hvad er forskellen mellem populationsstandardafvigelse og prøvestandardafvigelse?