Forskel mellem middel, median og mode: middel vs median vs mode
Middel vs Median vs Mode
Middel, median og mode er de primære målinger af central tendens anvendt i beskrivende statistikker. De er helt forskellige fra hinanden, og tilfælde, hvor de bruges til at opsummere dataene, er også forskellige.
Middelværdi
Det aritmetiske gennemsnit er summen af dataværdier divideret med antallet af dataværdier, i. e.
Hvis dataene er fra et prøverum, kaldes det en sample mean (
), som er en beskrivende statistik for prøven. Selvom det er den mest almindeligt anvendte beskrivende foranstaltning for en prøve, er det ikke en robust statistik. Det er meget følsomt over for outliers og svingninger.F.eks. Overvej den gennemsnitlige indkomst for borgerne i en bestemt by. Da alle dataværdierne summeres og divideres, påvirker indkomsten af en ekstremt velhavende person betydeligt betydeligt. Derfor er middelværdierne ikke altid en god repræsentation af dataene.
Også i tilfælde af et vekslende signal varierer strømmen, der passerer gennem et element, periodisk fra positiv retning til negativ retning og omvendt. Hvis vi tager den gennemsnitlige strøm gennem elementet i en enkelt periode, vil den give en 0, hvilket betyder at ingen strøm har passeret gennem elementet, hvilket åbenbart ikke er sandt. Derfor er i dette tilfælde også aritmetisk middel ikke et godt mål.
Det aritmetiske gennemsnit er en god indikator, når dataene er jævnt fordelt. For en normal fordeling er gennemsnittet lig med mode og median. Det har også de laveste rester, når man overvejer den rotte gennemsnitlige kvadratfeil; derfor den bedste beskrivende foranstaltning, når det er nødvendigt at repræsentere et datasæt ved et enkelt nummer.
Median
Værdierne for det midterste datapunkt efter at have arrangeret alle dataværdierne i stigende rækkefølge er defineret som datasætets median. Median er 2. kvartil, 5. decil og 50. percentil.
• Hvis antallet af observationer (datapunkter) er mærkeligt, er medianen observationen nøjagtigt midt på den ordnede liste.
• Hvis antallet af observationer (datapunkter) er ens, er medianen middelværdien af de to midterste observationer i den ordnede liste.
Median deler observationen i to grupper; jeg. e. en gruppe (50%) af værdier højere og en gruppe (50%) af værdier lavere end medianen. Medianer anvendes specifikt i skæv fordeling og repræsenterer data ret bedre end det aritmetiske gennemsnit.
Mode
Mode er det mest forekommende tal i et sæt observationer.Modus for et datasæt beregnes ved at finde frekvensen af hvert element i sæt.
• Hvis der ikke er nogen værdi mere end en gang, har datasættet ingen tilstand.
• Ellers er enhver værdi, der forekommer med højeste frekvens, en tilstand for datasættet.
Mere end 1 tilstand kan eksistere i et sæt; Derfor er mode ikke en unik statistik for et datasæt. I en ensartet fordeling er der en tilstand. Modellen af en diskret sandsynlighedsfordeling er det punkt, hvor sandsynlighedsmassefunktionen når sit højeste punkt. Ud fra ovenstående fortolkninger kan vi sige, at globale maksima er tilstande.
Overvej anvendelsen af alle tre foranstaltninger til følgende datasæt.
DATA: {1, 1, 2, 3, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Middel = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8. 12
Median = 9 (13. element)
Mode = 9 (frekvens 9 = 5)
Hvad er forskellen mellem middel, median og tilstand?
• Aritmetisk gennemsnit er summen af værdierne (observationer) divideret med antallet af observationer. Det er ikke en robust statistik, og er stærkt afhængig af den normale fordelings natur inden for den overvejede fordeling. En enkelt outlier kan forårsage et signifikant skift i middelværdien, hvilket giver relativt vildledende værdier. Konceptet kan udvides til geometrisk gennemsnit, harmonisk gennemsnit, vægtet middel og så videre.
• Median er middelværdierne for sættet af observationer, og det er relativt mindre påvirket af outliers. Det kan give et godt estimat som den sammenfattende statistik i meget skevede tilfælde.
• Modus er de mest almindelige observationsværdier i datasættet. Hvis fordelingen er positivt skæv, ligger tilstanden tilbage til medianen, og hvis negativ skævt ligger tilstanden lige til medianen.
• Hvis det er positivt skævt, er medianen ret til medianen; hvis negativt skæv betyder betyder til venstre for medianen.
• I den normale fordeling er alle tre, middel, mode og mediane ens.