Det kurtose eller kurtosis Det er en statistisk parameter, der tjener til at karakterisere sandsynlighedsfordelingen af en tilfældig variabel, der angiver graden af koncentration af værdierne omkring det centrale mål. Dette er også kendt som "peak grade".
Udtrykket kommer fra det græske "kurtos", hvilket betyder buet, derfor indikerer kurtosen graden af pegning eller udfladning af fordelingen, som det ses i følgende figur:
Næsten alle værdierne for en tilfældig variabel har tendens til at samle sig omkring en central værdi som gennemsnittet. Men i nogle fordelinger er værdierne mere spredte end i andre, hvilket resulterer i fladere eller tyndere kurver..
Artikelindeks
Kurtosen er en numerisk værdi, der er typisk for hver frekvensfordeling, der ifølge koncentrationen af værdierne omkring middelværdien er klassificeret i tre grupper:
-Leptokurtic: hvor værdierne er stærkt grupperet omkring middelværdien, så fordelingen er ret spids og slank, (figur 1 til venstre).
-Mesocúrtic: har en moderat koncentration af værdier omkring gennemsnittet (figur 1 i midten).
-Platicúrtica: Denne fordeling har en bredere form, da værdierne har tendens til at være mere spredte (figur 1 til højre).
Kurtosen kan have enhver værdi uden begrænsninger. Dens beregning udføres afhængigt af den måde, hvorpå dataene leveres. Notationen, der anvendes i hvert tilfælde, er følgende:
-Kurtosis-koefficient: gto
-Aritmetisk gennemsnit: X eller x med bjælke
-En i-værdi: xjeg
-Standardafvigelsen: σ
-Antallet af data: N
-Frekvensen af den i-værdi: Fjeg
-Klassemærke: mxjeg
Med denne notation præsenterer vi nogle af de mest anvendte formler til at finde kurtosis:
Også kaldet Fishers pege koefficient eller Fisher-foranstaltning, tjener til at sammenligne den undersøgte distribution med den normale distribution.
Når den overskydende kurtose er 0, er vi i nærværelse af en normalfordeling eller Gaussisk klokke. På denne måde sammenligner vi faktisk hver gang den overskydende kurtose af en distribution beregnes med normalfordelingen.
For både ikke-grupperede og samlede data er Fishers pegekoefficient, betegnet med K:
K = gto - 3
Nu kan det vises, at normalfordelingens kurtose er 3, hvis Fisher-pegekoefficienten er 0 eller tæt på 0, og der er en mesokúrtisk fordeling. Hvis K> 0 er fordelingen leptokurtisk, og hvis K<0 es platicúrtica.
Kurtosis er et mål for variation, der bruges til at karakterisere morfologien i en distribution. På denne måde kan symmetriske fordelinger sammenlignes med det samme gennemsnit og den samme spredning (givet ved standardafvigelsen)..
At have målinger af variabilitet sikrer, at gennemsnittene er pålidelige og hjælper med at kontrollere variationer i fordelingen. Lad os som et eksempel analysere disse to situationer.
Antag, at følgende graf viser lønfordelingen for 3 afdelinger i samme firma:
Kurve A er den tyndeste af alle, og ud fra dens form kan det udledes, at de fleste af afdelingenes lønninger er meget tæt på gennemsnittet, derfor får de fleste medarbejdere lignende kompensation.
På den anden side følger lønkurven i afdeling B en normalfordeling, da kurven er mesokurisk, hvor vi antager, at lønningerne var tilfældigt fordelt.
Og endelig har vi kurve C, som er meget flad, et tegn på, at lønområdet i denne afdeling er meget bredere end i de andre..
Antag nu, at de tre kurver i figur 2 repræsenterer resultaterne af en eksamen, der blev anvendt på tre grupper af studerende inden for samme emne.
Gruppen, hvis ratings er repræsenteret af den leptokurtiske kurve A, er ret homogen, flertallet opnåede en gennemsnitlig eller tæt vurdering.
Det er også muligt, at resultatet skyldtes, at testspørgsmålene havde nogenlunde samme sværhedsgrad.
På den anden side viser resultaterne af gruppe C en større heterogenitet i gruppen, som sandsynligvis indeholder gennemsnitlige studerende, nogle mere fordelagtige studerende og helt sikkert nogle mindre opmærksomme.
Eller det kan betyde, at testspørgsmålene havde meget forskellige sværhedsgrader.
Kurve B er mesokut, hvilket indikerer, at testresultaterne fulgte en normalfordeling. Dette er normalt den hyppigste sag.
Find Fishers scoringskoefficient for følgende karakterer, opnået i en fysikeksamen til en gruppe studerende med en skala fra 1 til 10:
5, 5, 4, 7, 7,7, 9, 8, 9, 4, 3
Følgende udtryk vil blive brugt til ikke-grupperede data givet i de foregående sektioner:
K = gto - 3
Denne værdi gør det muligt at kende distributionstypen.
At beregne gto Det er bekvemt at gøre det ordentligt trin for trin, da du skal løse flere aritmetiske operationer.
For det første beregnes gennemsnittet af karaktererne. Der er N = 11 data.
X = (5 + 5 + 4 + 7 + 7 + 7 + 9 + 8 + 9 + 4 + 3) / 11 = 6.182
Standardafvigelsen findes, som denne ligning bruges til:
σ = 1,992
Eller du kan også oprette en tabel, som også er påkrævet til næste trin, og hvor hver periode af de tilføjelser, der skal bruges, er skrevet, begyndende med (xjeg - X), derefter (xjeg - X)to og derefter (xjeg - X)4 :
Udfør det beløb, der er angivet i tælleren af formlen for gto. Til dette bruges resultatet af højre kolonne i den foregående tabel:
∑ (xjeg - X)4= 290,15
Derfor:
gto = (1/11) x 290,15 / 1,9924 = 1.675
Fishers pege-koefficient er:
K = gto - 3 = 1.675 - 3 = -1.325
Det, der er af interesse, er tegn på resultatet, som, når det er negativt, svarer til en platisk fordeling, som kan fortolkes som det, der blev gjort i det foregående eksempel: muligvis er det et heterogent kursus med studerende af forskellige grader af interesse eller eksamen spørgsmål var af forskellige sværhedsgrader.
Brugen af et regneark som Excel letter i høj grad løsningen af disse typer problemer og giver også mulighed for at tegne fordelingen.
Endnu ingen kommentarer