Kurtosis definition, typer, formler, hvad det er for eksempel

2182
Simon Doyle

Det kurtose eller kurtosis Det er en statistisk parameter, der tjener til at karakterisere sandsynlighedsfordelingen af ​​en tilfældig variabel, der angiver graden af ​​koncentration af værdierne omkring det centrale mål. Dette er også kendt som "peak grade".

Udtrykket kommer fra det græske "kurtos", hvilket betyder buet, derfor indikerer kurtosen graden af ​​pegning eller udfladning af fordelingen, som det ses i følgende figur:

Figur 1. Forskellige typer kurtose. Kilde: F. Zapata.

Næsten alle værdierne for en tilfældig variabel har tendens til at samle sig omkring en central værdi som gennemsnittet. Men i nogle fordelinger er værdierne mere spredte end i andre, hvilket resulterer i fladere eller tyndere kurver..

Artikelindeks

  • 1 Definition
  • 2 Formler og ligninger
    • 2.1 - Kurtosis i henhold til præsentationen af ​​dataene
  • 3 Hvad er kurtosis til?
    • 3.1 Lønningerne til 3 afdelinger
    • 3.2 Resultaterne af en eksamen
  • 4 Arbejdet eksempel på kurtosis
  • 5 Referencer

Definition

Kurtosen er en numerisk værdi, der er typisk for hver frekvensfordeling, der ifølge koncentrationen af ​​værdierne omkring middelværdien er klassificeret i tre grupper:

-Leptokurtic: hvor værdierne er stærkt grupperet omkring middelværdien, så fordelingen er ret spids og slank, (figur 1 til venstre).

-Mesocúrtic: har en moderat koncentration af værdier omkring gennemsnittet (figur 1 i midten).

-Platicúrtica: Denne fordeling har en bredere form, da værdierne har tendens til at være mere spredte (figur 1 til højre).

Formler og ligninger

Kurtosen kan have enhver værdi uden begrænsninger. Dens beregning udføres afhængigt af den måde, hvorpå dataene leveres. Notationen, der anvendes i hvert tilfælde, er følgende:

-Kurtosis-koefficient: gto

-Aritmetisk gennemsnit: X eller x med bjælke

-En i-værdi: xjeg

-Standardafvigelsen: σ

-Antallet af data: N

-Frekvensen af ​​den i-værdi: Fjeg

-Klassemærke: mxjeg

Med denne notation præsenterer vi nogle af de mest anvendte formler til at finde kurtosis:

- Kurtosis ifølge præsentationen af ​​dataene

Data ikke grupperet eller grupperet i frekvenser

Data grupperet i intervaller

Kurtosis overskydende

Også kaldet Fishers pege koefficient eller Fisher-foranstaltning, tjener til at sammenligne den undersøgte distribution med den normale distribution.

Når den overskydende kurtose er 0, er vi i nærværelse af en normalfordeling eller Gaussisk klokke. På denne måde sammenligner vi faktisk hver gang den overskydende kurtose af en distribution beregnes med normalfordelingen.

For både ikke-grupperede og samlede data er Fishers pegekoefficient, betegnet med K:

K = gto - 3

Nu kan det vises, at normalfordelingens kurtose er 3, hvis Fisher-pegekoefficienten er 0 eller tæt på 0, og der er en mesokúrtisk fordeling. Hvis K> 0 er fordelingen leptokurtisk, og hvis K<0 es platicúrtica.

Hvad er kurtosis til?

Kurtosis er et mål for variation, der bruges til at karakterisere morfologien i en distribution. På denne måde kan symmetriske fordelinger sammenlignes med det samme gennemsnit og den samme spredning (givet ved standardafvigelsen)..

At have målinger af variabilitet sikrer, at gennemsnittene er pålidelige og hjælper med at kontrollere variationer i fordelingen. Lad os som et eksempel analysere disse to situationer.

3 afdelingers løn

Antag, at følgende graf viser lønfordelingen for 3 afdelinger i samme firma:

Figur 2. Tre distributioner med forskellige kurtosis illustrerer praktiske situationer. (Forberedt af Fanny Zapata)

Kurve A er den tyndeste af alle, og ud fra dens form kan det udledes, at de fleste af afdelingenes lønninger er meget tæt på gennemsnittet, derfor får de fleste medarbejdere lignende kompensation.

På den anden side følger lønkurven i afdeling B en normalfordeling, da kurven er mesokurisk, hvor vi antager, at lønningerne var tilfældigt fordelt.

Og endelig har vi kurve C, som er meget flad, et tegn på, at lønområdet i denne afdeling er meget bredere end i de andre..

Resultaterne af en eksamen

Antag nu, at de tre kurver i figur 2 repræsenterer resultaterne af en eksamen, der blev anvendt på tre grupper af studerende inden for samme emne.

Gruppen, hvis ratings er repræsenteret af den leptokurtiske kurve A, er ret homogen, flertallet opnåede en gennemsnitlig eller tæt vurdering.

Det er også muligt, at resultatet skyldtes, at testspørgsmålene havde nogenlunde samme sværhedsgrad.

På den anden side viser resultaterne af gruppe C en større heterogenitet i gruppen, som sandsynligvis indeholder gennemsnitlige studerende, nogle mere fordelagtige studerende og helt sikkert nogle mindre opmærksomme.

Eller det kan betyde, at testspørgsmålene havde meget forskellige sværhedsgrader.

Kurve B er mesokut, hvilket indikerer, at testresultaterne fulgte en normalfordeling. Dette er normalt den hyppigste sag.

Arbejdet eksempel på kurtosis

Find Fishers scoringskoefficient for følgende karakterer, opnået i en fysikeksamen til en gruppe studerende med en skala fra 1 til 10:

5, 5, 4, 7, 7,7, 9, 8, 9, 4, 3

Opløsning

Følgende udtryk vil blive brugt til ikke-grupperede data givet i de foregående sektioner:

K = gto - 3

Denne værdi gør det muligt at kende distributionstypen.

At beregne gto Det er bekvemt at gøre det ordentligt trin for trin, da du skal løse flere aritmetiske operationer.

Trin 1

For det første beregnes gennemsnittet af karaktererne. Der er N = 11 data.

X = (5 + 5 + 4 + 7 + 7 + 7 + 9 + 8 + 9 + 4 + 3) / 11 = 6.182

Trin 2

Standardafvigelsen findes, som denne ligning bruges til:

σ = 1,992

Eller du kan også oprette en tabel, som også er påkrævet til næste trin, og hvor hver periode af de tilføjelser, der skal bruges, er skrevet, begyndende med (xjeg - X), derefter (xjeg - X)to og derefter (xjeg - X):

Trin 3

Udfør det beløb, der er angivet i tælleren af ​​formlen for gto. Til dette bruges resultatet af højre kolonne i den foregående tabel:

∑ (xjeg - X)4= 290,15

Derfor:

gto = (1/11) x 290,15 / 1,9924 = 1.675

Fishers pege-koefficient er:

K = gto - 3 = 1.675 - 3 = -1.325

Det, der er af interesse, er tegn på resultatet, som, når det er negativt, svarer til en platisk fordeling, som kan fortolkes som det, der blev gjort i det foregående eksempel: muligvis er det et heterogent kursus med studerende af forskellige grader af interesse eller eksamen spørgsmål var af forskellige sværhedsgrader.

Brugen af ​​et regneark som Excel letter i høj grad løsningen af ​​disse typer problemer og giver også mulighed for at tegne fordelingen.

Referencer

  1. Levin, R. 1988. Statistik for administratorer. 2. plads Udgave. Prentice hall.
  2. Marco, F. Curtosis. Gendannet fra: economipedia.com.
  3. Oliva, J. Asymmetri og kurtosis. Gendannet fra: Estadisticaucv.files.wordpress.com.
  4. Spurr, W. 1982. Beslutningstagning i ledelsen. Limusa.
  5. Wikipedia. Kurtosis. Gendannet fra: en.wikipedia.org.

Endnu ingen kommentarer