Sturerer regelforklaring, applikationer og eksempler

1939
David Holt

Det rystelser hersker det er et kriterium, der bruges til at bestemme antallet af klasser eller intervaller, der er nødvendige for grafisk at repræsentere et sæt statistiske data. Denne regel blev forkyndt i 1926 af den tyske matematiker Herbert Sturges.

Sturges foreslog en enkel metode baseret på antallet af prøver x, der gjorde det muligt for os at finde antallet af klasser og deres rækkevidde. Sturges 'regel bruges i vid udstrækning, især inden for statistikområdet, specifikt til at konstruere frekvenshistogrammer..

Artikelindeks

  • 1 Forklaring
  • 2 applikationer
  • 3 Eksempel
  • 4 Referencer

Forklaring

Sturges 'regel er en empirisk metode, der i vid udstrækning anvendes i beskrivende statistikker til at bestemme antallet af klasser, der skal eksistere i et frekvenshistogram, for at klassificere et sæt data, der repræsenterer en prøve eller en population..

Dybest set bestemmer denne regel bredden af ​​de grafiske beholdere af frekvenshistogrammerne.

For at etablere sin regel betragtes Herbert Sturges som et ideelt frekvensdiagram bestående af K-intervaller, hvor det i-th interval indeholder et bestemt antal prøver (i = 0,… k - 1), repræsenteret som:

Antallet af prøver er givet ved antallet af måder, hvorpå et undersæt af et sæt kan ekstraheres; det vil sige ved binomialkoefficienten udtrykt som følger:

For at forenkle udtrykket anvendte han logaritmernes egenskaber på begge dele af ligningen:

Således fastslog Sturges, at det optimale antal intervaller k er givet af udtrykket:

Det kan også udtrykkes som:

I dette udtryk:

- k er antallet af klasser.

- N er det samlede antal observationer i prøven.

- Log er den almindelige logaritme for base 10.

For at konstruere et frekvenshistogram, der udtrykker en tilfældig prøve af højden på 142 børn, er antallet af intervaller eller klasser, som fordelingen har:

k = 1 + 3,322 * log10 (N)

k = 1 + 3,322* log (142)

k = 1 + 3,322* 2.1523

k = 8,14 ≈ 8

Fordelingen vil således være i 8 intervaller.

Antallet af intervaller skal altid repræsenteres af hele tal. I tilfælde, hvor værdien er decimal, skal der foretages en tilnærmelse til nærmeste heltal.

Ansøgninger

Sturges's regel anvendes hovedsageligt i statistikker, da det gør det muligt at foretage en frekvensfordeling ved beregning af antallet af klasser (k) såvel som længden af ​​hver af disse, også kendt som amplitude..

Amplituden er forskellen mellem klassens øvre og nedre grænse divideret med antallet af klasser og udtrykkes:

Der er mange tommelfingerregler, der giver dig mulighed for at foretage en frekvensfordeling. Imidlertid er Sturges 'regel almindeligt anvendt, fordi den tilnærmer sig antallet af klasser, som generelt varierer fra 5 til 15..

Således betragter den en værdi, der tilstrækkeligt repræsenterer en prøve eller population; tilnærmelsen repræsenterer ikke ekstreme grupperinger og fungerer heller ikke med et for stort antal klasser, der ikke tillader, at prøven opsummeres..

Eksempel

Der skal laves et frekvenshistogram i henhold til de givne data, der svarer til aldre opnået i en undersøgelse af mænd, der træner i et lokalt motionscenter..

For at bestemme intervallerne skal man kende størrelsen på prøven eller antallet af observationer; i dette tilfælde har du 30.

Derefter gælder Sturges-reglen:

k = 1 + 3,322 * log10 (N)

k = 1 + 3,322* log (30)

k = 1 + 3,322* 1.4771

k = 5,90 ≈ 6 intervaller.

Fra antallet af intervaller kan amplituden, som disse skal have, beregnes; det vil sige bredden af ​​hver bjælke, der er repræsenteret i frekvenshistogrammet:

Den nedre grænse betragtes som den mindste værdi af dataene, og den øvre grænse er den største værdi. Forskellen mellem de øvre og nedre grænser kaldes variablen (R).

Fra tabellen har vi, at den øvre grænse er 46, og den nedre grænse er 13; på den måde vil amplituden for hver klasse være:

Intervallerne består af en øvre og nedre grænse. For at bestemme disse intervaller starter vi med at tælle fra den nedre grænse og tilføje til denne amplituden bestemt af regel (6) som følger:

Derefter beregnes den absolutte frekvens for at bestemme antallet af mænd, der svarer til hvert interval; i dette tilfælde er det:

- Interval 1: 13 - 18 = 9

- Interval 2: 19 - 24 = 9

- Interval 3: 25 - 30 = 5

- Interval 4: 31 - 36 = 2

- Interval 5: 37 - 42 = 2

- Område 6: 43 - 48 = 3

Når der tilføjes den absolutte frekvens for hver klasse, skal dette være lig med det samlede antal prøver; i dette tilfælde 30.

Derefter beregnes den relative frekvens for hvert interval og dividere dets absolutte frekvens med det samlede antal observationer:

- Interval 1: fi = 9 ÷ 30 = 0,30

- Interval 2: fi = 9 ÷ 30 = 0,30

- Interval 3: fi = 5 ÷ 30 = 0,1666

- Interval 4: fi = 2 ÷ 30 = 0,0666

- Interval 5: fi = 2 ÷ 30 = 0,0666

- Interval 4: fi = 3 ÷ 30 = 0,10

Derefter kan du lave en tabel, der afspejler dataene, og også diagrammet fra den relative frekvens i forhold til de opnåede intervaller, som det kan ses på de følgende billeder:

På denne måde tillader Sturges-reglen at bestemme antallet af klasser eller intervaller, hvor en prøve kan opdeles, for at opsummere en dataprøve gennem udarbejdelsen af ​​tabeller og grafer..

Referencer

  1. Alfonso Urquía, M. V. (2013). Modellering og simulering af diskrete begivenheder. UNED,.
  2. Altman Naomi, M. K. (2015). "Enkel lineær regression." Naturmetoder .
  3. Antúnez, R. J. (2014). Statistik inden for uddannelse. Digital ENHED.
  4. Fox, J. (1997.). Anvendt regressionsanalyse, lineære modeller og relaterede metoder. SAGE-publikationer.
  5. Humberto Llinás Solano, C. R. (2005). Beskrivende statistik og sandsynlighedsfordeling. nordlige universitet.
  6. Panteleeva, O. V. (2005). Grundlæggende om sandsynlighed og statistik.
  7. O. Kuehl, M. O. (2001). Design af eksperimenter: Statistiske principper for forskningsdesign og analyse. Thomson Redaktører.

Endnu ingen kommentarer