Ugrupperede dataeksempler og øvelse løst

4064
Sherman Hoover

Det ikke-grupperede data er dem, der, opnået fra en undersøgelse, endnu ikke er organiseret efter klasser. Når det er et håndterbart antal data, normalt 20 eller mindre, og der er få forskellige data, kan det behandles som ikke-grupperet og værdifuld information ekstraheret fra det.

De ikke-grupperede data kommer som det er fra undersøgelsen eller undersøgelsen udført for at få dem og mangler derfor behandling. Lad os se på nogle eksempler:

Figur 1. De ikke-grupperede data kommer direkte fra nogle undersøgelser og er ikke klassificeret. Kilde: Pxhere.

-Resultater af en IQ-test på 20 tilfældige studerende fra et universitet. De opnåede data var følgende:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112.106

-Alder på 20 ansatte i en bestemt populær kaffebar:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

-Det endelige karaktergennemsnit på 10 studerende i en matematikklasse:

3,2; 3.1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4,2; 4.9

Artikelindeks

  • 1 Dataegenskaber
  • 2 Beregning af gennemsnit, median og tilstand
  • 3 Område, varians, standardafvigelse og bias
    • 3.1 Afvigelse og standardafvigelse
  • 4 Øvelse løst
    • 4.1 Løsning
  • 5 Referencer

Dataegenskaber

Der er tre vigtige egenskaber, der karakteriserer et sæt statistiske data, uanset om de er grupperet eller ej, som er:

-Position, hvilket er datatendens tendens til at samle sig omkring bestemte værdier.

-Spredning, en indikation af, hvor spredte eller spredte data er omkring en given værdi.

-Form, Det refererer til den måde, hvorpå dataene distribueres, hvilket værdsættes, når en graf af den samme konstrueres. Der er meget symmetriske kurver og skævt, enten til venstre eller til højre for en bestemt central værdi.

For hver af disse egenskaber er der en række målinger, der beskriver dem. Når de er opnået, giver de os et overblik over dataenes adfærd:

-De mest anvendte positionsmål er det aritmetiske gennemsnit eller simpelthen middelværdien, medianen og tilstanden.

-Område, varians og standardafvigelse bruges ofte i spredning, men de er ikke de eneste målinger af spredning..

-Og for at bestemme formen sammenlignes middelværdien og medianen gennem skævhed, som du snart vil se.

Beregning af gennemsnit, median og tilstand

-Det aritmetiske gennemsnit, også kendt som gennemsnit og betegnet som X, beregnes det som følger:

X = (x1 + xto + x3 +… Xn) / n

Hvor x1, xto,…. xn, er dataene og n er summen af ​​dem. I summeringsnotation har vi:

-Median er den værdi, der vises midt i en ordnet sekvens af data, så for at få det er det nødvendigt at bestille dataene først og fremmest.

Hvis antallet af observationer er ulige, er der ikke noget problem at finde sætets midtpunkt, men hvis vi har et lige antal data, søges og gennemsnittes de to centrale data.

-Mode er den mest almindelige værdi, der observeres i datasættet. Det eksisterer ikke altid, da det er muligt, at ingen værdi gentages oftere end en anden. Der kunne også være to data med samme frekvens, i hvilket tilfælde vi taler om en bi-modal fordeling.

I modsætning til de to foregående mål kan tilstanden bruges med kvalitative data.

Lad os se, hvordan disse positionsmålinger beregnes med et eksempel:

Arbejdet eksempel

Antag, at vi vil bestemme det aritmetiske gennemsnit, medianen og tilstanden i eksemplet, der blev foreslået i starten: Alderne på 20 ansatte i et cafeteria:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

Det halvt det beregnes simpelthen ved at tilføje alle værdierne og dividere med n = 20, hvilket er det samlede antal data. På denne måde:

X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =

= 22,3 år.

For at finde median du skal først sortere datasættet:

18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29

Da det er et lige antal data, tages de to centrale data, der er fremhævet med fed skrift, og beregnes i gennemsnit. Fordi de begge er 22, er medianen 22 år.

Endelig blev mode Det er de data, der gentages mest eller den, hvis frekvens er større, dette er 22 år.

Område, varians, standardafvigelse og bias

Området er simpelthen forskellen mellem den største og den mindste af dataene og giver dig mulighed for hurtigt at forstå dataens variabilitet. Men bortset fra er der andre målinger af spredning, der giver mere information om distributionen af ​​dataene..

Variation og standardafvigelse

Variansen betegnes som s og beregnes ved udtrykket:

For at fortolke resultaterne korrekt defineres standardafvigelsen som kvadratroden af ​​variansen eller også kvasistandardafvigelsen, som er kvadratroden af ​​kvasivariansen:

Det er sammenligningen mellem middel X og median Med:

-Hvis Med = betyder X: dataene er symmetriske.

-Når X> Med: skæv til højre.

-Og hvis X < Med: los datos sesgan hacia la izquierda.

Træning løst

Find gennemsnit, median, tilstand, rækkevidde, varians, standardafvigelse og bias for resultaterne af en IQ-test udført på 20 studerende fra et universitet:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106

Opløsning

Vi bestiller dataene, da det vil være nødvendigt at finde medianen.

106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124

Og vi sætter dem i en tabel som følger for at lette beregningerne. Den anden kolonne med titlen "Akkumuleret" er summen af ​​de tilsvarende data plus den foregående..

Denne kolonne hjælper med let at finde gennemsnittet ved at dividere det sidste akkumulerede med det samlede antal data, som det ses i slutningen af ​​kolonnen "Akkumuleret":

X = 112,9

Medianen er gennemsnittet af de centrale data fremhævet med rødt: tallet 10 og tallet 11. Da de er de samme, er medianen 112.

Endelig er tilstanden den værdi, der gentages mest og er 112 med 7 gentagelser..

Med hensyn til målene for spredning er rækkevidden:

124-106 = 18.

Variansen opnås ved at dividere det endelige resultat i højre kolonne med n:

s = 668,6 / 20 = 33,42

I dette tilfælde er standardafvigelsen kvadratroden af ​​variansen: √33.42 = 5.8.

På den anden side er værdierne for kvasi-variansen og kvasi-standardafvigelsen:

sc= 668,6 / 19 = 35,2

Kvasistandardafvigelse = √35.2 = 5.9

Endelig er skævheden lidt til højre, da gennemsnittet 112,9 er større end medianen 112.

Referencer

  1. Berenson, M. 1985. Statistik for ledelse og økonomi. Interamericana S.A.
  2. Canavos, G. 1988. Sandsynlighed og statistik: Anvendelser og metoder. Mcgraw bakke.
  3. Devore, J. 2012. Sandsynlighed og statistik for ingeniørvidenskab og videnskab. 8. plads Udgave. Cengage.
  4. Levin, R. 1988. Statistik for administratorer. 2. plads Udgave. Prentice hall.
  5. Walpole, R. 2007. Sandsynlighed og statistik for ingeniørvidenskab og videnskab. Pearson.

Endnu ingen kommentarer