Det ikke-grupperede data er dem, der, opnået fra en undersøgelse, endnu ikke er organiseret efter klasser. Når det er et håndterbart antal data, normalt 20 eller mindre, og der er få forskellige data, kan det behandles som ikke-grupperet og værdifuld information ekstraheret fra det.
De ikke-grupperede data kommer som det er fra undersøgelsen eller undersøgelsen udført for at få dem og mangler derfor behandling. Lad os se på nogle eksempler:
-Resultater af en IQ-test på 20 tilfældige studerende fra et universitet. De opnåede data var følgende:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112.106
-Alder på 20 ansatte i en bestemt populær kaffebar:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
-Det endelige karaktergennemsnit på 10 studerende i en matematikklasse:
3,2; 3.1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4,2; 4.9
Artikelindeks
Der er tre vigtige egenskaber, der karakteriserer et sæt statistiske data, uanset om de er grupperet eller ej, som er:
-Position, hvilket er datatendens tendens til at samle sig omkring bestemte værdier.
-Spredning, en indikation af, hvor spredte eller spredte data er omkring en given værdi.
-Form, Det refererer til den måde, hvorpå dataene distribueres, hvilket værdsættes, når en graf af den samme konstrueres. Der er meget symmetriske kurver og skævt, enten til venstre eller til højre for en bestemt central værdi.
For hver af disse egenskaber er der en række målinger, der beskriver dem. Når de er opnået, giver de os et overblik over dataenes adfærd:
-De mest anvendte positionsmål er det aritmetiske gennemsnit eller simpelthen middelværdien, medianen og tilstanden.
-Område, varians og standardafvigelse bruges ofte i spredning, men de er ikke de eneste målinger af spredning..
-Og for at bestemme formen sammenlignes middelværdien og medianen gennem skævhed, som du snart vil se.
-Det aritmetiske gennemsnit, også kendt som gennemsnit og betegnet som X, beregnes det som følger:
X = (x1 + xto + x3 +… Xn) / n
Hvor x1, xto,…. xn, er dataene og n er summen af dem. I summeringsnotation har vi:
-Median er den værdi, der vises midt i en ordnet sekvens af data, så for at få det er det nødvendigt at bestille dataene først og fremmest.
Hvis antallet af observationer er ulige, er der ikke noget problem at finde sætets midtpunkt, men hvis vi har et lige antal data, søges og gennemsnittes de to centrale data.
-Mode er den mest almindelige værdi, der observeres i datasættet. Det eksisterer ikke altid, da det er muligt, at ingen værdi gentages oftere end en anden. Der kunne også være to data med samme frekvens, i hvilket tilfælde vi taler om en bi-modal fordeling.
I modsætning til de to foregående mål kan tilstanden bruges med kvalitative data.
Lad os se, hvordan disse positionsmålinger beregnes med et eksempel:
Antag, at vi vil bestemme det aritmetiske gennemsnit, medianen og tilstanden i eksemplet, der blev foreslået i starten: Alderne på 20 ansatte i et cafeteria:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
Det halvt det beregnes simpelthen ved at tilføje alle værdierne og dividere med n = 20, hvilket er det samlede antal data. På denne måde:
X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =
= 22,3 år.
For at finde median du skal først sortere datasættet:
18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29
Da det er et lige antal data, tages de to centrale data, der er fremhævet med fed skrift, og beregnes i gennemsnit. Fordi de begge er 22, er medianen 22 år.
Endelig blev mode Det er de data, der gentages mest eller den, hvis frekvens er større, dette er 22 år.
Området er simpelthen forskellen mellem den største og den mindste af dataene og giver dig mulighed for hurtigt at forstå dataens variabilitet. Men bortset fra er der andre målinger af spredning, der giver mere information om distributionen af dataene..
Variansen betegnes som s og beregnes ved udtrykket:
For at fortolke resultaterne korrekt defineres standardafvigelsen som kvadratroden af variansen eller også kvasistandardafvigelsen, som er kvadratroden af kvasivariansen:
Det er sammenligningen mellem middel X og median Med:
-Hvis Med = betyder X: dataene er symmetriske.
-Når X> Med: skæv til højre.
-Og hvis X < Med: los datos sesgan hacia la izquierda.
Find gennemsnit, median, tilstand, rækkevidde, varians, standardafvigelse og bias for resultaterne af en IQ-test udført på 20 studerende fra et universitet:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106
Vi bestiller dataene, da det vil være nødvendigt at finde medianen.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124
Og vi sætter dem i en tabel som følger for at lette beregningerne. Den anden kolonne med titlen "Akkumuleret" er summen af de tilsvarende data plus den foregående..
Denne kolonne hjælper med let at finde gennemsnittet ved at dividere det sidste akkumulerede med det samlede antal data, som det ses i slutningen af kolonnen "Akkumuleret":
X = 112,9
Medianen er gennemsnittet af de centrale data fremhævet med rødt: tallet 10 og tallet 11. Da de er de samme, er medianen 112.
Endelig er tilstanden den værdi, der gentages mest og er 112 med 7 gentagelser..
Med hensyn til målene for spredning er rækkevidden:
124-106 = 18.
Variansen opnås ved at dividere det endelige resultat i højre kolonne med n:
s = 668,6 / 20 = 33,42
I dette tilfælde er standardafvigelsen kvadratroden af variansen: √33.42 = 5.8.
På den anden side er værdierne for kvasi-variansen og kvasi-standardafvigelsen:
sc= 668,6 / 19 = 35,2
Kvasistandardafvigelse = √35.2 = 5.9
Endelig er skævheden lidt til højre, da gennemsnittet 112,9 er større end medianen 112.
Endnu ingen kommentarer