Forside
Statistikker
Prøveudtagningsfejlformler og ligninger, beregning, eksempler

Prøveudtagningsfejlformler og ligninger, beregning, eksempler

4773

1425

Anthony Golden

Det prøveudtagningsfejl eller prøvefejl I statistikker er det forskellen mellem gennemsnitsværdien af en prøve og middelværdien af den samlede befolkning. For at illustrere ideen, lad os forestille os, at den samlede befolkning i en by er en million mennesker, hvoraf den gennemsnitlige skostørrelse ønskes, for hvilken der udtages en tilfældig prøve på tusind mennesker.

Den gennemsnitlige størrelse, der fremgår af prøven, falder ikke nødvendigvis sammen med den samlede befolkning, selvom værdien skal være tæt, hvis prøven ikke er partisk. Denne forskel mellem gennemsnitsværdien af prøven og den for den samlede population er prøveudtagningsfejlen.

Figur 1. Da prøven er en delmængde af den samlede population, har gennemsnittet af prøven en fejlmargen. Kilde: F. Zapata.

Generelt er middelværdien af den samlede befolkning ukendt, men der er teknikker til at reducere denne fejl og formler til at estimere prøveudtagningsfejlmargen der vil blive eksponeret i denne artikel.

Artikelindeks

1 Formler og ligninger
2 Sådan beregnes prøveudtagningsfejl
- 2.1 For et konfidensniveau γ
3 eksempler
- 3.1 - Eksempel 1
- 3.2 - Eksempel 2
- 3.3 - Eksempel 3
- 3.4 - Eksempel 4
- 3.5 - Øvelse 5
4 Referencer

Formler og ligninger

Lad os sige, at du vil vide gennemsnitsværdien af en bestemt målbar egenskab x i en befolkning af størrelse N, men hvordan N er et stort antal, er det ikke muligt at gennemføre undersøgelsen af den samlede befolkning, så fortsætter vi med at tage en aleatory prøve af størrelse n<.

Den gennemsnitlige værdi af prøven er angivet med og middelværdien af den samlede befolkning er angivet med det græske bogstav μ (det lyder mu eller miu).

Antag, at de tager m prøver fra den samlede population N, alle i samme størrelse n med middelværdier 1>, to>, 3>, ... .m>.

Disse middelværdier vil ikke være identiske med hinanden og vil alle være omkring befolkningens middelværdi μ. Det prøveudtagningsmargen E angiver den forventede adskillelse af middelværdierne vedrørende population middelværdi μ inden for en bestemt procentdel kaldet konfidensniveau γ (gamma).

Det standard fejlmargen ε størrelse prøve n det er:

ε = σ / √n

hvor σ er standardafvigelsen (kvadratroden af variansen), der beregnes ved hjælp af følgende formel:

σ = √ [(x - )^to/ (n - 1)]

Betydningen af standard fejlmargen ε er følgende:

Det middelværdi opnået ved størrelsesprøve n er inden for området ( - ε, + ε) med en Selvtillidsniveau 68,3%.

Sådan beregnes prøveudtagningsfejl

I det foregående afsnit blev formlen givet til at finde fejlinterval standard af en prøve af størrelse n, hvor ordet standard angiver, at det er en fejlmargin med 68% konfidens.

Dette indikerer, at hvis der blev taget mange prøver af samme størrelse n, 68% af dem giver gennemsnitlige værdier inden for området [ - ε, + ε].

Der er en simpel regel, kaldet regel 68-95-99.7 som giver os mulighed for at finde margenen på prøveudtagningsfejl E for tillidsniveauer på 68%, 95% Y 99,7% let, da denne margen er 1⋅ε, 2⋅ε og 3⋅ε henholdsvis.

For et niveau af selvtillid γ

Hvis han konfidensniveau γ ikke er noget af det ovenstående, så er prøveudtagningsfejlen standardafvigelsen σ ganget med faktoren Zy, som opnås ved hjælp af følgende procedure:

1.- Først signifikansniveau α som beregnes ud fra konfidensniveau γ ved hjælp af følgende forhold: α = 1 - γ

2. - Så skal du beregne værdien 1 - a / 2 = (1 + y) / 2, hvilket svarer til den akkumulerede normale frekvens mellem -∞ og Zy, i en normal eller standardiseret Gaussisk fordeling F (z), hvis definition kan ses i figur 2.

3.- Ligningen er løst F (Zy) = 1 - a / 2 ved hjælp af tabellerne for den normale fordeling (kumulativ) F, eller ved hjælp af et computerprogram, der har den omvendte standardiserede Gaussiske funktion F^-1.

I sidstnævnte tilfælde har vi:

Zy = G^-1(1 - α / 2).

4. - Endelig anvendes denne formel til prøveudtagningsfejl med et pålidelighedsniveau γ:

E = Zy⋅(σ / √n)

Figur 2. Tabel over normalfordeling. Kilde: Wikimedia Commons.

Eksempler

- Eksempel 1

Beregn standard fejlmargen i gennemsnitsvægten af en prøve på 100 nyfødte. Beregningen af gennemsnitsvægten var = 3.100 kg med en standardafvigelse σ = 1.500 kg.

Opløsning

Det standard fejlmargen det er ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. Hvilket betyder, at det med disse data kan udledes, at vægten af 68% af nyfødte er mellem 2.950 kg og 3.25 kg.

- Eksempel 2

Bestemme margen for prøveudtagningsfejl E og vægtområdet på 100 nyfødte med et 95% konfidensniveau, hvis gennemsnitsvægten er 3.100 kg med standardafvigelse σ = 1.500 kg.

Opløsning

Hvis regel 68; 95; 99,7 → 1⋅ε; 2⋅ε; 3⋅ε, du har:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Det vil sige, at 95% af nyfødte har vægte mellem 2.800 kg og 3.400 kg.

- Eksempel 3

Bestem vægteområdet for de nyfødte fra eksempel 1 med en konfidensmargen på 99,7%.

Opløsning

Samplingsfejlen med 99,7% konfidens er 3 σ / √n, som for vores eksempel er E = 3 * 0,15 kg = 0,45 kg. Herfra udledes det, at 99,7% af nyfødte vil have vægte mellem 2.650 kg og 3.550 kg.

- Eksempel 4

Bestem faktoren Zy til et pålidelighedsniveau på 75%. Bestem marginen for prøveudtagningsfejl med dette niveau af pålidelighed for den sag, der er præsenteret i eksempel 1.

Opløsning

Det Selvtillidsniveau det er γ = 75% = 0,75, som er relateret til signifikansniveau a gennem forhold γ= (1 - a), så signifikansniveauet er a = 1 - 0,75 = 0,25.

Dette betyder, at den kumulative normale sandsynlighed mellem -∞ og Zy det er:

P (Z ≤ Zy ) = 1 - 0,125 = 0,875

Hvad svarer til en værdi Zy 1.1503, som vist i figur 3.

Figur 3. Bestemmelse af Zy-faktoren svarende til et konfidensniveau på 75%. Kilde: F. Zapata gennem Geogebra.

Det vil sige, at prøveudtagningsfejlen er E = Zy⋅(σ / √n)= 1.15⋅(σ / √n).

Når de anvendes på dataene fra eksempel 1, giver det en fejl på:

E = 1,15 * 0,15 kg = 0,17 kg

Med et konfidensniveau på 75%.

- Øvelse 5

Hvad er konfidensniveauet, hvis Z_{α / 2} = 2,4 ?

Opløsning

P (Z ≤ Z_{α / 2} ) = 1 - a / 2

P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164

Betydningsniveauet er:

α = 0,0164 = 1,64%

Og endelig forbliver tillidsniveauet:

1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%

Referencer

Canavos, G. 1988. Sandsynlighed og statistik: Anvendelser og metoder. Mcgraw bakke.

Devore, J. 2012. Sandsynlighed og statistik for ingeniørvidenskab og videnskab. 8. plads Udgave. Cengage.

Levin, R. 1988. Statistik for administratorer. 2. plads Udgave. Prentice hall.

Sudman, S. 1982. Stil spørgsmål: En praktisk guide til design af spørgeskemaer. San Francisco. Jossey bas.

Walpole, R. 2007. Sandsynlighed og statistik for ingeniørvidenskab og videnskab. Pearson.

Wonnacott, T.H. og R.J. Wonnacott. 1990. Indledende statistik. 5. udgave Wiley

Wikipedia. Prøveudtagningsfejl. Gendannet fra: en.wikipedia.com

Wikipedia. Fejlmargen. Gendannet fra: en.wikipedia.com

Navn

Email

Tekst

Endnu ingen kommentarer

Betydningen af atmosfæren for levende væsener
Miljø

2415

448

Simon Doyle

Kemiske reaktioner involveret i global opvarmning
Miljø

2643

558

Egbert Haynes

Hvad er olie god til? De 6 mest almindelige anvendelser
Miljø

876

127

Sherman Hoover

Prøveudtagningsfejlformler og ligninger, beregning, eksempler

Formler og ligninger

Sådan beregnes prøveudtagningsfejl

For et niveau af selvtillid γ

Eksempler

- Eksempel 1

Opløsning

- Eksempel 2

Opløsning

- Eksempel 3

Opløsning

- Eksempel 4

Opløsning

- Øvelse 5

Opløsning

Referencer

Betydningen af ​​atmosfæren for levende væsener

Kemiske reaktioner involveret i global opvarmning

Hvad er olie god til? De 6 mest almindelige anvendelser

Betydningen af atmosfæren for levende væsener