Tukey's test af, hvad den består af, eksempel på, øvelse løst

2307
Philip Kelley

Det tukey test er en metode, der sigter mod at sammenligne de enkelte midler fra en variansanalyse af flere prøver udsat for forskellige behandlinger.

Testen, præsenteret i 1949 af John.W. Tukey, giver os mulighed for at skelne, om de opnåede resultater er væsentligt forskellige eller ej. Det er også kendt som Tukey's ærligt signifikante forskelstest (Tukeys HSD-test for dets akronym på engelsk).

Figur 1. Tukey-testen giver os mulighed for at skelne, om forskellene i resultaterne mellem tre eller flere forskellige behandlinger anvendt på tre eller flere grupper med de samme karakteristika har signifikant og ærligt forskellige middelværdier..

I eksperimenter, hvor tre eller flere forskellige behandlinger anvendt på det samme antal prøver sammenlignes, er det nødvendigt at skelne, om resultaterne er signifikant forskellige eller ej..

Et eksperiment siges at være afbalanceret, når størrelsen på alle statistiske prøver er ens i hver behandling. Når størrelsen på prøverne er forskellig for hver behandling, er der et ubalanceret eksperiment.

Nogle gange er det ikke nok med en variansanalyse (ANOVA) at vide, om de i sammenligningen af ​​forskellige behandlinger (eller eksperimenter) anvendt på flere prøver opfylder nulhypotesen (Ho: "alle behandlinger er ens") eller opfylder alternativet hypotese (Ha: "mindst en af ​​behandlingerne er forskellige").

Tukey's test er ikke unik, der er mange flere tests til sammenligning af prøveeksempler, men dette er en af ​​de bedst kendte og anvendte.

Artikelindeks

  • 1 Comparator og Tukey-tabel
    • 1.1 Ubalancerede eksperimenter
  • 2 Eksempel
  • 3 Øvelse løst
  • 4 Referencer

Tukey-komparator og tabel

Ved anvendelsen af ​​denne test beregnes en værdi w kaldte Tukey-komparator hvis definition er som følger:

w = q √ (MSE / r)

Hvor faktoren hvad fås fra en tabel (Tukey's Table), der består af værdirækker hvad til forskellige antal behandlinger eller eksperimenter. Kolonner angiver faktorværdi hvad for forskellige frihedsgrader. Normalt har de tilgængelige tabeller en relativ betydning på 0,05 og 0,01.

I denne formel vises inden for kvadratroden faktoren MSE divideret med r, som angiver antallet af gentagelser. MSE er et tal, der normalt opnås ved en analyse af afvigelser (ANOVA).

Når forskellen mellem to middelværdier overstiger værdien w (Tukey-komparator), konkluderes det, at de er forskellige gennemsnit, men hvis forskellen er mindre end Tukey-tallet, er det to prøver med statistisk identisk gennemsnitsværdi.

Antallet w er også kendt som HSD-nummeret (ærlig signifikant forskel).

Dette enkelt sammenlignende antal kan anvendes, hvis antallet af prøver, der anvendes til testen af ​​hver behandling, er det samme i hver af dem..

Ubalancerede eksperimenter

Når størrelsen af ​​prøverne af en eller anden grund er forskellig i hver behandling, der skal sammenlignes, så er proceduren beskrevet ovenfor lidt anderledes og er kendt som Tukey-Kramer test.

Nu får du et nummer w komparator for hvert par behandlinger jeg, j:

w (i, j) = q √ (½ MSE / (ri + rj))

I denne formel fås faktor q fra Tukeys tabel. Denne faktor q afhænger af antallet af behandlinger og frihedsgraderne for fejlen. rjeg er antallet af gentagelser i behandling i, mens rj er antallet af gentagelser i behandlingen j.

Eksempel på tilfælde

En kaninopdrætter ønsker at lave en pålidelig statistisk undersøgelse, der fortæller ham, hvilket af de fire mærker af mad til kanin opfedning, der er den mest effektive. Til undersøgelsen danner den fire grupper med seks en og en halv måned gamle kaniner, der indtil det øjeblik havde de samme fodringsforhold.

Årsagerne var, at dødsfald i gruppe A1 og A4 opstod på grund af årsager, der ikke kan tilskrives mad, da en af ​​kaninerne blev bidt af et insekt, og i det andet tilfælde var døden sandsynligvis årsagen til en medfødt defekt. For at grupperne skal være ubalancerede, og så er det nødvendigt at anvende Tukey-Kramer testen.

Træning løst

For ikke at forlænge beregningerne for længe vil en afbalanceret eksperimentssag blive taget som en løst øvelse. Følgende tages som data:

I dette tilfælde er der fire grupper svarende til fire forskellige behandlinger. Vi bemærker dog, at alle grupper har det samme antal data, så det er derefter en afbalanceret sag.

For at udføre ANOVA-analysen er det værktøj, der er indarbejdet i regnearket til Libreoffice. Andre regneark som Excel har indarbejdet dette værktøj til dataanalyse. Nedenfor er en oversigtstabel, der er resultatet efter at have udført variansanalysen (ANOVA):

Fra variansanalysen har vi også P-værdien, som for eksemplet er 2.24E-6 et godt stykke under 0,05-niveauet af betydning, hvilket direkte fører til at afvise nulhypotesen: Alle behandlinger er ens. 

Det vil sige, at nogle af behandlingerne har forskellige middelværdier, men det er nødvendigt at vide, hvilke der er signifikant og ærligt forskellige (HSD) fra det statistiske synspunkt ved hjælp af Tukey-testen..

For at finde tallet w eller som HSD-nummeret også er kendt, skal vi finde den gennemsnitlige firkant for fejlen MSE. Fra ANOVA-analysen opnås det, at kvadratsummen inden for grupperne er SS = 0,2; og antallet af frihedsgrader inden for grupperne er df = 16 med disse data kan vi finde MSE:

MSE = SS / df = 0,2 / 16 = 0,0125

Det er også nødvendigt at finde faktoren hvad af Tukey ved hjælp af bordet. Kolonne 4, der svarer til de 4 grupper eller behandlinger, der skal sammenlignes, og række 16 søges, da ANOVA-analysen gav 16 frihedsgrader inden for grupperne. Dette fører til en værdi på q lig med: q = 4,33 svarende til 0,05 af betydning eller 95% af pålidelighed. Endelig findes værdien for den "ærligt signifikante forskel":

w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165

For at vide, hvilke ærlige forskellige grupper eller behandlinger er, skal du kende gennemsnitsværdierne for hver behandling:

Det er også nødvendigt at kende forskellene mellem middelværdierne for par af behandlinger, hvilket er vist i følgende tabel:

Det konkluderes, at de bedste behandlinger med hensyn til maksimering af resultatet er T1 eller T3, som er ligeglade statistisk set. For at vælge mellem T1 og T3 ville man være nødt til at kigge efter andre faktorer uden for den analyse, der er præsenteret her. For eksempel pris, tilgængelighed osv..

Referencer

  1. Cochran William og Cox Gertrude. 1974. Eksperimentelle designs. Tærskning. Mexico. Tredje genoptryk. 661p.
  2. Snedecor, G.W. og Cochran, W.G. 1980. Statistiske metoder. Syvende udgave Iowa, The Iowa State University Press. 507p.
  3. Stål, R.G.D. og Torrie, J.H. 1980. Principper og procedurer for statistik: En biometrisk tilgang (2. udgave). McGraw-Hill, New York. 629p.
  4. Tukey, J. W. 1949. Sammenligning af individuelle midler i variansanalysen. Biometri, 5: 99-114.
  5. Wikipedia. Tukey's test. Gendannet fra: en.wikipedia.com

Endnu ingen kommentarer