Det kategorisk variabel Det er den, der anvendes i statistikker til at tildele en ikke-numerisk eller kvalitativ egenskab eller egenskab til et objekt, individ, enhed, tilstand eller procedure. Det er muligt at definere alle slags kategoriske variabler efter hvert behov.
Eksempler på kategoriske variabler er: farve, køn, blodgruppe, civilstand, materialetype, betalingsform eller bankkonto, og de bruges meget dagligt..
Ovenstående er variablerne, men deres mulige værdier er kvalitative, dvs. af kvalitet eller karakteristisk og ikke af en numerisk måling. For eksempel de mulige værdier for variablen køn De er: han- , hembra.
Når denne variabel er gemt i et computerprogram, kan den erklæres som en tekstvariabel, og de eneste accepterede værdier er de, der allerede er navngivet: Han , Kvinde.
Dog den samme variabel køn kan deklareres og lagres som et heltal, hvis en Han er tildelt 1 allerede Kvinde værdien tildeles to. Det er af denne grund, at kategoriske variabler undertiden omtales som opregnet type.
Hovedkarakteristikken ved kategoriske variabler er, at i modsætning til andre variabler, såsom kontinuerlig og diskret, er det ikke muligt at regne med dem. Du kan dog lave statistik med dem, som det vil fremgå senere.
Artikelindeks
Bemærk følgende eksempler på kategoriske variabler og deres mulige værdier:
-Blodtype, Værdiområde: A, B, AB, O
-Civilstand, Kategoriske værdier: Enkelt (TIL), Gift (B), Enkemand (C) , Skilt (D).
-Type materiale, Kategorier eller værdier: 1 = Træ, 2 = Metal, 3 = Plast
-Måde at betale, Værdier eller kategorier: (1) Kontanter, (2) Debet, (3) Overførsel, (4) Kredit
I de foregående eksempler er der knyttet et tal til hver kategori på en helt vilkårlig måde.
Man kunne derefter tro, at denne vilkårlige numeriske tilknytning gør det lig med a diskret kvantitativ variabel, men det er det ikke, da aritmetiske operationer ikke kan udføres med disse tal.
For at illustrere ideen i variablen Måde at betale, sumoperationen giver ikke mening:
(1) Kontanter + (2) Debitering vil aldrig være lig (3) Overførsel
Rangeringen er baseret på, om de har et implicit hierarki, eller om antallet af mulige resultater er mere end to eller to.
En kategorisk variabel med kun et muligt resultat er ikke en variabel, den er en kategorisk konstant.
Når de ikke kan repræsenteres af et nummer eller har nogen ordre. For eksempel variablen: Materialetype, thar nominelle værdier (Træ, metal, plast), de har intet hierarki eller rækkefølge, selv når der tildeles et vilkårligt nummer til hvert svar eller hver kategori.
Variabel: Akademisk præstation
Nominelle værdier: Høj, medium, lav
Selv om værdierne for denne variabel ikke er numeriske, har de en implicit rækkefølge eller et hierarki.
Disse er nominelle variabler med to mulige svar, for eksempel:
-Variabel: Svar
-Nominelle værdier: Rigtigt, Falske
Bemærk, at variablen Svar det har ikke et implicit hierarki og har kun to mulige resultater, så det er en binær kategorisk variabel.
Nogle forfattere kalder denne type binær variabel, og anser det ikke for at høre til kategoriske variabler som er begrænset til dem med mere end tre mulige kategorier.
Statistik kan udføres med kategoriske variabler, på trods af at de ikke er numeriske eller kvantitative variabler. For eksempel at kende trenden eller mest sandsynlige værdi af en kategorisk variabel Mode.
Mode det er i dette tilfælde det mest gentagne resultat eller værdi af en kategorisk variabel. I kategoriske variabler er det hverken muligt at beregne middelværdien eller medianen.
Gennemsnittet kan ikke beregnes, fordi aritmetik ikke kan udføres med kategoriske variabler. Medianen er heller ikke, fordi de kvantitative eller kategoriske variabler ikke har en rækkefølge eller hierarki, så det er ikke muligt at bestemme en central værdi..
Givet en bestemt kategorisk variabel, kan hyppigheden eller antallet af gange, som et resultat af variablen gentages med, findes. Hvis dette gøres for hvert resultat, kan der laves en graf over frekvensen mod hver kategori eller resultat..
Her er nogle eksempler på, hvordan kategoriske variabler kan repræsenteres grafisk.
En virksomhed har registreringer af dataene for 170 ansatte. En af variablerne i disse registre er: Civilstand. Denne variabel har fire kategorier eller mulige værdier:
Enkelt (TIL), Gift (B), Enkemand (C) , Skilt (D).
Selv om det er en ikke-numerisk variabel, er det muligt at vide, hvor mange af de samlede poster, der er i en bestemt kategori, og blive repræsenteret i form af et søjlediagram, som vist i følgende figur:
En skobutik holder styr på sit salg. Blandt de variabler, der styrer deres poster, er skofarven for hver model. Variablen:
Color_Shoe_Model_AW3
Det er kategorisk og har fem mulige kategorier eller værdier. For hver kategori af denne variabel summeres antallet af salg, og procentdelen af dem fastlægges. Resultaterne er vist i grafen i følgende figur:
Det kan så siges, at den AW3 sko model der er i mode, den, der sælges hyppigst, er hvid, tæt fulgt af Sort.
Det kan også siges, at med en sandsynlighed på 70% bliver den næste solgte sko af denne model hvid eller Sort.
Disse oplysninger kan være nyttige for butikken, når de afgiver nye ordrer, eller de kan endda anvende rabatter på de mindst solgte farver på grund af for meget lager..
For en bestemt population af bloddonorer vil du repræsentere antallet af mennesker, der tilhører en bestemt blodgruppe. En grafisk måde at visualisere resultaterne på er ved hjælp af et piktogram, der i baggrunden er en tabel.
Den første kolonne repræsenterer variablen Blodtype og dets mulige resultater eller kategorier. Den anden kolonne repræsenterer i ikonisk eller billedlig form antallet af personer i hver kategori. I vores eksempel bruges en rød dråbe som et ikon, der hver repræsenterer 10 personer.
Endnu ingen kommentarer