Lav deskriptiv statistik med STATA

STATA kan nemt lave deskriptiv statistik udfra et datasæt. Her kan du se hvordan du får et hurtigt overblik.
Deskriptiv statistik er, som navnet antyder, en beskrivende form for statistik. Det er statistik der beskriver forskellige karakteristika for et datasæt, og giver et overblik. For forskellige variabler tælles hvor mange observationer der opfylder bestemte kriterier, og udfra dette kan middelværdi og spredning beregnes.
Kort og godt giver en deskriptiv altså hyppigheden for en bestemt observation, og herudover middelværdi og spredning.

Deskriptiv statistik i STATA

Først indlæser du datasættet i STATA med kommandoen USE.

use data.dta

For at lave deskriptiv statistik for samtlige variable bruger du kommandoen SUM.

sum

Dette kan dog godt være lidt uoverskuelig, fordi du måske ikke har brug for at medtage alle variable, og nogle af dem vil du måske omdøbe. Hvis du kun vil medtage enkelte variable kan du angive disse efter SUM, som for eksempel:

sum AGE

Hvis du altså har en variabel der hedder AGE. Dette vil give følgende resultat, og du kan her se at der i dette datasæt er 443 observationer. Gennemsnittet for alderen er 80 med en standardafvigelse på knap 7. Den mindste alder er 70 og den ældste er 99.

Filtrering

Hvis du vil filtrere værdierne inden for en bestemt variabel, skal du bruge kommandoen “if”. For eksempel vil følgende tælle antallet af observationer hvor alderen er over 80.

sum AGE if (AGE>80)

Og følgende vil vise observationerne hvor alderen er lig med 80 (bemærk her at operatoren for lighed er to lighedstegn og ikke et lighedstegn).

sum AGE if (AGE==80)

Hvis du vil vise observationer hvor der er udfyldt noget for variablen bruger du “!mi”. mi står for “missing” og ! er en operator for alt andet end.

sum AGE if !mi(AGE)

Hvis du vil finde ud af hvor mange der ikke har udfyldt alder, fjerner du bare udråbstegnet.

sum AGE if mi(AGE)

Omdøb variabler

Nogle gange er navnene på variabler lidt upassende til en tabel. Så kan du omdøbe variablen til et andet navn med kommandoen rename.

rename AGE Alder

Konverter streng til tal

Nogle gange vil variabler i STATA være konverteret som en streng, selvom de indeholder tal. Her kan variablen konverteres til en taltype med følgende kommando.

destring GENDER, replace

Fordelingen af værdier inden for en variabel

Det kan også være værd at se fordelingen af værdier inden for en bestemt variabel. Det kan du gøre med kommandoen tab.

tab AGE

Dette vil vise:

Kopier en tabel

Når du har fået den tabel i STATA du har brug for, kan du kopiere den ved at markere den, højreklikke og vælge COPY AS HTML.
Det var lidt kort omkring hvordan du laver deskriptiv statistik og filtrerer i STATA. Hvis du har nogle spørgsmål er du velkommen til at skrive en kommentar.

0 0 votes
Article Rating

Andreas Andersen

Forfatter og grundlægger af IT-blogger.dk, der har blogget om IT-emner siden 2012. Findes på Mastodon på @aphandersen@ansico.dk

You may also like...

Abonner
Giv besked ved
guest

0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x