”Velfærdsstaten” er skabt af mennesker, der ikke har virkelige helte; og som derfor har skabt et system, der har til formål at gøre verden årsagsløs, sådan at man (tror man) slipper for at forholde sig til alle de udfordringer, virkeligheden konfronterer en med. (Simon Espersen, Et samfund uden forbilleder)

tirsdag den 5. august 2008

Statistik (del 1 af 3)

Man siger, at der findes 3 former for løgn:

1. Den lille hvide løgn
2. Den grove forbandede løgn
3. Statistik

Nogenlunde sådan indledte Lars Pallesen engang en forelæsning i statistik. Derefter gik han så videre til at forklare noget om, at det naturligvis ikke var selve statistikken som faglig disciplin, der var usand, men derimod de mange mennesker, som mistolkede og misbrugte statistikkens resultater.

Men hvad er statistik egentlig, og hvad er det for et misbrug, der sker?

Nogle gange bruges ordet statistik blot om en simpel talopgørelse, som det f.eks. kendes fra Danmarks Statistik. Et andet eksempel kunne også være et folketingsvalg (prøvevalg) i skoleklasse, hvor man så kan opgøre hvor mange procent, som stemmer på Socialdemokraterne, Radikale, Konservative etc.

Men den slags talopgørelser er sjældent interessante i sig selv. Laver man f.eks. folketingsvalg i flere forskellige skoleklasser, mister man hurtigt overblikket, hvis man fortaber sig i, hvorfor et givet parti scorer 5-10 % mere i den ene klasse end i den anden. Det interessante vil da være, at finde de bagvedliggende sammenhænge, såsom hvorvidt der er politisk forskel på drenge og piger, folkeskoleelever og privatskoleelever, handelsskolelever og gymnasieelever osv.

Og det er lige netop her, at statistikken kommer ind i billedet. For helt grundlæggende er statistik en matematisk disciplin, som beskæftiger sig med at analysere tal, for at finde mønstre i dem. Man kan også sige, at statistik handler om at støtte en induktiv proces med at slutte fra det specifikke (de foreliggende tal) til det generelle (de bagvedliggende sammenhænge).

Hvordan dette foregår, vil jeg komme lidt nærmere ind på i min næste artikel, som kommer i morgen. Men det som skal slås fast her er, at statistik aldrig kan komme med en fuldstændig sikker forklaring på noget som helst. Den kan højest påvise nogle mønstre i et talmateriale og dermed være med til at sandsynliggøre, at nogle fænomener er forbundet med hinanden. Men statistik kan aldrig fastslå mønstrene med 100 % sikkerhed, og den kan aldrig forklare, hvad som er årsag og virkning.

Muligheden for at misbruge statistik til at underbygge alle mulige mere eller mindre lødige konklusioner er derfor stor. Og også selvom man prøver at være så redelig som overhovedet muligt, i sin statistik og prøver at undgå statistikkens mange faldbruger, så vil konklusionen på en statistisk undersøgelse altid bygge på nogle antagelser og så en vis portion fortolkning.

Ingen kommentarer: