I dag vil jeg prøve at give et indtryk af, hvad man arbejder med indenfor statistik. Og det kan måske illustreres ved at tænke på at kaste ”plat” eller ”krone”, bare ikke med en mønt men med en tegnestift.
Kast med en tegnestift har ligesom med en mønt to udfald. Den kan enten lande med spidsen opad eller på siden. Men i modsætning til kast med en mønt, kan man ikke på forhånd slutte, at hvert udfald må have en sandsynlighed på 50 %. Og derfor kan man ikke umiddelbart foretage sandsynlighedsberegninger for en tegnestift (f.eks. at beregne sandsynligheden for at tegnestiften i to på hinanden følgende kast begge gange lander på siden).
Vil man vide noget om sandsynligheden for at tegnestiften lander på siden, er man i praksis nødt til at foretage et eksperiment for derefter at slutte (induktivt) på baggrund af eksperimentets udfald. Kaster man f.eks. 10 gange med tegnestiften og finder, at den 7 af gangene lander på siden, ja så ved man af den grund ikke med sikkerhed, hvor stor sandsynligheden er for at lande på siden. I princippet kan den godt være 50 %, på samme måde som en mønt jo også godt kan give ”plat” i 7 ud af 10 kast. Men intuitivt vil det bedste bud naturligvis være, at sandsynligheden for at lande på siden er 70 %. Og de fleste har nok også en fornemmelse af, at det er mere sandsynligt at få 7 ud af 10, som lander på siden, hvis sandsynligheden for at lande på siden er 70 %, end hvis sandsynligheden eksempelvis kun er 50 %. Og den statistiske begrundelse for at antage, at sandsynligheden netop er 70 % vil tilsvarende være, at lige netop med 70 % maksimeres sandsynligheden (som den nu engang beregnes indenfor sandsynlighedsregningen), for det aktuelle udfald af eksperimentet.
Men hvad nu, hvis man kaster 10 gange mere med tegnestiften, og nu får 5 af hvert udfald? Så vil det være naturlig at lægge de to eksperimenter sammen og sige at sandsynligheden for at lande på siden nu er 60 % (12 ud af 20).
Der hvor det bliver interessant er imidlertid, hvis det nye eksperiment er foretaget under lidt andre omstændigheder. Det kan f.eks. være med en anden tegnestift, i et andet lokale med en anden temperatur, på et andet underlag osv. Kan man så på den baggrund konkludere, at de ændrede omstændigheder har haft indflydelse? Hvis der f.eks. var tale om en rød og en blå tegnestift, kan man så sige, at røde tegnestifter har en sandsynlighed på 70 % for at lande på siden, medens den for blå tilsvarende er 50 % ?
Den statistiske tankegang vil da være først at antage, at der ikke er nogen forskel (nul hypotese) og på den baggrund gættes (estimere) den samlede sandsynlighed for at lande på siden til at være 60 %. Derefter beregnes så sandsynligheden for i de to eksperimenter henholdsvis at få 7 og 5 (eller endnu større forskel), når nu sandsynligheden for at lande på siden sættes til de 60 %. Og hvis det så viser sig, at forskellen mellem de to eksperimenter er så stor, at det er helt usandsynligt, så accepteres, at der nok er en forskel på de to eksperimenter. Så er det gode spørgsmål bare, om man har fat i den rigtige forklaring (tegnestiftens farve).
Viser det sig derimod, at forskellen ikke er særlig usandsynlig, så vil man ud fra den sædvanlige videnskabelige tankegang om, at man ikke skal regne med noget før det er tilstrækkeligt underbygget, blot afvise tanken om, at der var forskel på de to eksperimenter.
I ovennævnte ekesmpel vil forskellen med de 7 og de 5 ikke være særlig usandsynlig og det vil derfor afvises, at der er en systematisk forskel på de to eksperimenter. Men hvis det nu ikke handler om tegnestifter, men istedet om noget mere politisk følsomt som eksempelvis miljø, så kan man sagtens forstille sig, at nogle personer vil argumentere for, at vi ikke kan tillade os at være alt for videnskabelige, men skal lade tvivlen komme mistanken om forskel tilgode, således at vi kan handle nu.
Abonner på:
Kommentarer til indlægget (Atom)
Ingen kommentarer:
Send en kommentar