Tag - sannolikheter

Det kan inte uteslutas att osannolikt kan vara svårt att tolka

Det kan inte uteslutas att jag ibland hör saker i media som får mig att reagera genom att skriva ett bloggartikel. Det hände idag, vilket tydliggörs genom att du läser detta, när jag lyssnade på P1 Godmorgon Världen.

Där avhandlades under några minuter skillnaden mellan begreppen ”kan inte uteslutas” och ”osannolikt”. Detta till följd av att statsminister Löfven vid Folk och Försvars konferens i Sälen i veckan stått kvar vid det senare uttrycket ”ett militärt angrepp mot Sverige är osannolikt” i kontrast till Försvarsberedningens som valt den nya formuleringen ”…kan inte uteslutas”.

Politiker (och en del andra) hade i veckan en diskussion om skillnaderna mellan dessa begrepp. Det politiska etablissemanget (inklusive Löfven) är överens om att hotbilden mot Sverige har ökat. Försvarsberedningen har markerat detta genom den nya formuleringen. Men statsministerns ordval (och han sade det inte bara i förbifarten, utan han markerade det) skapade bilden av att han inte tyckte det var någon skillnad mot tidigare.

För att bringa lite klarhet i sammanhanget så kontaktade Sveriges Radios Godmorgon Världen Henrik Rosenkvist, professor i nordiska språk vid Göteborgs universitet. Han tänkte högt i söndagens sändning (idag 21 januari 2018) och kom fram till att det snarare var tvärtom, ”kan inte uteslutas” beskriver en mindre sannolikhet än ”osannolikt”.

Tack vare att Rosenkvist tänker högt så kan vi följa hans logik. Ni kan lyssna på inslaget här:

Till att börja med så finns det visst regler för hur begreppen skall tolkas. Han hänvisar tex själv till ordböcker. Lite längre ner så visar jag på hur man gör i klimatsammanhang för att kommunicera sannolikheter i ord.

För det andra så gör han som första steg att översätta ordet ”sannolikt” till ”troligt”, trots att han några sekunder tidigare sade att det inte fanns regler för hur orden skulle tolkas. Nåväl, han beskriver ”osannolikt” ”inte troligt, men fullt möjligt”. Jag är okay med den formuleringen.

Tankevurpan gör han när han skall kvantifiera ”kan inte uteslutas”. Han säger att ”Om man säger att något kan uteslutas så finns det inte ens minsta möjlighet till att det skall inträffa. …och om man säger att något inte kan uteslutas så finns möjligheten, men den kan vara väldigt, väldigt liten”.

– Men bäste professorn, bara för att den kan vara liten så betyder det att den är det! Det betyder inte heller att den inte kan vara stor!

Vill man belysa att en sannolikhet har ökat från nivån ”osannolik” så kan man använda många begrepp. ”Kan inte uteslutas” kanske inte var det bästa, men det bör tolkas som den ökade risknivå det var avsett att belysa.

Sedan rundar Rosenqvist med att föreslå att man hellre borde tala om att ”risken har ökat” istället för att definiera hur stor den är. Nå, man har ju faktiskt rätt många gånger sagt just det. Och det finns faktiskt en poäng med att dessutom försöka definiera hur stor den är, inte bara att den har ökat från någon annan luddig nivå.

Han avslutar, med ett fniss, att det vore bättre med de relativa begreppen ”så att man slipper ringa till en professor i Nordiska språk om såna här saker”. Nå, så mycket klarare över situationen blev man väl inte av den här intervjun. Allra bäst tycker jag det vore om man frågade statsministern respektive försvarsberedningen om vad de egentligen menade istället för att vrida och vända på vad de sade.

Nu kanske ni läsare tycker att jag har varit stöddig och moppsat upp mig mot uttalanden av en professor i Nordiska språk. Vad har jag då att komma med, vad är då min syn på saken?

Jag anser att man bör kvantifiera uttryck som beskriver sannolikheter i matematiska termer. Det är först då som man dels kan vara överens om vad de betyder, ställa dem i relation till varandra, beskriva verkligheten som den ser ut samt fatta rationella beslut utgående från ordvalen. Det är ungefär lika väsentligt när det gäller försvarsbeslut som i klimatfrågor.

Jag använder samma metod som Henrik Rosenkvist, dvs att invertera begreppet. Om ”kan uteslutas” är extremt osannolikt så ger jag det en sannolikhet som är mindre än 1% (Ja man kan diskutera om det skulle vara 0,0001% eller något liknande, men det spelar ingen roll för slutsatserna). Därmed får begreppet ”kan inte uteslutas” en sannolikhet som är större än 1%. Och den sträcker sig upp till 100%.

Begreppet ”osannolikt” har i andra sammanhang, tex rörande klimat (se tabellen nedan) en sannolikhet som är lägre än 33%. Jag tycker själv att det låter som ett stort tal, men min tes håller i alla fall (och stärks ytterligare om vi låter ”osannolik” vara tex <5%).

Vad har vi då? Jo,

  • kan inte uteslutas” är > 1%, dvs en sannolikhet som sträcker sig från 1% till 100%.
  • osannolik” är < 33%, dvs en sannolikhet som sträcker sig från 0% till 33%. (eller från 0 till 5%.)

Vilken av dessa innebär störst risk? Man kan börja med att konstatera att de är överlappande, dvs det kan finnas tveksamma situationer. Men man kan inte, såsom professor Rosenkvist gör, dra slutsatsen att ”osannolik” innebär större sannolikhet än ”kan inte uteslutas”. Och framför allt ser man att situationer som är mer sannolika än ”osannolik” bara omfattas av begreppet, ”kan inte uteslutas”.

När det gäller klimatförändringar så har man definierat begrepp som rör sannolikheter för att kunna tala om dem i vanlig text och tal på ett ledigt sätt utan att blanda in för mycket siffror. Tabellen med sannolikheterna nedan är i och för sig på engelska, men med en konsekvent översättning så kan man använda dem även på svenska.

Från IPCC Assessments of Climate Change and Uncertainties.

The standard terms used in this report to define the likelihood of an outcome or result where this can be estimated probabilistically are:

Likelihood Terminology Likelihood of the occurrence/ outcome
Virtually certain > 99% probability
Extremely likely > 95% probability
Very likely > 90% probability
Likely > 66% probability
More likely than not > 50% probability
About as likely as not 33 to 66% probability
Unlikely < 33% probability
Very unlikely < 10% probability
Extremely unlikely < 5% probability
Exceptionally unlikely < 1% probability

 

Men definitionerna ovan passar illa på det språkliga användandet av ”osannolikt”. Om Sveriges tidigare policy var att ett väpnat angrepp mot oss var ”osannolikt” och detta motsvarade <33% sannolikhet så skulle ”nästa nivå” vara ”about as likely as not” eller 33-66%. Det förefaller vara väldigt stor risk.

Men då kommer också tidsaspekten in. Vilken horisont talar vi om? Är det innevarande år, tio eller 30 år? Med tanke på den tid det tar att bygga upp en försvarsmakt så kanske det är de längre tidsaspekterna man skall ta i beräkning och då ackumuleras riskerna över de betraktade åren.

Rimligtvis så kan man inte betrakta sannolikheten för väpnat angrepp mot Sverige som en slumpmässig händelse. Utfallen av en försvarspolitik är annorlunda än sannolikheter när man kastar tärning. Risken för väpnat angrepp är inte en parameter som är oberoende av länders agerande. Eller formulerat utan de två negationerna: Risken för angrepp är beroende av hur nationerna agerar.

Risken för angrepp är först och främst beroende av beslut som främmande makt fattar. Och det innefattar, rimligen, den potentiella angriparens uppfattning av vad man har att vinna på ett angrepp och den angripna nationens förmåga att försvara sig. Om främmande makt uppfattar att de kan angripa en nation utan att riskera skada eller motgångar så ökar rimligen sannolikheten för angrepp.

Det är i alla fall logiken bakom att rusta upp försvaret när man upplever att hoten från andra nationer ökar. Genom att pressa upp priset för angrepp som pressar man ner sannolikheten för att det skall inträffa.

Men det var inte det som artikeln skulle handla om.

Min slutsats är att det är viktigt att ha tydliga definitioner av sitt språk när man fattar viktiga beslut på basis av språket. Och när det gäller sannolikheter så är det bättre att definiera ordval utifrån en matematisk beskrivning av sannolikheterna, än tvärtom.

/Martin

Därför förvanskas experternas fakta genom media. Ibland.

Fiktiv löpsedel

Häromdagen gjorde jag en intervju för en kvällstidning. Jag hörde hur journalisten fiskade efter något som ”stack ut” lite. Vis av erfarenheten höll jag igen. Jag vet nämligen allt för väl hur en liten kommentar i en bisats lätt kan bli såväl rubrik som löpsedel. Det är i och för sig inte journalistens ”fel” utan snarare den personen som sätter rubrikerna. 

Men det finns också något mer grundläggande i systemet som gör att man som sakkunnig ofta känner att det blir lite väl hård vinkel på ens yttrande. Medias roll är nämligen inte att bara ge den breda bilden. Minst lika ofta handlar det om att finna extremer. Det är inte bara för att kunna sälja lösnummer, nej det är minst lika viktigt för att det är extremerna i sig som är viktiga.

Fiktiv löpsedelNär vi meteorologer blir intervjuade på temat ”vädret kommande dagar” så fokuserar jag på det som de flesta kommer att uppleva. Om det skulle vara något extremt som kan betraktas som ”samhällsfarligt” så tar jag givetvis med det också. Men om det är något pseudo-extremt som en dag med solsken efter en vecka med mulet väder, eller svaret på frågan om var man hittar det ”bästa” vädret, då passar jag.

Utöver det så går det inte att beräkna vädret exakt. Men eftersom prognoserna (även de vi publicerar på Klart) anger ett tal för såväl temperatur som vindar och nederbörd så upplevs de som mycket precisa. Men vi vet att det handlar om sannolikheter för det ena eller andra. Det gäller såväl i tid som i rum.

Normalfördelningskurva”Normalfördelning”. Låter krånglig, men det går bra att läsa resten av artikeln utan att greppa alla detaljer i matematiken 🙂

Bättre vore att ha ett intervall. Ovan ser ni en graf som visar en så kallad ”normalfördelning”. Den speglar verkligheten avsevärt mycket bättre. På y-axeln anges sannolikheten för att något av värdena på x-axeln skall inträffa. Det kan vara mycket skilda saker som tex: bränsleförbrukningen i din bil, antal sidor i en pocketbok, tidpunkten då äppelträdet blommar, temperaturen på midsommarafton, lufttrycket i Skövde osv.

Standardavvikelsen, σ (sigma), är ett mått på hur mycket de enskilda värdena, tex temperaturen på en enskild plats, avviker från medelvärdet (μ) av temperaturerna. Tex finner man knappt 70% av de enskilda fallen inom ± 1 standardavvikelse. Går man ut till två standardavvikelser så finner man 95% av observationerna.

Vad vill jag säga med detta? Jo ett par saker:

  1. Ibland befinner sig våra prognoser, i synnerhet de långa prognoserna, i ytterkanten av normalfördelningskurvan. Jag vill då försöka ”dra in” dem mot mitten för att bättre representera verkligheten.
  2. Jag strävar efter att inte bara presentera ett värde (tex medelvärdet μ) av vädret, utan snarare ett intervall. Genom att visa intervallet ±1,5 σ så får man en bra representation av den verklighet som de flesta kommer att uppleva. (Det blir dock lätt ”rörigt” rent grafiskt om man skall göra detta på webben eller i mobiltelefon.)
  3. Journalister och i synnerhet rubriksättare är mest intresserade av det som ligger i ytterkanterna. Om det kan bli översvämning någonstans så säger jag ”Det skulle kunna bli översvämning någonstans”. Men rubriken/löpsedeln blir istället ”VÄDERKAOS: ÖVERSVÄMNINGAR!”. Eller om det generellt blir mellan 20 och 25 grader, lokalt lite varmare så blir rubriken: ”SOMMARSMOCKA +30”.
  4. Ett dilemma är att det ofta är extrempunkterna som verkligen är viktiga. De som drabbas av översvämningar drabbas hårt. Men vänder man kameran åt andra hållet så är det bara blött i gräset. Det genomförs miljontals flygningar varje år, men enstaka flygkrascher gör att folk är räddare för att flyga än att köra bil. Det är som med lotteri: Sannolikheten för att vinna är en på flera miljoner, ändå tror folk att turen skall drabba just dem. Det händer att man får en skev bild av verkligheten genom media (och marknadsförare). Men den som drabbas av det extrema påverkas givetvis väldigt mycket.
  5. Risken med en sån här belysning är att folk tror att media ALLTID ger en skev bild. Det gör de givetvis inte. Det jag vill säga är att man skall läsa kritiskt. Framför allt skall man läsa löptexten och inte bara rubrikerna. Ju längre från källan desto större sannolikhet för att fakta är vinklat, förvanskat eller i alla fall kraftigt förenklat med en dragning åt det extrema och spektakulära.

/Martin