Uforutsigbarhet som virkemiddel

Spillteori handler i stor grad om å finne den beste strategien i en gitt situasjon. Noen ganger er det imidlertid dumt å velge én enkelt handling som sin strategi. Det kan være best å bruke det vi kaller en blandet strategi, som enklere kan beskrives som uforutsigbarhet.

Noen eksempler kan gjøre det lett å se når uforutsigbarhet kan gi en fordel. La oss f.eks. si at du er en general (Ditt navn er Sun), som har to mulige valg når du skal angripe en fiende (ved navn Tzu): et frontalangrep eller et flankeangrep. Hva som er den beste strategien avhenger både av dine egne styrker og motstanderens organisering av sine styrker. La oss nå si at motstanderen også har to muligheter, og kan organisere sine tropper slik at de som kan forsvare dem går i front, eller spre forsvarsstyrkene bakover i troppen. I den følgende tabellen ser vi deres sjanser for å komme seirende ut av konflikten ved valg av de forskjellige strategiene. Om du, Sun, velger frontalangrep, og Tzu har organisert sine styrker med forsvar i front, vil du ha 40% sjanse for å komme seirende ut av det. Tzus sjanser er da nødvendigvis 60%, siden dette er det vi kaller et nullsumspill – din gevinst er motstanderens tap, og vice versa. Dersom du angriper front og Tzu har spredt sitt forsvar, har du imidlertid 80% sjanse for at angrepet skal bli vellykket.

Her finnes ingen dominante strategier, siden ditt beste valg avhenger av hvordan Tzu disponerer sine styrker. Likeså avhenger Tzu beste disposisjoner av hvor du tenker å angripe. Hva gjør vi så i denne situasjonen? Dersom generalene velger én strategi og holder seg til denne, er de opplagt sårbare. Om Tzu velger å alltid spre sine styrker vil det være lett for enhver motstander å beseire ham ved å angripe i front. Likeså vil du som general være svært utsatt om du velger frontalangrep som din rene strategi. Om dette er et mønster andre kan finne ut av vil de enkelt forsvare sin front, og dine sjanser for å lykkes vil være relativt dårlige. Det beste dere kan gjøre er å være uforutsigbare!

Regelen for å avgjøre om en blandet strategi er ditt beste alternativ er enkel: Spør deg selv om det ville skadet deg om motstanderen visste hva du kom til å velge! I denne situasjonen ville det være en opplagt fordel for den av spillerne som visste hva den andre kom til å gjøre i forkant, og dermed er en blandet strategi en fordel.

Andre eksempler hvor blandede strategier vil være fordelaktige kan være når man spiller sten, saks og papir. Et annet eksempel er en straffesparkkonkurranse, hvor målvakt antas å måtte velge side før han kan observere hvilken side skytteren velger. Et annet igjen kan være tolleren som skal velge om han skal ha kontroll på grensen eller ikke. Er det alltid kontroll vil ingen bli tatt (fordi ingen smugler, men det blir veldig kostbart), og er det aldri kontroll vil alle kunne smugle fritt. Det beste er en blandet strategi med tilfeldige kontroller. La oss gå tilbake til krigseksempelet.

Uforutsigbarhet som tilfeldighet

Den enkleste måten å være uforutsigbar på er kanskje å slå kron eller mynt, og så velge strategi deretter. I så fall er det 50% sjanse for at du velger et frontalangrep og 50% sjanse for at du velger flankeangrep. I det følgende gjøres prosenter om til proporsjoner (50% = 0,5 – 20% = 0,2 osv).

Dersom Tzu velger å forsvare sin front blir din forventede gevinst 0,5*0,4 + 0,5*0,7 = 0,55 = 55\%.

Dersom Tzu i stedet forsvarer sin flanke ved å spre styrkene blir din forventede gevinst 0,5*0,8 + 0,5*0,4 = 0,6 = 60\%.

Om Tzu forstår at du velger tilfeldig vil han altså velge å forsvare sin front, for å holde dine sjanse nede på 55% fremfor 60%.

Om du hadde valgt en ren strategi, og Tzu hadde forstått dette, hadde du altså endt opp med 40% sjanse for seier, men ved å velge tilfeldig øker du sjansen til (minst) 55%.

Blandet strategi og nash-likevekt

Det er imidlertid mulig å gjøre det enda bedre enn ved å slå kron eller mynt: vi kan bruke matematikkens mystiske krefter til å hjelpe oss! Her begynner det å bli litt mer avansert, så hent gjerne en kaffe, finn frem et kladdeark og følg med på utregningene – de kan være nyttige!

For å finne den optimale sannsynligheten for hver strategi, begynner vi med å sette opp en ligning (bli glad i ligninger – de er ikke så skumle som de ser ut til, og de kan hjelpe oss!). La oss nå anta at sannsynligheten for at Tzu velger front er y, mens sannsynligheten for at han velger flanke/spredt er 1-y. Da blir Suns gevinst y*0,4 + (1-y)*0,8 om Sun velger front og y*0,7 + (1-y)*0,4 om han velger flanke.

Setter vi sammen disse to ligningene, og løser for y, får vi følgende:

\begin{aligned}    y*0,4 + (1-y)*0,8 & = y*0,7 + (1-y)*0,4 \\    0,4y + 0,8-0,8y & = 0,7y + 0,4 - 0,4y \\    0,4y - 0,8y - 0,7y + 0,4y & = 0,4 - 0,8 \\    -0,7y & = -0,4 \\    -\frac{-0,7y}{-0,7y} & = \frac{-0,4}{-0,7} \\    y & = 0,57 [avrundet]    \end{aligned}

La oss nå se hva Suns forventede gevinst er, om vi setter inn 57% sannsynlighet for at Tzu beskytter front og 43% (1-y) sjanse for at han sprer forsvaret.

Suns forventede gevinst for frontalangrep: 0,57*0,4 + 0,43*0,8 = 0,572

Suns forventede gevinst ved flankeangrep: 0,57*0,7 + 0,43*0,4 = 0,571

Vi ser altså at ved å bruke litt matematikk kan Tzu skape en situasjon hvor Sun anser de to strategiene som like! Han kan ikke forbedre situasjonen sin ved å velge den ene strategien over den andre.

Sun, som irriterer seg voldsom over at Tzu nå har ødelagt spillet med matematikk, bestemmer seg for å ta igjen med samme mynt. Samme prosedyre følger: for å finne den optimale sannsynligheten Sun bør bruke kaller vi x sannsynligheten for at han velger front og (1-x) sannsynligheten for at han velger flanke. Tzus gevinst blir da x*0,6 + (1-x)*0,3 om Sun velger front og x*0,2 + (1-x)*0,8 om han velger flanke. La oss sette ligningene sammen og løse dem:

\begin{aligned}    x*0,6 + (1-x)*0,3 & = x*0,2 + (1-x)*0,6 \\    0,6x + 0,3 - 0,3x & = 0,2x + 0,6 - 0,6x \\    0,6x - 0,3x - 0,2x + 0,6x & = 0,6 - 0,3 \\    0,7x & = 0,3 \\    -\frac{0,7x}{0,7} & = \frac{0,3}{0,7} \\    x & = 0,43  [avrundet]    \end{aligned}

La oss nå se hva Tzus forventede gevinst er, om vi setter inn 43% sannsynlighet for at Sun angriper front og 57% (1-x) sjanse for at han angriper flanken.

Tzus forventede gevinst ved frontforsvar: 0,43*0,6 + 0,57*0,3 = 0,429

Tzus forventede gevinst ved spredt forsvar: 0,43*0,2 + 0,57*0,6 = 0,428

Der har vi det! Sun har nå gjort det samme som Tzu, og ved å la tilfeldigheter avgjøre hvor han skal angripe, med 43% sannsynlighet for frontalangrep, blir strategiene til Tzu like mye verdt (og han kan derfor velge helt tilfeldig, eller sikre seg mot at Sun skal avvike fra matematikken ved å selv velge sitt matematisk utregnede frontforsvar 57% av tiden). Begge har her funnet det beste svaret mot ethvert trekk motstanderen kan utføre, og vi har her en Nash-likevekt i blandede strategier.

En veldig kort innføring i spillteori

Analyse av fangenes dilemma

Blandede strategier

 

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *