Nash ja luonnon koodi
Luin Tom Siegfriedin kirjan peliteoriasta ja luonnon koodeista. Oli hämmästyttävää havaita, miten olemme aivan uuden ajan kynnyksellä. Vuosikymmenten ajan on ollut kypsymässä erilaisia tieteenhaaroja, jotka nyt yhtyvät. Kaaos ja kompleksisuuden teoria yhdistettynä uusiin talousteorioihin tulee olemaan iso mullistus. Luulen, että monet suuret tieteelliset keksinnöt ovat tuleet vähitellen. Uskon, että suhteellisuusteoria oli "Ilmassa roikkumassa", kunnes Einstein sen sitten läväytti esiin.
Siegfied käsittelee enimmäkseen peliteoriaa ja sitä, miten sillä voidaan mallittaa ja kuvata ihmisten käyttäytymistä.
John Nash kehitti aikanaan matemaattisen peliteorian kulmakiven, tavan laskea tasapainopiste pelille, Nash-tasapaino. Siegfrid ottaa esimerkin eläinmaailmasta. Oletetaan pienehkö lampi ja siinä 100 sorsaa. Kaksi henkilöä menee syöttämään leipäpaloilla sorsia lammelle. Kumpikin eri päähän. Toinen heittää leipäpalan joka kymmenes sekunti, kun toinen syöttää sorsia jatkuvalla syötöllä kerran sekunnissa.
Kyseessä on matemaattisen peliteorian sovellus. Jokaisen sorsan täytyy valita kahdesta strategiasta: joko menen jatkuvalla syötöllä leipää heittävän luokse, tai sen kaverin eteen, jolta leipää tulee harvemmin. Miten sorsa voi optimoida saamiensa leipäpalojen määrän?
Jos sorsa menee paljon leipää heittävän eteen, voi siellä olla kaaos. Ehkä kaikki muutkin sorsat ovat siellä ja suupalaa on vaikea saada? Jos minä olisin sorsa, haluaisin ehkä mennä vähän leipää heittävän eteen, koska lopulta kuitenkin saisin enemmän ruokaa.
Vaikea juttu, jonka matemaattinen peliteoria tekee yksinkertaiseksi. Voidaan laskea, että sorsan optimaalinen sekastrategia on semmoinen, jossa 2/3 kerroista pitäisi olla paljon leipää syöttävän edessä ja 1/3 toisessa päässä. Se on tämän pelin Nash tasapainopiste. Silloin ei ole enää väliä, kumpaan päähän menee – tasapainon ilmentymä.
Yksinkertainen peli. Ei siinä mitään.
Se, mikä tuossa on hämmästyttävää on, että sitä on joku kokeillut sitä käytännössä. Heti, kun sorsat havaitsevat leivänheittäjien heittotaajuudet, ne asettuvat juuri Nash tasapainon edellyttämällä tavalla. Minusta tuossa on jotain melkein pelottavaa, koska sorsat eivät tietääkseni osaa matematiikkaa. Jo tuolla perusteella voisi uskoa, että peliteorian menetelmillä voi olla käyttöä myös ihmisten käyttäytymisen selittämisessä – ja ehkä ennakoimisessa.
Siirrytään sorsista ihmisiin. Peliteorian artikkelit usein aloitetaan vangin dilemman kuvauksella (prisoner's dilemma). Poliisi saa kiinni kaksi rikollista. Kumpaakin kuulustellaan erikseen. Molemmille tarjotaan diiliä: jos petät kaverisi, pääset ilman rangaistusta. Jos pysyt tuppisuuna ja kaverisi pettää, saat 10 vuotta linnaa. Jos sattuisitte molemmat vaikenemaan, silloin pääsisitte vuodella molemmat.
Ei ole helppoa rikollisen elämä tuossa tilanteessa. Parasta olisi pysyä tuppisuuna, mutta voinko luottaa partneriini? Hänellä on selkeä motiivi pettää.
Nash tasapaino tuossa pelissä on se, että molemmat pettävät.
Siegfrid kuvaa vangin dilemman soveltamista oikeaan elämään. Muutetaan vähän pelin termejä. Oletetaan, että ihmisellä on kaksi vaihtoehtoista käyttäytymistä. Minä olen paha tai voin olla hyvä. Pelaajien hyödyt ovat samat, kuin vangin dilemma pelissä. Parasta molemmille olisi olla hyvä, mutta se tilanne ei ole tasapainopiste, koska jompikumpi voi aina pettää (olla paha) ja saada siitä väliaikaista hyötyä hyvän kustannuksella (hyväksikäyttö).
Vangin dilemma pelin toistuvaa versiota on tutkittu paljon. Kun peliä pelataan monta kierrosta, dynamiikka muuttuu erilaiseksi. Toiston lisääminen on tietysti olennaista, mikäli halutaan kuvata oikeaa elämää edes jollain tavoin.
Kokeissa on selvinnyt, että eräs parhaista strategioista on sellainen, jota kuvaan sanalla"rankaisija". Minä olen hyvä, niin kauan kun vastustaja on hyvä. Heti, kun vastustaja on paha (eli käyttää hyväksi hyvyyttäni), minä vastaan olemalla paha. Sen jälkeen olen hyvä ja toivon vastustajan siirtyneen takaisin kaidalle tielle. Pahuutta ei kannata jatkaa, mikäli vastassa on tällainen "rankaisija" ja päästään "rankaisijoiden" kansoittamaan maailmaan.
Minusta tuossa johtopäätöksessä on paljon syvällistä tietoa siitä, miten ihmiset oikeassa maailmassa käyttäytyvät. Jeesus sanoi, että pahaan pitää vastata tekemällä seitsemän kertaa hyvää. Hän oli väärässä.
Tätä "elämän peliä" voi palata myös Internetissä. Vastustaja on itse pääpiru Lucifer:
http://www.iterated-prisoners-dilemma.net/
Ei kommentteja:
Lähetä kommentti