Iterated Prisoner's Dilemma – uudelleen
Kehittelen eteenpäin ajatuksia vangin dilemmasta. Asia on mielenkiintoinen, koska vangin dilemma on niin yleinen käytännön elämässä. Tarjouskilpailut, yritysten kilpailustrategiat, oikeudenkäyntistrategiat, markkinalletulon logiikka – listaa vangin dilemman sovelluksista voisi jatkaa loputtomiin. Vähimpänä ei ole ilmastonmuutos. Kööpenhaminassa tehdään, ehkä, sopimuksia vangin dilemman hengessä.
Kävin myös läpi vangin dilemman kirjallisuutta. Tutkimuksia on paljon. En kuitenkaan löytänyt mitään viitteitä omiin havaintoihini. Rakensin toistuvan vangin dilemman yhtälöt ja ratkaisin Nash tasapainoyhtälöt sekastrategioille reaalimaailmaa vastaavassa tilanteessa. Malli perustui siihen, että kahden osapuolen kokonaisuus on ikäänkuin bistabiili tilakone, jossa ollaan joko luottamuksen tai epäluottamuksen tilassa. Näiden tilojen kesken tapahtuu siritymää, kun jompikumpi osapuoli joko tekee aloitteen yhteistyöstä, tai sitten käyttää toista hyväkseen.
Tällaisella tilakoneella on Nash tasapainotila, ollaan tietty aika kummassakin bistabiilissa tilassa.
Kirjoitan joskus puhtaaksi perustelut tuolla bistabiilille tilakoneratkaisulle. Olennaista kuitenkin on se, että tällainen kahden osapuolen järjestelmä on jatkuvassa liikkeessä, mutta kuitenkin tasapainossa. Tätä oivallusta en löytänyt vangin dilemma kirjallisuudesta mistään.
Toinen hämmästyttävä havainto on se, kuinka paljon tuollainen "värähtelymalli" muistuttaa erilaisia fysiikan järjestelmiä. Atomitason hiukkaset tyypillisesti värähtelevät tilojensa välissä energiatasonsa mukaan.
Voisi ajatella, että erilaisten vuorovaikutustilanteiden makrotasoon pätevät samanlaiset lait, kuten Maxwellin tilastollisessa teoriassa. Tämän suuntaisia spekulaatioita esitti myös Tom Siegfrid kirjassaan viemättä niitä kuitenkaan alkua pidemmälle.
Tuo ajatus vuorovaikutustilanteeseen sisältyvästä energiatasosta saa ajattelemaan erilaisia vaihtoehtoisia "atomaarisia" vangin dilemma tilanteita.
Vangin dilemma voi olla sellainen, jossa yhteistyön purkamiseen (hyväksikäyttöön) liittyvät insentiivi on huomattavan korkea. Sanotaan, vaikka epästabiili yhteityön tila tuo osallistujille tuottoa kaksi yksikköä. Oletetaan, että Nash tasapaino (pure strategy) on epäluottmauksen tila, jossa tuotto on yksi yksikköä molemmille. Mitä tapahtuu, jos toinen osapuoli voi hyötyä hyväksikäytöstä vaikka miljoona yksikköä?
Tuossakin pelissä tasapaino on epäluottamuksen tila. Mutta, liikettä voi olettaa olevan, sillä asioiden mennessä sopivasti, tuloksena on miljoona.
Voidaan sanoa, että tuollaisessa vuorovaikutustilanteessa on erittäin runsaasti "energiaa". Teen muutaman yksinkertaistavan oletuksen ja saan tuloksen, jonka mukaan molempien osallistujien kannattaa yrittää yhteistyötä joka toinen kerta.
Tämän järjestelmän "lämpötila" on lähes maksimaalinen. Vastaavalla tavalla voi rakentaa vuorovaikutuspelin, jossa lämpötila lähenee nollaa. Ja, sillon värähtely tilojen välillä hiipuu.
1 kommentti:
erittain mielenkiintoinen, kiitos
Lähetä kommentti