Herhaalde Prisoner’s Dilemma
Wat is het herhaalde gevangenendilemma?
Het herhaalde prisoner’s dilemma is een uitbreiding van de algemene vorm, behalve dat het spel herhaaldelijk door dezelfde deelnemers wordt gespeeld. Een herhaald prisoner’s dilemma verschilt van het oorspronkelijke concept van een prisoner’s dilemma omdat deelnemers kunnen leren over de gedragstendensen van hun tegenpartij.
Het herhaalde dilemma van de gevangene wordt soms het Peace-War-spel genoemd.
Inzicht in het herhaalde gevangenendilemma
Omdat het spel wordt herhaald, kan één persoon een strategie formuleren die niet de normale logische conventie van een geïsoleerde ronde volgt. Tit for tat is een veel voorkomende herhaalde dilemmastrategie van gevangenen.
Het herhaalde dilemmaspel van de gevangene is fundamenteel voor veel theorieën over menselijke samenwerking en vertrouwen. Op basis van de aanname dat het spel transacties tussen twee personen kan modelleren die vertrouwen vereisen, kan coöperatief gedrag in populaties worden gemodelleerd door een herhaalde versie van het spel voor meerdere spelers.
De theorie achter het spel heeft door de jaren heen veel wetenschappers geboeid. Meer recent hebben onderzoekers van organisatieontwerp het spel gebruikt om bedrijfsstrategieën te modelleren. Het prisoner’s dilemma is nu ook gemeengoed geworden doordat speltheorieën populair worden bij investeringsstrateeg. Globalisering en geïntegreerde handel hebben de vraag naar financiële en operationele modellen die geopolitieke problemen kunnen beschrijven verder gestimuleerd.
Voorbeeld van het herhaalde Prisoner’s Dilemma-spel
U en een collega zitten bijvoorbeeld in de gevangenis en worden verdacht van het plegen van een misdrijf. Je bent van elkaar geïsoleerd en weet niet hoe de ander zal reageren op vragen. De politie nodigt jullie beiden uit om de ander bij het misdrijf (defect) te betrekken. Wat er gebeurt, hangt af van wat jullie beiden doen, maar jullie weten geen van beiden hoe de ander zal reageren.
Als je collega je verraadt (toegeeft aan de verleiding om over te lopen) terwijl je zwijgt, dan krijg je de langste gevangenisstraf terwijl je collega vrij komt (en vice versa). Als jullie er allebei voor kiezen om met elkaar samen te werken (niet de politie) door te zwijgen, is er onvoldoende bewijs om jullie beiden te veroordelen, dus jullie krijgen allebei een lichte straf voor een mindere misdaad. Als jullie allebei besluiten over te lopen, dan hebben jullie elkaar veroordeeld tot licht gereduceerde maar nog steeds zware straffen.
De uitbetaling in dit spel is een vermindering van de gevangenisstraf van zeer goed, redelijk goed, redelijk slecht of zeer slecht, wat als volgt wordt vertaald in een puntensysteem:
Het spel wordt iteratief gespeeld voor een aantal rondes totdat het is afgelopen (alsof je herhaaldelijk wordt ondervraagd voor afzonderlijke misdaden). De scores van elke ronde worden opgeteld, dus het doel is om de puntenscore te optimaliseren voordat het spel voorbij is. Game-over wordt willekeurig tussen 1 en 100 ronden bepaald. Aan het einde van het spel worden de scores vertaald in percentages van de best mogelijke scores.