24 juni 2021 22:04

Prisoner’s Dilemma

Wat is het dilemma van de gevangene?

Het prisoner’s dilemma is een paradox in beslissingsanalyse waarbij twee individuen die handelen in hun eigenbelang niet het optimale resultaat opleveren. Het typische prisoner’s dilemma is zo opgezet dat beide partijen ervoor kiezen zichzelf te beschermen ten koste van de andere deelnemer. Als gevolg hiervan bevinden beide deelnemers zich in een slechtere staat dan wanneer ze met elkaar hadden samengewerkt in het besluitvormingsproces. Het prisoner’s dilemma is een van de meest bekende concepten in de moderne speltheorie.

Belangrijkste leerpunten

  • Het dilemma van een prisoner’s is een situatie waarin individuele besluitvormers altijd een prikkel hebben om te kiezen op een manier die een minder dan optimale uitkomst creëert voor de individuen als groep.
  • De dilemma’s van gevangenen doen zich voor in veel aspecten van de economie.
  • Mensen hebben veel methoden ontwikkeld om de dilemma’s van gevangenen te overwinnen om, ondanks ogenschijnlijk ongunstige individuele prikkels, betere collectieve resultaten te kiezen.

Het dilemma van de gevangene begrijpen

Het dilemma van de gevangene stelt een situatie voor waarin twee partijen, gescheiden en niet in staat om te communiceren, elk moeten kiezen tussen samenwerking met de ander of niet. De hoogste beloning voor elke partij vindt plaats wanneer beide partijen ervoor kiezen om samen te werken. 

Het klassieke prisoner’s dilemma gaat als volgt: twee leden van een bende bankovervallers, Dave en Henry, zijn gearresteerd en worden in aparte kamers verhoord. De autoriteiten hebben geen andere getuigen en kunnen de zaak tegen hen alleen bewijzen als ze ten minste één van de overvallers kunnen overtuigen om zijn medeplichtige te verraden en te getuigen van de misdaad. Elke bankovervaller staat voor de keuze om samen te werken met zijn medeplichtige en te zwijgen of om uit de bende over te lopen en te getuigen voor de vervolging. Als ze allebei samenwerken en zwijgen, kunnen de autoriteiten hen alleen veroordelen op basis van een lagere beschuldiging van rondhangen, wat betekent dat elk een jaar gevangenisstraf betekent (1 jaar voor Dave + 1 jaar voor Henry = 2 jaar totale gevangenisstraf). tijd). Als de een getuigt en de ander niet, dan gaat degene die getuigt vrijuit en krijgt de ander drie jaar (0 jaar voor degene die gebreken heeft + 3 voor degene die is veroordeeld = 3 jaar in totaal). Als beide echter tegen elkaar getuigen, krijgen ze elk twee jaar gevangenisstraf omdat ze gedeeltelijk verantwoordelijk zijn voor de overval (2 jaar voor Dave + 2 jaar voor Henry = 4 jaar totale gevangenisstraf).

In dit geval heeft elke overvaller altijd een prikkel om over te lopen, ongeacht de keuze die de ander maakt. Vanuit het oogpunt van Dave, als Henry zwijgt, kan Dave ofwel samenwerken met Henry en een jaar in de gevangenis doorbrengen, of overlopen en vrijuit gaan. Het is duidelijk dat hij in dit geval beter af is als hij Henry en de rest van de bende verraadt. Aan de andere kant, als Henry tekent en tegen Dave getuigt, wordt Dave’s keuze ofwel om te zwijgen en drie jaar te doen, of om te praten en twee jaar gevangenisstraf te doen. Nogmaals, natuurlijk zou hij de twee jaar liever over drie doen.

In beide gevallen, of Henry nu samenwerkt met Dave of gebreken aan de aanklager, Dave zal beter af zijn als hij zelf gebreken vertoont en getuigt. Nu Henry voor exact dezelfde reeks keuzes staat, zal hij ook altijd beter af kunnen lopen. De paradox van het dilemma van de gevangene is dit: beide overvallers kunnen de totale gevangenisstraf die de twee zullen doen minimaliseren als ze allebei samenwerken (in totaal 2 jaar), maar de prikkels waarmee ze elk afzonderlijk worden geconfronteerd, zullen hen altijd drijven. om over te lopen en uiteindelijk de maximale totale gevangenisstraf tussen de twee te doen (in totaal 4 jaar).

Voorbeelden van het Prisoner’s Dilemma

De economie staat vol met voorbeelden van prisoner’s dilemma’s die uitkomsten kunnen hebben die zowel gunstig als schadelijk zijn voor de economie en de samenleving als geheel. De rode draad zijn situaties waarin de prikkels waarmee elke individuele beslisser die mag kiezen, hen ertoe zouden aanzetten zich zo te gedragen dat ze allemaal collectief slechter af zijn, terwijl ze individueel keuzes vermijden die ze allemaal collectief beter af zouden maken als dat allemaal zou kunnen. kies op de een of andere manier samen. 

Een voorbeeld hiervan is de tragedie van de commons. Het kan in ieders collectieve voordeel zijn om te behouden en te herinvesteren in de verspreiding van een gemeenschappelijke natuurlijke hulpbron om deze te kunnen blijven consumeren, maar elk individu heeft altijd een stimulans om in plaats daarvan zoveel mogelijk zo snel mogelijk te consumeren, wat put vervolgens de bron uit. Als we een manier vinden om samen te werken, zou iedereen hier duidelijk beter af zijn.

Anderzijds kan het gedrag van kartels ook als een prisoner’s dilemma worden beschouwd. Alle leden van een kartel kunnen zich collectief verrijken door de productie te beperken om de prijs die elk ontvangt hoog genoeg te houden om de economische huur van de consumenten binnen te halen, maar elk kartellid heeft afzonderlijk een prikkel om het kartel te bedriegen en de productie te verhogen om ook de andere kartelleden. In termen van het welzijn van de algehele samenleving waarin het kartel opereert, is dit een voorbeeld van hoe een prisoner’s dilemma dat het kartel afbreekt, de samenleving als geheel soms zelfs beter af kan maken. 

Ontsnap uit het Prisoner’s Dilemma

In de loop van de tijd hebben mensen verschillende oplossingen uitgewerkt voor de dilemma’s van gevangenen om individuele prikkels ten gunste van het algemeen welzijn te overwinnen.

Ten eerste worden in de echte wereld de meeste economische en andere menselijke interacties meer dan eens herhaald. Een echt prisoner’s dilemma wordt doorgaans maar één keer gespeeld, anders wordt het geclassificeerd als een iterated prisoner’s dilemma. In een herhaald gevangenendilemma kunnen de spelers strategieën kiezen die samenwerking belonen of afvalligheid na verloop van tijd bestraffen. Door herhaaldelijk met dezelfde individuen om te gaan, kunnen we zelfs opzettelijk van een eenmalig prisoner’s dilemma naar een herhaald prisoner’s dilemma gaan.

Ten tweede hebben mensen formele institutionele strategieën ontwikkeld om de prikkels waarmee individuele besluitvormers worden geconfronteerd, te veranderen. Collectieve actie om coöperatief gedrag af te dwingen door middel van reputatie, regels, wetten, democratische of andere collectieve besluitvorming en expliciete sociale bestraffing voor afvallers, transformeert de dilemma’s van veel gevangenen in de richting van de meer collectief voordelige coöperatieve resultaten.  

Ten slotte hebben sommige mensen en groepen mensen in de loop van de tijd psychologische en gedragsmatige vooroordelen ontwikkeld, zoals een groter vertrouwen in elkaar, toekomstgerichtheid op de lange termijn in herhaalde interacties en neigingen naar positieve wederkerigheid van coöperatief gedrag of negatieve wederkerigheid van afwijkend gedrag. Deze tendensen kunnen zich in de loop van de tijd ontwikkelen door een soort natuurlijke selectie binnen een samenleving, of door groepsselectie in verschillende concurrerende samenlevingen. In feite leiden ze groepen individuen ertoe om “irrationeel” uitkomsten te kiezen die in feite het meest voordelig zijn voor hen allemaal samen.

Samengevat, helpen deze drie factoren (de herhaalde dilemma’s van de gevangene, formele instituties die de dilemma’s van de gevangenen doorbreken en gedragsvooroordelen die de ‘rationele’ individuele keuze in de dilemma’s van gevangenen ondermijnen) bij het oplossen van de vele dilemma’s van gevangenen waarmee we allemaal te maken zouden krijgen.