24 juni 2021 6:47

Hoe speltheorie-strategie besluitvorming verbetert

Speltheorie, de studie van strategische besluitvorming, brengt ongelijksoortige disciplines samen zoals wiskunde, psychologie en filosofie. De speltheorie is in 1944 uitgevonden door John von Neumann en Oskar Morgenstern en heeft sindsdien een lange weg afgelegd. Het belang van speltheorie voor moderne analyse en besluitvorming kan worden afgemeten aan het feit dat sinds 1970 maar liefst 12 vooraanstaande economen en wetenschappers de Nobelprijs voor de Economische Wetenschappen hebben gekregen voor hun bijdragen aan de speltheorie.

Speltheorie wordt toegepast op een aantal gebieden, waaronder zaken, financiën, economie, politieke wetenschappen en psychologie. Het begrijpen van speltheoretische strategieën – zowel de populaire als enkele van de relatief minder bekende strategieën – is belangrijk om iemands redeneer- en besluitvormingsvermogen in een complexe wereld te verbeteren.

Belangrijkste leerpunten

  • Speltheorie is een raamwerk voor het begrijpen van keuzes in situaties tussen concurrerende spelers.
  • Speltheorie kan spelers helpen bij het nemen van een optimale besluitvorming wanneer ze worden geconfronteerd met onafhankelijke en concurrerende actoren in een strategische omgeving.
  • Een veel voorkomende “spel” -vorm die in economische en zakelijke situaties voorkomt, is het prisoner’s dilemma, waarbij individuele besluitvormers altijd een prikkel hebben om te kiezen op een manier die een minder dan optimale uitkomst creëert voor de individuen als groep.
  • Er bestaan ​​verschillende andere spelvormen. De praktische toepassing van deze spellen kan een waardevol hulpmiddel zijn om te helpen bij de analyse van industrieën, sectoren, markten en elke strategische interactie tussen twee of meer actoren.

Prisoner’s Dilemma

Een van de meest populaire en basale speltheoretische strategieën is het prisoner’s dilemma. Dit concept onderzoekt de besluitvormingsstrategie van twee individuen die, door in hun eigen belang te handelen, slechtere resultaten opleveren dan wanneer ze überhaupt met elkaar hadden samengewerkt.

In het prisoner’s dilemma zitten twee verdachten die voor een misdrijf worden aangehouden in aparte kamers en kunnen ze niet met elkaar communiceren. De officier van justitie informeert zowel verdachte 1 als verdachte 2 afzonderlijk dat als hij bekent en tegen de ander getuigt, hij vrij kan gaan, maar als hij niet meewerkt en de andere verdachte wel, wordt hij veroordeeld tot drie jaar gevangenisstraf. Als beiden bekennen, krijgen ze een gevangenisstraf van twee jaar, en als geen van beiden bekent, krijgen ze een jaar gevangenisstraf.

Hoewel samenwerking de beste strategie is voor de twee verdachten, blijkt uit onderzoek dat de meeste rationele mensen, wanneer ze met een dergelijk dilemma worden geconfronteerd, er de voorkeur aan geven de ander te bekennen en tegen de ander te getuigen dan te zwijgen en het risico te nemen dat de andere partij bekent.



Aangenomen wordt dat spelers in het spel rationeel zijn en ernaar zullen streven om hun uitbetalingen in het spel te maximaliseren.

Het prisoner’s dilemma legt de basis voor geavanceerde speltheorestrategieën, waarvan de populaire zijn:

Bijpassende centen

Dit is een nulsomspel waarbij twee spelers (noem ze speler A en speler B) tegelijkertijd een cent op tafel leggen, waarbij de uitbetaling afhangt van het feit of de centen overeenkomen. Als beide centen kop of munt zijn, wint speler A en behoudt hij de cent van speler B. Als ze niet overeenkomen, wint speler B en behoudt hij de cent van speler A.

Impasse

Dit is een sociaal dilemmascenario zoals het prisoner’s dilemma, namelijk dat twee spelers kunnen samenwerken of defect kunnen raken (dat wil zeggen niet meewerken). In een impasse, als speler A en speler B beiden samenwerken, krijgen ze elk een uitbetaling van 1, en als ze allebei defect zijn, krijgen ze elk een uitbetaling van 2. Maar als speler A meewerkt en speler B defecten, dan krijgt A een uitbetaling. van 0 en B krijgt een uitbetaling van 3. In het uitbetalingsdiagram hieronder staat het eerste cijfer in de cellen (a) tot en met (d) voor de uitbetaling van speler A, en het tweede cijfer is dat van speler B:

Deadlock verschilt van het dilemma van een prisoners doordat de actie met het grootste wederzijdse voordeel (dwz beide defecten) ook de dominante strategie is. Een dominante strategie voor een speler wordt gedefinieerd als een strategie die de hoogste uitbetaling oplevert van alle beschikbare strategieën, ongeacht de strategieën die door de andere spelers worden gebruikt.

Een vaak genoemd voorbeeld van een impasse is dat van twee nucleaire mogendheden die proberen een overeenkomst te bereiken om hun arsenaal aan atoombommen te elimineren. Samenwerking houdt in dit geval in dat je je aan de overeenkomst houdt, terwijl overlopen in het geheim afzien van de overeenkomst en het behouden van het nucleaire arsenaal betekent. Het beste resultaat voor beide naties is helaas om af te zien van de overeenkomst en de nucleaire optie te behouden, terwijl de andere natie zijn arsenaal opheft, aangezien dit de eerste een enorm verborgen voordeel zal geven ten opzichte van de laatste als er ooit oorlog uitbreekt tussen de twee. De op een na beste optie is dat beiden defect raken of niet meewerken, aangezien dit hun status van nucleaire mogendheden behoudt.

Cournot Competitie

Dit model is conceptueel ook vergelijkbaar met het prisoner’s dilemma en is vernoemd naar de Franse wiskundige Augustin Cournot, die het in 1838 introduceerde. De meest voorkomende toepassing van het Cournot-model is het beschrijven van een duopolie of twee belangrijke producenten op een markt.

Stel dat bedrijven A en B een identiek product produceren en grote of kleine hoeveelheden kunnen produceren. Als ze allebei samenwerken en afspreken om op lage niveaus te produceren, zal een beperkt aanbod zich vertalen in een hoge prijs voor het product op de markt en aanzienlijke winsten voor beide bedrijven. Aan de andere kant, als ze defect raken en op hoge niveaus produceren, zal de markt worden overspoeld met als resultaat een lage prijs voor het product en bijgevolg lagere winsten voor beide. Maar als de ene meewerkt (dwz produceert op lage niveaus) en de andere defecten (dwz stiekem produceert op hoge niveaus), dan is de eerste gewoon break-even terwijl de laatste een hogere winst verdient dan wanneer ze allebei samenwerken. 

De uitbetalingsmatrix voor bedrijven A en B wordt weergegeven (cijfers vertegenwoordigen winst in miljoenen dollars). Dus als A samenwerkt en produceert op lage niveaus, terwijl B defecten en produceert op hoge niveaus, is de uitbetaling zoals weergegeven in cel (b) – break-even voor bedrijf A en $ 7 miljoen aan winst voor bedrijf B.

Coördinatiespel

In coördinatie verdienen spelers hogere uitbetalingen wanneer ze dezelfde actie kiezen.

Beschouw als voorbeeld twee technologiegiganten die beslissen tussen het introduceren van een radicaal nieuwe technologie in geheugenchips waarmee ze honderden miljoenen winst kunnen opleveren, of een herziene versie van een oudere technologie waarmee ze veel minder zouden verdienen. Als slechts één bedrijf besluit om door te gaan met de nieuwe technologie, zou de acceptatiegraad door de consumenten aanzienlijk lager zijn, en als gevolg daarvan zou het minder verdienen dan wanneer beide bedrijven zouden beslissen over dezelfde handelwijze. De uitbetalingsmatrix wordt hieronder weergegeven (cijfers vertegenwoordigen winst in miljoenen dollars).

Dus als beide bedrijven besluiten de nieuwe technologie te introduceren, zouden ze elk $ 600 miljoen verdienen, terwijl de introductie van een herziene versie van de oudere technologie hen elk $ 300 miljoen zou opleveren, zoals weergegeven in cel (d). Maar als bedrijf A alleen besluit om de nieuwe technologie te introduceren, zou het slechts $ 150 miljoen verdienen, ook al zou bedrijf B $ 0 verdienen (vermoedelijk omdat consumenten misschien niet bereid zijn te betalen voor zijn nu verouderde technologie). In dit geval is het logisch dat beide bedrijven samenwerken in plaats van alleen. 

Duizendpoot Spel 

Dit is een spel in uitgebreide vorm waarin twee spelers afwisselend de kans krijgen om het grootste deel van een langzaam toenemende geldvoorraad te pakken. Het duizendpootspel is opeenvolgend, aangezien de spelers hun bewegingen na elkaar uitvoeren in plaats van tegelijkertijd; elke speler kent ook de strategieën die zijn gekozen door de spelers die voor hen hebben gespeeld. Het spel is afgelopen zodra een speler de voorraad neemt, waarbij die speler het grotere deel krijgt en de andere speler het kleinere deel.

Stel bijvoorbeeld dat speler A als eerste gaat en moet beslissen of hij de stash moet “nemen” of “passen”, die momenteel $ 2 bedraagt. Als hij pakt, krijgen A en B elk $ 1, maar als A past, moet de beslissing om te nemen of te passen nu door speler B worden genomen. Als B pakt, krijgt zij $ 3 (dwz de vorige stash van $ 2 + $ 1) en A krijgt $ 0. Maar als B slaagt, mag A nu beslissen of hij wil nemen of passen, enzovoort. Als beide spelers er altijd voor kiezen om te passen, ontvangen ze elk een uitbetaling van $ 100 aan het einde van het spel.

Het punt van het spel is dat als A en B allebei samenwerken en blijven passen tot het einde van het spel, ze elk de maximale uitbetaling van $ 100 krijgen. Maar als ze de andere speler wantrouwen en verwachten dat ze bij de eerste gelegenheid “grijpen”,  voorspelt Nash-evenwicht dat de spelers de laagst mogelijke claim zullen nemen (in dit geval $ 1). Experimentele studies hebben echter aangetoond dat dit “rationele” gedrag (zoals voorspeld door de speltheorie) zelden in het echte leven wordt vertoond. Dit is niet intuïtief verrassend gezien de kleine omvang van de initiële uitbetaling in verhouding tot de laatste. Soortgelijk gedrag van proefpersonen is ook aangetoond in het reizigersdilemma.

Reizigersdilemma 

Dit non-zero-sum-spel, waarin beide spelers proberen hun eigen uitbetaling te maximaliseren zonder rekening te houden met de ander, werd in 1994 bedacht door econoom Kaushik Basu. In het reizigersdilemma komt een luchtvaartmaatschappij bijvoorbeeld overeen om twee reizigers een compensatie te betalen voor schade aan identieke items. De twee reizigers zijn echter afzonderlijk verplicht om de waarde van het item te schatten, met een minimum van $ 2 en een maximum van $ 100. Als beide dezelfde waarde noteren, vergoedt de luchtvaartmaatschappij elk van hen dat bedrag. Maar als de waarden verschillen, betaalt de luchtvaartmaatschappij hen de lagere waarde, met een bonus van $ 2 voor de reiziger die deze lagere waarde heeft genoteerd en een boete van $ 2 voor de reiziger die de hogere waarde heeft genoteerd.

Het Nash-evenwichtsniveau, gebaseerd op achterwaartse inductie, is in dit scenario $ 2. Maar net als in het duizendpootspel, laten laboratoriumexperimenten consequent zien dat de meeste deelnemers, naïef of anderszins, een aantal kiezen dat veel hoger is dan $ 2.

Het dilemma van de reiziger kan worden toegepast om een ​​verscheidenheid aan praktijksituaties te analyseren. Het proces van achterwaartse inductie kan bijvoorbeeld helpen verklaren hoe twee bedrijven die betrokken zijn bij een moordende concurrentie, hun productprijzen gestaag kunnen verlagen in een poging om marktaandeel te winnen, wat ertoe kan leiden dat ze tijdens het proces steeds grotere verliezen lijden.

Strijd tussen de seksen

Dit is een andere vorm van het coördinatiespel dat eerder is beschreven, maar met enkele uitbetalingsasymmetrieën. Het gaat in wezen om een ​​stel dat probeert hun avondje uit te coördineren. Hoewel ze hadden afgesproken om elkaar te ontmoeten bij het balspel (de voorkeur van de man) of bij een toneelstuk (de voorkeur van de vrouw), zijn ze vergeten wat ze besloten hadden, en om het probleem samen te stellen, kunnen ze niet met elkaar communiceren. Waar moeten ze heen? De uitbetalingsmatrix wordt hieronder weergegeven met de cijfers in de cellen die de relatieve mate van genot van de gebeurtenis voor respectievelijk de vrouw en de man weergeven. Cel (a) vertegenwoordigt bijvoorbeeld de uitbetaling (in termen van plezierniveaus) voor de vrouw en de man bij het stuk (ze geniet er veel meer van dan hij). Cel (d) is de uitbetaling als beide het balspel halen (hij geniet er meer van dan zij). Cel (c) vertegenwoordigt de ontevredenheid als beiden niet alleen naar de verkeerde locatie gaan, maar ook naar de gebeurtenis die ze het minst leuk vinden – de vrouw naar het balspel en de man naar het toneelstuk.

Dictatorspel 

Dit is een eenvoudig spel waarin speler A moet beslissen hoe hij een geldprijs deelt met speler B, die geen invloed heeft op de beslissing van speler A. Hoewel dit op zich geen speltheorie-strategie is, biedt het wel een aantal interessante inzichten in het gedrag van mensen. Uit experimenten blijkt dat ongeveer 50% al het geld voor zichzelf houdt, 5% het gelijk verdeelt en de andere 45% geeft de andere deelnemer een kleiner aandeel. Het dictatorspel is nauw verwant aan het ultimatumspel, waarin speler A een bepaald bedrag krijgt, waarvan een deel aan speler B moet worden gegeven, die het gegeven bedrag kan accepteren of weigeren. De vangst is dat als de tweede speler het aangeboden bedrag afwijst, zowel A als B niets krijgen. De dictator- en ultimatum-spellen bevatten belangrijke lessen voor zaken als donaties aan goede doelen en filantropie.

Vrede oorlog 

Dit is een variatie op het dilemma van de gevangene, waarin de beslissingen ‘meewerken of defecten’ worden vervangen door ‘vrede of oorlog’. Een analogie zou kunnen zijn dat twee bedrijven prijzenoorlog zou de uitbetalingen drastisch verminderen (cel d). Als A zich echter bezighoudt met prijsverlagingen (dwz “oorlog”) maar B niet, zou A een hogere uitbetaling van 4 hebben, aangezien het mogelijk een aanzienlijk marktaandeel kan veroveren, en dit hogere volume zou de lagere productprijzen compenseren.

Het dilemma van vrijwilligers

In het dilemma van een vrijwilliger moet iemand een karwei of baan voor het algemeen welzijn op zich nemen. Het slechtst mogelijke resultaat wordt gerealiseerd als niemand zich aanmeldt. Denk bijvoorbeeld aan een bedrijf waar boekhoudfraude hoogtij viert, maar het topmanagement hiervan niet op de hoogte is. Sommige junior medewerkers op de boekhoudafdeling zijn op de hoogte van de fraude, maar aarzelen om het topmanagement te vertellen, omdat dit ertoe zou leiden dat de bij de fraude betrokken medewerkers worden ontslagen en hoogstwaarschijnlijk worden vervolgd.

Als klokkenluider bestempeld worden,  kan later ook gevolgen hebben. Maar als niemand zich vrijwillig aanmeldt, kan de grootschalige fraude leiden tot het faillissement van het bedrijf en het verlies van ieders baan.

Veel Gestelde Vragen

Wat zijn de ‘games’ die in de speltheorie worden gespeeld?

Het wordt speltheorie genoemd omdat de theorie probeert de strategische acties van twee of meer “spelers” in een bepaalde situatie te begrijpen, met vaste regels en resultaten. Hoewel speltheorie in een aantal disciplines wordt gebruikt, wordt het vooral gebruikt als een hulpmiddel binnen de studie van bedrijfskunde en economie. De “spelletjes” kunnen dus betrekking hebben op hoe twee concurrerende bedrijven zullen reageren op prijsverlagingen door de ander, als een bedrijf een ander bedrijf zou verwerven, of hoe handelaren op een aandelenmarkt kunnen reageren op prijsveranderingen. In theoretische termen kunnen deze  spellen worden gecategoriseerd  als vergelijkbaar met prisoner’s dilemma’s, het dictatorspel, de havik-en-duif en de strijd tussen de seksen, naast verschillende andere variaties.

Wat leert het dilemma van de gevangene ons?

Het dilemma van de gevangene laat zien dat eenvoudige samenwerking niet altijd in het beste belang is. Bij het kopen van een item met een groot kaartje, zoals een auto, is onderhandelen zelfs de voorkeursmethode vanuit het oogpunt van de consument. Anders zou de autodealer een beleid van onbuigzaamheid kunnen voeren bij de prijsonderhandelingen, waarbij de winst wordt gemaximaliseerd, maar de consument te veel betaalt voor zijn auto. Het begrijpen van de relatieve voordelen van samenwerken versus overlopen kan u stimuleren om aanzienlijke prijsonderhandelingen aan te gaan   voordat u een grote aankoop doet.

Wat is een Nash-evenwicht in speltheorie?

Het Nash-evenwicht in de speltheorie is een situatie waarin een speler doorgaat met de door hem gekozen strategie, zonder de prikkel om ervan af te wijken, rekening houdend met de strategie van de tegenstander.

Hoe kunnen bedrijven speltheorie gebruiken terwijl ze met elkaar concurreren?

Cournot-concurrentie is bijvoorbeeld een economisch model dat een industriestructuur beschrijft waarin concurrerende bedrijven die een identiek product aanbieden, onafhankelijk en tegelijkertijd concurreren op de hoeveelheid output die ze produceren. Het is in feite een dilemmaspel voor gevangenen.

Het komt neer op

Speltheorie kan zeer effectief worden gebruikt als hulpmiddel bij het nemen van beslissingen, of dit nu in een vijandige, zakelijke of persoonlijke omgeving is.