25 juni 2021 0:41

Valse correlatie

Wat is een onechte correlatie

In statistieken verwijst een onechte correlatie, of onechtheid, naar een verband tussen twee variabelen dat oorzakelijk lijkt maar dat niet is. Valse relaties hebben vaak de indruk dat de ene variabele de andere beïnvloedt. Deze onechte correlatie wordt vaak veroorzaakt door een derde factor die niet duidelijk is op het moment van onderzoek, ook wel een verstorende factor genoemd.

Belangrijkste leerpunten

  • Onechte correlatie, of onechtheid, is wanneer twee factoren terloops met elkaar verband lijken te houden, maar dat niet zijn.
  • Het verschijnen van een oorzakelijk verband is vaak te wijten aan een soortgelijke beweging op een kaart die toevallig blijkt te zijn of wordt veroorzaakt door een derde “verstorende” factor.
  • Valse correlatie kan vaak worden veroorzaakt door kleine steekproeven of willekeurige eindpunten.

Hoe onechte correlatie werkt

Wanneer twee willekeurige variabelen elkaar nauwkeurig volgen in een grafiek, is het gemakkelijk om correlaties of een verband tussen de twee factoren te vermoeden, waarbij een verandering de andere beïnvloedt. Afgezien van ‘causaliteit’, een ander onderwerp, kan deze observatie de lezer van de kaart doen geloven dat de beweging van variabele A verband houdt met de beweging in variabele B of vice versa. maar soms, bij nader statistisch onderzoek, zijn de uitgelijnde bewegingen toevallig of worden ze veroorzaakt door een derde factor die de eerste twee beïnvloedt. Dit is een onechte correlatie. Onderzoek gedaan met kleine steekproeven of willekeurige eindpunten is bijzonder vatbaar voor onechtheid.

Voorbeeld van onechte correlaties

Het is niet al te moeilijk om interessante verbanden te ontdekken. Velen zullen echter onecht blijken te zijn. Voor de mannelijke soort op Wall Street hebben twee populaire onechte correlaties betrekking op vrouwen en sport. Ontstaan ​​in de jaren 1920 is de roklengte-theorie, die stelt dat roklengtes en aandelenmarktrichting gecorreleerd zijn. Als roklengtes lang zijn, betekent dat dat de aandelenmarkt naar beneden gaat; als ze kort zijn, gaat de markt omhoog. Rond eind januari wordt er gesproken over de zogenaamde Super Bowl-indicator, die suggereert dat een overwinning van het AFC-team waarschijnlijk betekent dat de aandelenmarkt het komende jaar zal dalen, terwijl een overwinning van het NFC-team een ​​stijging van de koers voorspelt. markt. Sinds 1966 heeft de indicator een nauwkeurigheidspercentage van 80%. Het is een leuk gespreksonderwerp, maar waarschijnlijk niet iets dat een serieuze financieel adviseur zou aanbevelen als beleggingsstrategie voor klanten.

Hier zijn nog enkele voorbeelden van veelvoorkomende onechte correlaties:

  • Verdrinkingen stijgen wanneer de verkoop van ijs stijgt. Het lijkt misschien dat een grotere verkoop van ijs meer verdrinking veroorzaakt, maar in werkelijkheid kan stijgende hitte ertoe leiden dat meer mensen gaan zwemmen en meer ijs kopen.
  • Het aantal moorden in de VS van 2006-2011 daalde in hetzelfde tempo als het gebruik van Microsoft Internet Explorer.
  • Leidinggevenden die vaker alsjeblieft en dankjewel zeggen, genieten van betere aandelenprestaties.
  • Mensen die teamkleding van Oakland Raiders dragen, hebben meer kans om misdaden te plegen.

Hoe u onechte correlaties kunt herkennen

Statistici en andere wetenschappers die gegevens analyseren, moeten voortdurend op zoek zijn naar onechte relaties. Er zijn talloze methoden die ze gebruiken, waaronder:

  • Zorgen voor een goed representatief monster.
  • Het verkrijgen van een adequate steekproefomvang.
  • Wees op uw hoede voor willekeurige eindpunten.
  • Controleren voor zoveel mogelijk externe variabelen.
  • Een nulhypothese gebruiken en controleren op een sterke p-waarde.