24 juni 2021 20:04

Multicollineariteit

Wat is multicollineariteit?

Multicollineariteit is het optreden van hoge intercorrelaties tussen twee of meer onafhankelijke variabelen in een meervoudig regressiemodel. Multicollineariteit kan leiden tot vertekende of misleidende resultaten wanneer een onderzoeker of analist probeert te bepalen hoe goed elke onafhankelijke variabele het meest effectief kan worden gebruikt om de afhankelijke variabele in een statistisch model te voorspellen of te begrijpen.

Over het algemeen kan multicollineariteit leiden tot bredere betrouwbaarheidsintervallen die minder betrouwbare waarschijnlijkheden opleveren in termen van het effect van onafhankelijke variabelen in een model. Dat wil zeggen dat de statistische gevolgtrekkingen van een model met multicollineariteit mogelijk niet betrouwbaar zijn.

Belangrijkste leerpunten

  • Multicollineariteit is een statistisch concept waarbij onafhankelijke variabelen in een model gecorreleerd zijn.
  • Multicollineariteit tussen onafhankelijke variabelen zal resulteren in minder betrouwbare statistische gevolgtrekkingen.
  • Het is beter om onafhankelijke variabelen te gebruiken die niet gecorreleerd of repetitief zijn bij het bouwen van meervoudige regressiemodellen die twee of meer variabelen gebruiken.

Multicollineariteit begrijpen

Statistische analisten gebruiken meervoudige regressiemodellen om de waarde van een gespecificeerde afhankelijke variabele te voorspellen op basis van de waarden van twee of meer onafhankelijke variabelen. De afhankelijke variabele wordt soms de uitkomst, doel- of criteriumvariabele genoemd.

Een voorbeeld is een multivariate regressiemodel dat probeert te anticiperen op aandelenrendementen op basis van items zoals koers-winstverhoudingen (P / E-ratio’s), marktkapitalisatie, in het verleden behaalde resultaten of andere gegevens. Het aandelenrendement is de afhankelijke variabele en de verschillende stukjes financiële gegevens zijn de onafhankelijke variabelen.

Multicollineariteit in een meervoudig regressiemodel geeft aan dat collineaire onafhankelijke variabelen op de een of andere manier aan elkaar gerelateerd zijn, hoewel de relatie al dan niet vrijblijvend is. In het verleden behaalde resultaten kunnen bijvoorbeeld verband houden met marktkapitalisatie, aangezien aandelen die in het verleden goed hebben gepresteerd, stijgende marktwaarden zullen hebben. Met andere woorden, multicollineariteit kan bestaan ​​wanneer twee onafhankelijke variabelen sterk gecorreleerd zijn. Het kan ook gebeuren als een onafhankelijke variabele wordt berekend op basis van andere variabelen in de gegevensset of als twee onafhankelijke variabelen vergelijkbare en repetitieve resultaten opleveren.

Een van de meest gebruikelijke manieren om het probleem van multicollineariteit te elimineren, is door eerst collineaire onafhankelijke variabelen te identificeren en vervolgens alle variabelen op één na te verwijderen. Het is ook mogelijk om multicollineariteit te elimineren door twee of meer collineaire variabelen in een enkele variabele te combineren. Statistische analyse kan vervolgens worden uitgevoerd om de relatie tussen de gespecificeerde afhankelijke variabele en slechts een enkele onafhankelijke variabele te bestuderen.

Voorbeeld van multicollineariteit

Voor beleggen is multicollineariteit een veel voorkomende overweging bij het uitvoeren van technische analyses om waarschijnlijke toekomstige prijsbewegingen van een effect, zoals een aandeel of een commodity-future, te voorspellen.

Market analisten willen voorkomen dat het gebruik van technische indicatoren die collineair zijn in dat ze zijn gebaseerd op zeer soortgelijke of aanverwante ingangen; ze hebben de neiging om soortgelijke voorspellingen te onthullen met betrekking tot de afhankelijke variabele van prijsbewegingen. In plaats daarvan moet marktanalyse gebaseerd zijn op duidelijk verschillende onafhankelijke variabelen om ervoor te zorgen dat ze de markt analyseren vanuit verschillende onafhankelijke analytische gezichtspunten.



Een voorbeeld van een mogelijk multicollineariteitsprobleem is het uitvoeren van technische analyse met alleen verschillende vergelijkbare indicatoren.

De bekende technisch analist John Bollinger, bedenker van de Bollinger Bands indicator, merkt op dat “een hoofdregel voor het succesvolle gebruik van technische analyse vereist dat multicollineariteit tussen indicatoren wordt vermeden”. Om het probleem op te lossen, vermijden analisten het gebruik van twee of meer technische indicatoren van hetzelfde type. In plaats daarvan analyseren ze een effect met behulp van één type indicator, zoals een momentumindicator, en voeren ze vervolgens een afzonderlijke analyse uit met een ander type indicator, zoals een trendindicator.

Bijvoorbeeld stochastieken de relatieve sterkte index (RSI), en Williams% R zijn momentumindicatoren die afhankelijk soortgelijke ingangen en waarschijnlijk vergelijkbare resultaten. In dit geval is het beter om alle indicatoren op één na te verwijderen of een manier te vinden om verschillende indicatoren samen te voegen tot slechts één indicator, en tegelijkertijd een trendindicator toe te voegen die waarschijnlijk niet sterk gecorreleerd is met de momentumindicator.