24 juni 2021 10:20

Bepalingscoëfficiënt

Wat is de determinatiecoëfficiënt?

De determinatiecoëfficiënt is een statistische meting die onderzoekt hoe verschillen in één variabele verklaard kunnen worden door het verschil in een tweede variabele, bij het voorspellen van de uitkomst van een bepaalde gebeurtenis. Met andere woorden, deze coëfficiënt, beter bekend als R-kwadraat (of R 2 ), beoordeelt hoe sterk de lineaire relatie is tussen twee variabelen, en wordt door onderzoekers sterk gebruikt bij het uitvoeren van trendanalyses. Om een ​​voorbeeld van de toepassing ervan te noemen: deze coëfficiënt kan de volgende vraag in overweging nemen: als een vrouw op een bepaalde dag zwanger wordt, wat is dan de kans dat ze haar baby in de toekomst op een bepaalde datum zou bevallen? In dit scenario is deze statistiek bedoeld om de correlatie tussen twee gerelateerde gebeurtenissen te berekenen: conceptie en geboorte.

Belangrijkste leerpunten

  • De determinatiecoëfficiënt is een complex idee dat zich concentreert op de statistische analyse van modellen voor gegevens.
  • De determinatiecoëfficiënt wordt gebruikt om uit te leggen hoeveel variabiliteit van een factor kan worden veroorzaakt door zijn relatie met een andere factor.
  • Deze coëfficiënt is algemeen bekend als R-kwadraat (of R 2 ), en wordt soms de “goodness of fit” genoemd.
  • Deze maat wordt weergegeven als een waarde tussen 0,0 en 1,0, waarbij een waarde van 1,0 duidt op een perfecte pasvorm, en is dus een zeer betrouwbaar model voor toekomstige voorspellingen, terwijl een waarde van 0,0 erop zou wijzen dat het model er niet in slaagt om de gegevens nauwkeurig te modelleren op alle. 

Inzicht in de determinatiecoëfficiënt

De determinatiecoëfficiënt is een meting die wordt gebruikt om uit te leggen hoeveel variabiliteit van een factor kan worden veroorzaakt door zijn relatie met een andere gerelateerde factor. Deze correlatie, bekend als de ” goodness of fit “, wordt weergegeven als een waarde tussen 0,0 en 1,0. Een waarde van 1,0 geeft een perfecte pasvorm aan en is dus een zeer betrouwbaar model voor toekomstige voorspellingen, terwijl een waarde van 0,0 zou aangeven dat de berekening de gegevens helemaal niet nauwkeurig modelleert. Maar een waarde van 0,20 suggereert bijvoorbeeld dat 20% van de afhankelijke variabele wordt voorspeld door de onafhankelijke variabele, terwijl een waarde van 0,50 suggereert dat 50% van de afhankelijke variabele wordt voorspeld door de onafhankelijke variabele, enzovoort.

Grafiek van de determinatiecoëfficiënt

In een grafiek meet de goodness of fit de afstand tussen een passende lijn en alle gegevenspunten die verspreid zijn over het diagram. De strakke set gegevens heeft een regressielijn die dicht bij de punten ligt en een hoge mate van fit heeft, wat betekent dat de afstand tussen de lijn en de gegevens klein is. Hoewel een goede pasvorm heeft een R 2 nabij 1,0, kan dit aantal alleen niet bepalen of de gegevenspunten of voorspellingen worden voorgespannen. Het vertelt analisten ook niet of de determinatiecoëfficiënt intrinsiek goed of slecht is. Het is ter discretie van de gebruiker om de betekenis van deze correlatie te evalueren, en hoe deze kan worden toegepast in de context van toekomstige trendanalyses.