24 juni 2021 17:52

Inverse correlatie

Wat is een omgekeerde correlatie?

Een inverse correlatie, ook wel negatieve correlatie genoemd, is een tegengestelde relatie tussen twee variabelen, zodat wanneer de waarde van de ene variabele hoog is, de waarde van de andere variabele waarschijnlijk laag is.

Bijvoorbeeld, met variabelen A en B, aangezien A een hoge waarde heeft, B een lage waarde heeft, en aangezien A een lage waarde heeft, heeft B een hoge waarde. In statistische terminologie wordt een inverse correlatie vaak aangeduid met de correlatiecoëfficiënt “r” met een waarde tussen -1 en 0, waarbij r = -1 een perfecte inverse correlatie aangeeft.

Belangrijkste leerpunten

  • Omgekeerde (of negatieve) correlatie is wanneer twee variabelen in een gegevensset zo gerelateerd zijn dat wanneer de ene hoog is, de andere laag is.
  • Ook al hebben twee variabelen een sterke negatieve correlatie, dit betekent niet noodzakelijk dat het gedrag van de een een causale invloed heeft op de ander.
  • De relatie tussen twee variabelen kan in de loop van de tijd veranderen en kan ook perioden van positieve correlatie hebben.

Grafische inverse correlatie

Twee sets gegevenspunten kunnen worden uitgezet in een grafiek op een x- en y-as om te controleren op correlatie. Dit wordt een spreidingsdiagram genoemd en het is een visuele manier om te controleren op een positieve of negatieve correlatie. De onderstaande grafiek illustreert een sterke omgekeerde correlatie tussen twee sets gegevenspunten die in de grafiek zijn uitgezet.

Voorbeeld van het berekenen van inverse correlatie

Correlatie kan worden berekend tussen variabelen binnen een set gegevens om tot een numeriek resultaat te komen, waarvan de meest voorkomende bekend staat als Pearson’s r. Als r kleiner is dan 0, duidt dit op een omgekeerde correlatie. Hier is een rekenkundige voorbeeldberekening van Pearson’s r, met een resultaat dat een omgekeerde correlatie laat zien tussen twee variabelen.

Stel dat een analist de mate van correlatie tussen de X en Y moet berekenen in de volgende dataset met zeven observaties over de twee variabelen:

  • X: 55, 37, 100, 40, 23, 66, 88
  • Y: 91, 60, 70, 83, 75, 76, 30

Er zijn drie stappen betrokken bij het vinden van de correlatie. Tel eerst alle X-waarden op om SUM (X) te vinden, tel alle Y-waarden op om SUM (Y) te vinden en vermenigvuldig elke X-waarde met de bijbehorende Y-waarde en tel ze op om SUM (X, Y) te vinden:

SUM(Y)=91+60+70+83+75+76+30=485\ begin {uitgelijnd} \ tekst {SUM} (Y) & = 91 + 60 + 70 + 83 + 75 + 76 + 30 \\ & = 485 \\ \ einde {uitgelijnd}SOM (Y)​=91+60+70+83+75+76+30=485​

De volgende stap is om elke X-waarde te nemen, deze te kwadrateren en al deze waarden op te tellen om SUM (x 2 ) te vinden. Hetzelfde moet worden gedaan voor de Y-waarden:

SUM(X2)=(552)+(372)+(1002)+…+(882)=28,623\ text {SUM} (X ^ 2) = (55 ^ 2) + (37 ^ 2) + (100 ^ 2) + \ dotso + (88 ^ 2) = 28.623SOM (X2)=(552)+(372)+(1002)+…+(882)=28,623

Vaststellend er zeven waarnemingen, n, kan de volgende formule worden toegepast om het gedeelte correlatiecoëfficiënt, r:

r=[n