Hoe kunt u de correlatie berekenen met Excel?
Wat is correlatie?
Correlatie meet de lineaire relatie tussen twee variabelen. Door de variantie van elke variabele te meten en te relateren, geeft correlatie een indicatie van de sterkte van de relatie.
Anders gezegd, correlatie beantwoordt de vraag: in hoeverre verklaart variabele A (de onafhankelijke variabele) variabele B (de afhankelijke variabele)?
Belangrijkste leerpunten
- Correlatie is de statistische lineaire overeenkomst van variatie tussen twee variabelen.
- In de financiële wereld wordt correlatie gebruikt in verschillende facetten van analyse, waaronder de berekening van de standaarddeviatie van de portefeuille.
- Het berekenen van correlaties kan tijdrovend zijn, maar software zoals Excel maakt het gemakkelijk om te berekenen.
Correlatie begrijpen
De formule voor correlatie
Correlatie combineert verschillende belangrijke en gerelateerde statistische concepten, namelijk variantie en standaarddeviatie. Variantie is de spreiding van een variabele rond het gemiddelde, en standaarddeviatie is de vierkantswortel van variantie.
De formule is:
Aangezien correlatie de lineaire relatie van twee variabelen wil beoordelen, is het echt nodig om te zien hoeveel covariantie die twee variabelen hebben, en in hoeverre die covariantie wordt weerspiegeld door de standaarddeviaties van elke variabele afzonderlijk.
Veelgemaakte fouten met correlatie
De meest voorkomende fout is dat een correlatie die +/- 1 nadert, statistisch significant is. Een lezing die +/- 1 nadert, verhoogt zeker de kans op werkelijke statistische significantie, maar zonder verdere tests is het onmogelijk om te weten.
Het statistisch testen van een correlatie kan om een aantal redenen ingewikkeld worden; het is helemaal niet eenvoudig. Een kritische veronderstelling van correlatie is dat de variabelen onafhankelijk zijn en dat de relatie tussen hen lineair is. In theorie zou je deze claims testen om te bepalen of een correlatieberekening geschikt is.
Onthoud dat correlatie tussen twee variabelen NIET impliceert dat A B veroorzaakte of vice versa.
De tweede meest voorkomende fout is het vergeten om de gegevens in een gemeenschappelijke eenheid te normaliseren. Als je een correlatie berekent op twee bèta’s, dan zijn de eenheden al genormaliseerd: bèta zelf is de eenheid. Als u aandelen echter wilt correleren, is het van cruciaal belang dat u ze normaliseert in procentrendement en niet in koersveranderingen. Dit komt maar al te vaak voor, ook onder beleggingsprofessionals.
Voor voorraad prijscorrelatie, je in feite twee vragen te stellen: Wat is het rendement over een bepaald aantal periodes, en hoe gaat dat terugkeer correleren aan een andere security return ’s ten opzichte van dezelfde periode?
Dit is ook de reden waarom het correleren van aandelenkoersen moeilijk is: twee effecten kunnen een hoge correlatie hebben als het rendement dagelijkse procentuele veranderingen over de afgelopen 52 weken is, maar een lage correlatie als het rendement maandelijkse veranderingen in de afgelopen 52 weken zijn. Welke is beter”? Er is echt geen perfect antwoord, en het hangt af van het doel van de test.
Correlatie zoeken in Excel
Er zijn verschillende methoden om de correlatie in Excel te berekenen. De eenvoudigste is om twee datasets naast elkaar te krijgen en de ingebouwde correlatieformule te gebruiken:
Dit is een handige manier om een correlatie tussen slechts twee gegevenssets te berekenen. Maar wat als u een correlatiematrix wilt maken voor een reeks gegevenssets? Om dit te doen, moet u de plug-in voor gegevensanalyse van Excel gebruiken. De plug-in is te vinden op het tabblad Gegevens, onder Analyseren.
Selecteer de tabel met retouren. In dit geval hebben onze kolommen een titel, dus we willen het vakje “Labels in eerste rij” aanvinken, zodat Excel weet dat deze als titels moeten worden behandeld. Vervolgens kunt u ervoor kiezen om op hetzelfde blad of op een nieuw blad uit te voeren.
Zodra u op enter drukt, worden de gegevens automatisch gemaakt. U kunt wat tekst en voorwaardelijke opmaak toevoegen om het resultaat op te schonen.