Meervoudige lineaire regressie (MLR)
Wat is meervoudige lineaire regressie (MLR)?
Meervoudige lineaire regressie (MLR), ook wel simpelweg meervoudige regressie genoemd, is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen. Het doel van meervoudige lineaire regressie (MLR) is om de lineaire relatie tussen de verklarende (onafhankelijke) variabelen en de respons (afhankelijke) variabele te modelleren.
In wezen is meervoudige regressie de uitbreiding van gewone kleinste kwadraten (OLS) -regressie omdat er meer dan één verklarende variabele bij betrokken is.
Belangrijkste leerpunten
- Meervoudige lineaire regressie (MLR), ook wel simpelweg meervoudige regressie genoemd, is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen.
- Meervoudige regressie is een uitbreiding van lineaire (OLS) regressie die slechts één verklarende variabele gebruikt.
- MLR wordt veel gebruikt in econometrie en financiële inferentie.
Formule en berekening van meervoudige lineaire regressie
Wat meervoudige lineaire regressie u kan vertellen
Eenvoudige lineaire regressie is een functie waarmee een analist of statisticus voorspellingen kan doen over een variabele op basis van de informatie die bekend is over een andere variabele. Lineaire regressie kan alleen worden gebruikt als men twee continue variabelen heeft: een onafhankelijke variabele en een afhankelijke variabele. De onafhankelijke variabele is de parameter die wordt gebruikt om de afhankelijke variabele of uitkomst te berekenen. Een meervoudig regressiemodel strekt zich uit tot verschillende verklarende variabelen.
Het meervoudige regressiemodel is gebaseerd op de volgende aannames:
- Er is een lineair verband tussen de afhankelijke variabelen en de onafhankelijke variabelen
- De onafhankelijke variabelen zijn niet al te sterk met elkaar gecorreleerd
- y i observaties onafhankelijk en willekeurig gekozen uit de populatie
- Residuen moeten normaal worden verdeeld met een gemiddelde van 0 en variantie σ
De determinatiecoëfficiënt (R-kwadraat) is een statistische metriek die wordt gebruikt om te meten hoeveel van de variatie in uitkomst kan worden verklaard door de variatie in de onafhankelijke variabelen. R 2 neemt steeds meer als voorspellers worden toegevoegd aan de MLR model, hoewel de voorspellende niet kan worden gerelateerd aan de uitkomstvariabele.
R2 zelf kan dus niet worden gebruikt om te identificeren welke voorspellers in het model worden opgenomen en moeten worden uitgesloten. R2 kunnen alleen tussen 0 en 1, waarbij 0 aangeeft dat het resultaat niet kan worden voorspeld door een van de onafhankelijke variabelen en 1 geeft aan dat de uitkomst te voorspellen zonder fouten van de onafhankelijke variabelen.
Bij het interpreteren van de resultaten van meervoudige regressie, zijn bètacoëfficiënten geldig terwijl alle andere variabelen constant worden gehouden (“al het andere gelijk”). De uitvoer van een meervoudige regressie kan horizontaal als een vergelijking of verticaal in tabelvorm worden weergegeven.
Voorbeeld van het gebruik van meervoudige lineaire regressie
Een analist wil bijvoorbeeld weten hoe de beweging van de markt de prijs van ExxonMobil (XOM) beïnvloedt. In dit geval heeft hun lineaire vergelijking de waarde van de S & P 500-index als de onafhankelijke variabele of voorspeller en de prijs van XOM als de afhankelijke variabele.
In werkelijkheid zijn er meerdere factoren die de uitkomst van een evenement voorspellen. Het prijsverloop van ExxonMobil hangt bijvoorbeeld van meer af dan alleen de prestaties van de totale markt. Andere voorspellers, zoals de olieprijs, rentetarieven en de prijsbeweging van oliefutures, kunnen de prijs van XOM en aandelenkoersen van andere oliemaatschappijen beïnvloeden. Om een relatie te begrijpen waarin meer dan twee variabelen aanwezig zijn, wordt meervoudige lineaire regressie gebruikt.
Meervoudige lineaire regressie (MLR) wordt gebruikt om een wiskundig verband tussen een aantal willekeurige variabelen te bepalen. Met andere woorden, MLR onderzoekt hoe meerdere onafhankelijke variabelen gerelateerd zijn aan één afhankelijke variabele. Zodra elk van de onafhankelijke factoren is bepaald om de afhankelijke variabele te voorspellen, kan de informatie over de meerdere variabelen worden gebruikt om een nauwkeurige voorspelling te maken over het effect dat ze hebben op de uitkomstvariabele. Het model creëert een relatie in de vorm van een rechte lijn (lineair) die alle individuele datapunten het beste benadert.
Verwijzend naar de MLR-vergelijking hierboven, in ons voorbeeld:
- y i = afhankelijke variabele – de prijs van XOM
- x i1 = rentetarieven
- x i2 = olieprijs
- x i3 = waarde van de S & P 500-index
- x i4 = prijs van oliefutures
- B 0 = y-snijpunt op tijdstip nul
- B 1 = regressiecoëfficiënt die een eenheidsverandering meet in de afhankelijke variabele wanneer x i1 verandert – de verandering in XOM-prijs wanneer de rentetarieven veranderen
- B 2 = coëfficiëntwaarde die een eenheidsverandering meet in de afhankelijke variabele wanneer x i2 verandert – de verandering in XOM-prijs wanneer olieprijzen veranderen