Meervoudige lineaire regressie (MLR) - KamilTaylan.blog
24 juni 2021 19:47

Meervoudige lineaire regressie (MLR)

Wat is meervoudige lineaire regressie (MLR)?

Meervoudige lineaire regressie (MLR), ook wel simpelweg meervoudige regressie genoemd, is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen. Het doel van meervoudige lineaire regressie (MLR) is om de lineaire relatie tussen de verklarende (onafhankelijke) variabelen en de respons (afhankelijke) variabele te modelleren.

In wezen is meervoudige regressie de uitbreiding van gewone kleinste kwadraten (OLS) -regressie omdat er meer dan één verklarende variabele bij betrokken is.

Belangrijkste leerpunten

  • Meervoudige lineaire regressie (MLR), ook wel simpelweg meervoudige regressie genoemd, is een statistische techniek die verschillende verklarende variabelen gebruikt om de uitkomst van een responsvariabele te voorspellen.
  • Meervoudige regressie is een uitbreiding van lineaire (OLS) regressie die slechts één verklarende variabele gebruikt.
  • MLR wordt veel gebruikt in econometrie en financiële inferentie.

Formule en berekening van meervoudige lineaire regressie

Wat meervoudige lineaire regressie u kan vertellen

Eenvoudige lineaire regressie is een functie waarmee een analist of statisticus voorspellingen kan doen over een variabele op basis van de informatie die bekend is over een andere variabele. Lineaire regressie kan alleen worden gebruikt als men twee continue variabelen heeft: een onafhankelijke variabele en een afhankelijke variabele. De onafhankelijke variabele is de parameter die wordt gebruikt om de afhankelijke variabele of uitkomst te berekenen. Een meervoudig regressiemodel strekt zich uit tot verschillende verklarende variabelen.

Het meervoudige regressiemodel is gebaseerd op de volgende aannames:

  • Er is een lineair verband tussen de afhankelijke variabelen en de onafhankelijke variabelen
  • De onafhankelijke variabelen zijn niet al te sterk met elkaar gecorreleerd
  • y i observaties onafhankelijk en willekeurig gekozen uit de populatie
  • Residuen moeten normaal worden verdeeld met een gemiddelde van 0 en variantie σ

De determinatiecoëfficiënt (R-kwadraat) is een statistische metriek die wordt gebruikt om te meten hoeveel van de variatie in uitkomst kan worden verklaard door de variatie in de onafhankelijke variabelen. R 2 neemt steeds meer als voorspellers worden toegevoegd aan de MLR model, hoewel de voorspellende niet kan worden gerelateerd aan de uitkomstvariabele.

R2 zelf kan dus niet worden gebruikt om te identificeren welke voorspellers in het model worden opgenomen en moeten worden uitgesloten. R2 kunnen alleen tussen 0 en 1, waarbij 0 aangeeft dat het resultaat niet kan worden voorspeld door een van de onafhankelijke variabelen en 1 geeft aan dat de uitkomst te voorspellen zonder fouten van de onafhankelijke variabelen.

Bij het interpreteren van de resultaten van meervoudige regressie, zijn bètacoëfficiënten geldig terwijl alle andere variabelen constant worden gehouden (“al het andere gelijk”). De uitvoer van een meervoudige regressie kan horizontaal als een vergelijking of verticaal in tabelvorm worden weergegeven.

Voorbeeld van het gebruik van meervoudige lineaire regressie

Een analist wil bijvoorbeeld weten hoe de beweging van de markt de prijs van ExxonMobil (XOM) beïnvloedt. In dit geval heeft hun lineaire vergelijking de waarde van de S & P 500-index als de onafhankelijke variabele of voorspeller en de prijs van XOM als de afhankelijke variabele.

In werkelijkheid zijn er meerdere factoren die de uitkomst van een evenement voorspellen. Het prijsverloop van ExxonMobil hangt bijvoorbeeld van meer af dan alleen de prestaties van de totale markt. Andere voorspellers, zoals de olieprijs, rentetarieven en de prijsbeweging van oliefutures, kunnen de prijs van XOM en aandelenkoersen van andere oliemaatschappijen beïnvloeden. Om een ​​relatie te begrijpen waarin meer dan twee variabelen aanwezig zijn, wordt meervoudige lineaire regressie gebruikt.

Meervoudige lineaire regressie (MLR) wordt gebruikt om een ​​wiskundig verband tussen een aantal willekeurige variabelen te bepalen. Met andere woorden, MLR onderzoekt hoe meerdere onafhankelijke variabelen gerelateerd zijn aan één afhankelijke variabele. Zodra elk van de onafhankelijke factoren is bepaald om de afhankelijke variabele te voorspellen, kan de informatie over de meerdere variabelen worden gebruikt om een ​​nauwkeurige voorspelling te maken over het effect dat ze hebben op de uitkomstvariabele. Het model creëert een relatie in de vorm van een rechte lijn (lineair) die alle individuele datapunten het beste benadert.

Verwijzend naar de MLR-vergelijking hierboven, in ons voorbeeld:

  • y i = afhankelijke variabele – de prijs van XOM
  • x i1 = rentetarieven
  • x i2 = olieprijs
  • x i3 = waarde van de S & P 500-index
  • x i4 = prijs van oliefutures
  • B 0 = y-snijpunt op tijdstip nul
  • B 1 = regressiecoëfficiënt die een eenheidsverandering meet in de afhankelijke variabele wanneer x i1 verandert – de verandering in XOM-prijs wanneer de rentetarieven veranderen
  • B 2 = coëfficiëntwaarde die een eenheidsverandering meet in de afhankelijke variabele wanneer x i2 verandert – de verandering in XOM-prijs wanneer olieprijzen veranderen

De schattingen van de kleinste kwadraten, B 0, B 1, B 2 … B p, worden gewoonlijk berekend door statistische software. Er kunnen zoveel variabelen worden opgenomen in het regressiemodel waarin elke onafhankelijke variabele wordt gedifferentieerd met een getal – 1,2, 3, 4… p. Met het meervoudige regressiemodel kan een analist een uitkomst voorspellen op basis van informatie over meerdere verklarende variabelen.

Toch is het model niet altijd perfect nauwkeurig, aangezien elk gegevenspunt enigszins kan verschillen van de uitkomst die door het model wordt voorspeld. De restwaarde, E, het verschil tussen de werkelijke uitkomst en de voorspelde uitkomst, wordt in het model opgenomen om rekening te houden met dergelijke kleine variaties.

Ervan uitgaande dat we ons XOM-prijsregressiemodel uitvoeren via een statistische berekeningssoftware, die deze uitvoer retourneert:

Een analist zou deze output zo interpreteren dat als andere variabelen constant worden gehouden, de prijs van XOM met 7,8% zal stijgen als de olieprijs op de markten met 1% stijgt. Het model laat ook zien dat de prijs van XOM met 1,5% zal dalen na een rentestijging van 1%. R 2 geeft aan dat 86,5% van de schommelingen in de aandelenkoers van Exxon Mobil kan worden verklaard door veranderingen in de rente, olieprijs, oliefutures en de S&P 500-index.

Het verschil tussen lineaire en meervoudige regressie

Gewone lineaire vierkanten (OLS) -regressie vergelijkt de respons van een afhankelijke variabele gegeven een verandering in enkele verklarende variabelen. Het komt echter zelden voor dat een afhankelijke variabele wordt verklaard door slechts één variabele. In dit geval gebruikt een analist meervoudige regressie, die probeert een afhankelijke variabele uit te leggen met behulp van meer dan één onafhankelijke variabele. Meerdere regressies kunnen lineair en niet-lineair zijn.

Meerdere regressies zijn gebaseerd op de aanname dat er een lineair verband bestaat tussen zowel de afhankelijke als de onafhankelijke variabelen. Het veronderstelt ook geen belangrijke correlatie tussen de onafhankelijke variabelen.

Veel Gestelde Vragen

Wat maakt een meervoudige regressie ‘veelvoud’?

Een meervoudige regressie beschouwt het effect van meer dan één verklarende variabele op een uitkomst die van belang is. Het evalueert het relatieve effect van deze verklarende of onafhankelijke variabelen op de afhankelijke variabele wanneer alle andere variabelen in het model constant worden gehouden.

Waarom zou je een meervoudige regressie gebruiken in plaats van een eenvoudige OLS-regressie?

Het komt zelden voor dat een afhankelijke variabele wordt verklaard door slechts één variabele. In dergelijke gevallen gebruikt een analist meervoudige regressie, die probeert een afhankelijke variabele uit te leggen met behulp van meer dan één onafhankelijke variabele. Het model gaat er echter van uit dat er geen grote correlaties zijn tussen de onafhankelijke variabelen.

Kan ik handmatig een meervoudige regressie uitvoeren?

Waarschijnlijk niet. Meerdere regressiemodellen zijn complex en worden zelfs nog meer wanneer er meer variabelen in het model zijn opgenomen of wanneer de hoeveelheid te analyseren gegevens toeneemt. Om een ​​meervoudige regressie uit te voeren, heeft u waarschijnlijk gespecialiseerde statistische software nodig, of functies binnen zakelijke programma’s zoals Excel.

Wat betekent het dat een meervoudige regressie ‘lineair’ is?

Bij een meervoudige lineaire regressie berekent het model de best passende lijn die de varianties van elk van de opgenomen variabelen minimaliseert in relatie tot de afhankelijke variabele. Omdat het op een lijn past, is het een lineair model. Er zijn ook niet-lineaire regressiemodellen met meerdere variabelen, zoals logistische regressie, kwadratische regressie en probit-modellen.

Hoe worden meervoudige regressiemodellen gebruikt in de financiële wereld?

Elk econometrisch model dat naar meer dan één variabele kijkt, kan een meervoudige regressie zijn. Factormodellen vergelijken bijvoorbeeld twee of meer factoren om relaties tussen variabelen en de resulterende prestatie te analyseren. De Fama en de Franse Three-Factor Mod is zo’n model dat het Capital Asset Pricing Model (CAPM) uitbreidt door grootte- en waarderisicofactoren toe te voegen aan de marktrisicofactor in CAPM (dat zelf een regressiemodel is). Door deze twee aanvullende factoren op te nemen, past het model zich aan voor deze sterk presterende tendens, waardoor het naar men aanneemt een beter instrument wordt voor het evalueren van de prestaties van managers.