Regressiebeginselen voor bedrijfsanalyse
Als je je ooit hebt afgevraagd hoe twee of meer gegevens zich tot elkaar verhouden (bijvoorbeeld hoe het bbp wordt beïnvloed door veranderingen in werkloosheid en inflatie), of als je baas je ooit heeft gevraagd om een prognose te maken of voorspellingen te analyseren op basis van over relaties tussen variabelen, dan zou het de moeite waard zijn om regressieanalyse te leren.
In dit artikel leert u de basisprincipes van eenvoudige lineaire regressie, ook wel ‘gewone kleinste kwadraten’ of OLS-regressie genoemd – een hulpmiddel dat vaak wordt gebruikt bij prognoses en financiële analyse. We zullen beginnen met het leren van de kernprincipes van regressie, eerst leren over covariantie en correlatie, en dan verder gaan met het bouwen en interpreteren van een regressie-output. Populaire bedrijfssoftware zoals Microsoft Excel kan alle regressieberekeningen en -outputs voor u doen, maar het is nog steeds belangrijk om de onderliggende mechanica te leren.
belangrijkste leerpunten
- Eenvoudige lineaire regressie wordt vaak gebruikt bij prognoses en financiële analyse, bijvoorbeeld om een bedrijf te laten zien hoe een verandering in het BBP de verkoop kan beïnvloeden.
- Microsoft Excel en andere software kunnen alle berekeningen uitvoeren, maar het is goed om te weten hoe de mechanica van eenvoudige lineaire regressie werkt.
Variabelen
De kern van een regressiemodel is de relatie tussen twee verschillende variabelen, de afhankelijke en onafhankelijke variabelen. Stel dat u de verkoop voor uw bedrijf wilt voorspellen en u hebt geconcludeerd dat de verkoop van uw bedrijf op en neer gaat, afhankelijk van veranderingen in het bbp.
De verkoop die u voorspelt, zou de afhankelijke variabele zijn, omdat hun waarde “afhangt” van de waarde van het BBP en het BBP de onafhankelijke variabele zou zijn. U zou dan de sterkte van de relatie tussen deze twee variabelen moeten bepalen om de verkoop te voorspellen. Als het BBP met 1% stijgt / daalt, hoeveel zal uw omzet dan stijgen of dalen?
Covariantie
De formule om de relatie tussen twee variabelen te berekenen, wordt covariantie genoemd. Deze berekening toont u de richting van de relatie. Als de ene variabele toeneemt en de andere variabele de neiging heeft ook toe te nemen, zou de covariantie positief zijn. Als de ene variabele omhoog gaat en de andere de neiging heeft omlaag te gaan, zou de covariantie negatief zijn.
Het werkelijke aantal dat u krijgt door dit te berekenen, kan moeilijk te interpreteren zijn omdat het niet gestandaardiseerd is. Een covariantie van vijf kan bijvoorbeeld worden geïnterpreteerd als een positieve relatie, maar de sterkte van de relatie kan alleen worden gezegd dat deze sterker is dan wanneer het aantal vier was of zwakker dan wanneer het aantal zes was.
Correlatiecoëfficiënt
COrreleentikOn=ρXy=COvXysXsy\ begin {uitgelijnd} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {uitgelijnd}Correlation=ρxy=sXsy
We moeten de covariantie standaardiseren om deze beter te kunnen interpreteren en gebruiken bij prognoses, en het resultaat is de correlatieberekening. De correlatieberekening neemt eenvoudig de covariantie en deelt deze door het product van de standaarddeviatie van de twee variabelen. Dit zal de correlatie tussen een waarde van -1 en +1 binden.
Een correlatie van +1 kan worden geïnterpreteerd om te suggereren dat beide variabelen perfect positief met elkaar bewegen en een -1 impliceert dat ze perfect negatief gecorreleerd zijn. In ons vorige voorbeeld, als de correlatie +1 is en het BBP stijgt met 1%, dan zou de verkoop met 1% toenemen. Als de correlatie -1 is, zou een stijging van het BBP met 1% resulteren in een daling van de verkoop met 1% – precies het tegenovergestelde.
Regressievergelijking
Nu we weten hoe de relatieve relatie tussen de twee variabelen wordt berekend, kunnen we een regressievergelijking ontwikkelen om de gewenste variabele te voorspellen of te voorspellen. Hieronder staat de formule voor een eenvoudige lineaire regressie. De “y” is de waarde die we proberen te voorspellen, de “b” is de helling van de regressielijn, de “x” is de waarde van onze onafhankelijke waarde en de “a” staat voor het y-snijpunt. De regressievergelijking beschrijft eenvoudig de relatie tussen de afhankelijke variabele (y) en de onafhankelijke variabele (x).
Het snijpunt, of “a”, is de waarde van y (afhankelijke variabele) als de waarde van x (onafhankelijke variabele) nul is, en wordt daarom soms simpelweg de ‘constante’ genoemd. Dus als er geen verandering in het BBP zou zijn, zou uw bedrijf nog steeds wat verkopen. Deze waarde, wanneer de verandering in het BBP nul is, is het snijpunt. Bekijk de onderstaande grafiek voor een grafische weergave van een regressievergelijking. In deze grafiek zijn er slechts vijf gegevenspunten vertegenwoordigd door de vijf stippen op de grafiek. Lineaire regressie probeert een lijn te schatten die het beste bij de gegevens past (een lijn die het beste past ) en de vergelijking van die lijn resulteert in de regressievergelijking.
Regressies in Excel
Nu u een deel van de achtergrond van een regressieanalyse begrijpt, gaan we een eenvoudig voorbeeld geven met de regressietools van Excel. We zullen voortbouwen op het vorige voorbeeld van een poging om de verkoop van volgend jaar te voorspellen op basis van veranderingen in het bbp. De volgende tabel bevat enkele kunstmatige gegevenspunten, maar deze cijfers kunnen in het echte leven gemakkelijk toegankelijk zijn.
Als u alleen maar naar de tafel kijkt, ziet u dat er een positieve correlatie zal zijn tussen verkoop en bbp. Beiden hebben de neiging om samen naar boven te gaan. Met Excel hoeft u alleen maar op het vervolgkeuzemenu Tools te klikken, Gegevensanalyse te selecteren en van daaruit Regressie te kiezen. Het pop-upvenster is vanaf daar eenvoudig in te vullen; uw Input Y-bereik is uw kolom “Verkoop” en uw Input X-bereik is de kolom verandering in het BBP; kies het uitvoerbereik waarvoor u de gegevens in uw spreadsheet wilt weergeven en druk op OK. U zou iets moeten zien dat lijkt op wat in de onderstaande tabel wordt gegeven:
Coëfficiënten voor regressiestatistieken
Interpretatie
De belangrijkste resultaten waar u zich zorgen over moet maken voor eenvoudige lineaire regressie zijn de R-kwadraat, het snijpunt (constante) en de bèta (b) -coëfficiënt van het BBP. Het R-kwadraatgetal in dit voorbeeld is 68,7%. Dit laat zien hoe goed ons model de toekomstige verkopen voorspelt of voorspelt, wat suggereert dat de verklarende variabelen in het model 68,7% van de variatie in de afhankelijke variabele voorspelden. Vervolgens hebben we een onderschepping van 34,58, wat ons vertelt dat als de verandering in het bbp naar verwachting nul zou zijn, onze verkoop ongeveer 35 eenheden zou bedragen. En tot slot vertelt de bèta- of correlatiecoëfficiënt van het BBP van 88,15 ons dat als het BBP met 1% toeneemt, de verkoop waarschijnlijk met ongeveer 88 eenheden zal stijgen.
Het komt neer op
Dus hoe zou u dit eenvoudige model in uw bedrijf gebruiken? Als uw onderzoek u doet geloven dat de volgende BBP-verandering een bepaald percentage zal zijn, kunt u dat percentage in het model opnemen en een verkoopprognose genereren. Dit kan u helpen bij het ontwikkelen van een objectiever plan en budget voor het komende jaar.
Dit is natuurlijk slechts een simpele regressie en er zijn multiple lineaire regressies. Maar meerdere lineaire regressies zijn ingewikkelder en hebben verschillende problemen die een ander artikel moeten bespreken.