Foutterm
Wat is een foutterm?
Een foutterm is een restvariabele die wordt geproduceerd door een statistisch of wiskundig model, die wordt gemaakt wanneer het model niet volledig de werkelijke relatie tussen de onafhankelijke variabelen en de afhankelijke variabelen weergeeft. Als gevolg van deze onvolledige relatie is de foutterm de hoeveelheid waarmee de vergelijking kan verschillen tijdens empirische analyse.
De foutterm is ook bekend als de rest, verstoring- of restterm en wordt in modellen op verschillende manieren weergegeven met de letters e, ε of u.
Belangrijkste leerpunten
- Een foutterm verschijnt in een statistisch model, zoals een regressiemodel, om de onzekerheid in het model aan te geven.
- De foutterm is een restvariabele die verantwoordelijk is voor een gebrek aan perfecte fitheid.
- Heteroskedastisch verwijst naar een toestand waarin de variantie van de residuale term of foutterm in een regressiemodel sterk varieert.
Een foutterm begrijpen
Een foutterm vertegenwoordigt de foutmarge binnen een statistisch model; het verwijst naar de som van de afwijkingen binnen de regressielijn, wat een verklaring geeft voor het verschil tussen de theoretische waarde van het model en de werkelijk waargenomen resultaten. De regressielijn wordt gebruikt als een analysepunt bij het bepalen van de correlatie tussen een onafhankelijke variabele en een afhankelijke variabele.
Gebruik van fouttermen in een formule
Een foutterm betekent in wezen dat het model niet volledig nauwkeurig is en resulteert in verschillende resultaten tijdens toepassingen in de echte wereld. Stel bijvoorbeeld dat er een meervoudige lineaire regressiefunctie is die de volgende vorm aanneemt:
Wanneer de werkelijke Y verschilt van de verwachte of voorspelde Y in het model tijdens een empirische test, dan is de foutterm niet gelijk aan 0, wat betekent dat er andere factoren zijn die Y beïnvloeden.
Wat vertellen fouttermen ons?
Binnen een lineair regressiemodel dat de prijs van een aandeel in de loop van de tijd volgt, is de foutterm het verschil tussen de verwachte prijs op een bepaald moment en de prijs die daadwerkelijk werd waargenomen. In gevallen waarin de prijs precies is wat op een bepaald moment werd verwacht, zal de prijs op de trendlijn dalen en zal de foutterm nul zijn.
Punten die niet direct op de trendlijn vallen, laten zien dat de afhankelijke variabele, in dit geval de prijs, wordt beïnvloed door meer dan alleen de onafhankelijke variabele, die het verstrijken van de tijd vertegenwoordigt. De foutterm staat voor elke invloed die wordt uitgeoefend op de prijsvariabele, zoals veranderingen in het marktsentiment.
De twee gegevenspunten met de grootste afstand van de trendlijn moeten op gelijke afstand van de trendlijn zijn, wat de grootste foutmarge vertegenwoordigt.
Als een model heteroskedastisch is, een veelvoorkomend probleem bij het correct interpreteren van statistische modellen, verwijst het naar een toestand waarin de variantie van de foutterm in een regressiemodel sterk varieert.
Lineaire regressie, foutterm en voorraadanalyse
Lineaire regressie is een vorm van analyse die betrekking heeft op de huidige trends die worden ervaren door een bepaald effect of index door een relatie te bieden tussen een afhankelijke en onafhankelijke variabelen, zoals de prijs van een effect en het verstrijken van de tijd, wat resulteert in een trendlijn die kan worden gebruikt als een voorspellend model.
Een lineaire regressie vertoont minder vertraging dan die bij een voortschrijdend gemiddelde, aangezien de lijn past bij de gegevenspunten in plaats van te zijn gebaseerd op de gemiddelden in de gegevens. Hierdoor kan de lijn sneller en dramatischer veranderen dan een lijn op basis van numerieke middeling van de beschikbare gegevenspunten.
Het verschil tussen fouttermen en residuen
Hoewel de foutterm en residu vaak als synoniemen worden gebruikt, is er een belangrijk formeel verschil. Een foutterm is over het algemeen niet waarneembaar en een residu is waarneembaar en berekenbaar, waardoor het veel gemakkelijker te kwantificeren en visualiseren is. In feite vertegenwoordigt een foutterm de manier waarop waargenomen gegevens verschillen van de werkelijke populatie, terwijl een residu de manier vertegenwoordigt waarop waargenomen gegevens verschillen van de gegevens van de steekproefpopulatie.