Resterende standaarddeviatie
Wat is de resterende standaarddeviatie?
Resterende standaarddeviatie is een statistische term die wordt gebruikt om het verschil in standaarddeviaties van waargenomen waarden versus voorspelde waarden te beschrijven, zoals weergegeven door punten in een regressieanalyse.
Regressieanalyse is een methode die in statistieken wordt gebruikt om een verband tussen twee verschillende variabelen aan te tonen en om te beschrijven hoe goed u het gedrag van de ene variabele kunt voorspellen op basis van het gedrag van een andere.
Resterende standaarddeviatie wordt ook wel de standaarddeviatie van punten rond een gepaste lijn of de standaardschattingsfout genoemd.
Belangrijkste leerpunten
- Resterende standaarddeviatie is de standaarddeviatie van de restwaarden, of het verschil tussen een reeks waargenomen en voorspelde waarden.
- De standaarddeviatie van de residuen berekent hoeveel de datapunten zich over de regressielijn verspreiden.
- Het resultaat wordt gebruikt om de fout van de voorspelbaarheid van de regressielijn te meten.
- Hoe kleiner de resterende standaarddeviatie wordt vergeleken met de standaarddeviatie van de steekproef, hoe voorspellend of nuttiger het model is.
Inzicht in resterende standaarddeviatie
Resterende standaarddeviatie is een goede maatstaf die kan worden gebruikt om te analyseren hoe goed een set gegevenspunten past bij het daadwerkelijke model. In een zakelijke omgeving kan de resterende standaarddeviatie bijvoorbeeld, na het uitvoeren van een regressieanalyse op meerdere gegevenspunten van kosten in de loop van de tijd, een bedrijfseigenaar informatie verschaffen over het verschil tussen werkelijke kosten en verwachte kosten, en een idee geven van hoeveel kosten kunnen afwijken van het gemiddelde van de historische kostengegevens.
Formule voor resterende standaarddeviatie
Hoe de resterende standaarddeviatie te berekenen
Om de resterende standaarddeviatie te berekenen, moet eerst het verschil tussen de voorspelde waarden en de werkelijke waarden die rond een paslijn worden gevormd, worden berekend. Dit verschil staat bekend als de restwaarde of simpelweg residuen of de afstand tussen bekende datapunten en die datapunten voorspeld door het model.
Om de resterende standaarddeviatie te berekenen, plugt u de residuen in de vergelijking van de resterende standaarddeviatie om de formule op te lossen.
Voorbeeld van resterende standaarddeviatie
Begin met het berekenen van restwaarden. Stel dat u een set van vier geobserveerde waarden heeft voor een niet nader genoemd experiment, dan toont de onderstaande tabel de y-waarden die zijn geobserveerd en geregistreerd voor bepaalde waarden van x:
Als de lineaire vergelijking of helling van de lijn voorspeld door de gegevens in het model wordt gegeven als y est = 1x + 2 waar y est = voorspelde y-waarde, kan het residu voor elke waarneming worden gevonden.
Het residu is gelijk aan (y – y est ), dus voor de eerste set is de werkelijke y-waarde 1 en de voorspelde y est- waarde die door de vergelijking wordt gegeven is y est = 1 (1) + 2 = 3. De restwaarde is dus 1 – 3 = -2, een negatieve restwaarde.
Voor de tweede set x- en y-gegevenspunten kan de voorspelde y-waarde wanneer x 2 is en y 4 is, worden berekend als 1 (2) + 2 = 4.
In dit geval zijn de werkelijke en voorspelde waarden hetzelfde, dus de restwaarde is nul. U zou hetzelfde proces gebruiken om te komen tot de voorspelde waarden voor y in de resterende twee gegevenssets.
Nadat u de residuen voor alle punten hebt berekend met behulp van de tabel of een grafiek, gebruikt u de formule voor de residuele standaarddeviatie.
Als u bovenstaande tabel uitbreidt, berekent u de resterende standaarddeviatie:
Merk op dat de som van de gekwadrateerde residuen = 6, wat de teller van de residuele standaarddeviatievergelijking vertegenwoordigt.
Voor het onderste gedeelte of de noemer van de residuele standaarddeviatievergelijking, n = het aantal datapunten, wat in dit geval 4 is. Bereken de noemer van de vergelijking als:
- (Aantal residuen – 2) = (4 – 2) = 2
Bereken tot slot de vierkantswortel van de resultaten:
- Resterende standaarddeviatie: √ (6/2) = √3 ≈ 1.732