24 juni 2021 23:04

Resterende som van vierkanten (RSS)

Wat is de resterende som van vierkanten (RSS)?

Een residuele som van kwadraten (RSS) is een statistische techniek die wordt gebruikt om de hoeveelheid variantie in een dataset te meten die niet wordt verklaard door een regressiemodel zelf. In plaats daarvan schat het de variantie in de residuen of foutterm.

Lineaire regressie is een meting die helpt bij het bepalen van de sterkte van de relatie tussen een afhankelijke variabele en een of meer andere factoren, bekend als onafhankelijke of verklarende variabelen.

Belangrijkste leerpunten

  • Een residuele som van kwadraten (RSS) meet het niveau van variantie in de foutterm, of residuen, van een regressiemodel.
  • Idealiter zou de som van de gekwadrateerde residuen een kleinere of lagere waarde moeten zijn dan de som van de kwadraten van de inputs van het regressiemodel.
  • De RSS wordt door financiële analisten gebruikt om de validiteit van hun econometrische modellen te schatten.

De formule voor de resterende som van kwadraten (RSS)

RSS =

n
ik = 1 (
Y ik
f (
X ik ))
2

waar:

  • y i = de ide waarde van de te voorspellen variabele
  • f (x i ) = voorspelde waarde van y i
  • n = bovengrens van sommatie

Inzicht in de resterende som van vierkanten (RSS)

In algemene termen is de som van de kwadraten een statistische techniek die wordt gebruikt bij regressieanalyse om de spreiding van gegevenspunten te bepalen. Bij een regressieanalyse is het doel om te bepalen hoe goed een gegevensreeks kan worden aangepast aan een functie die kan helpen verklaren hoe de gegevensreeks is gegenereerd. De som van de kwadraten wordt gebruikt als een wiskundige manier om de functie te vinden die het  beste bij  de gegevens past (het minst varieert).

De RSS meet de hoeveelheid fouten die overblijft tussen de regressiefunctie en de dataset nadat het model is uitgevoerd. Een kleiner RSS-cijfer vertegenwoordigt een regressiefunctie.

De RSS, ook wel de som van de kwadratische residuen genoemd, bepaalt in wezen hoe goed een regressiemodel de gegevens in het model verklaart of vertegenwoordigt.

Resterende som van kwadraten (RSS) versus resterende standaardfout (RSE)

De resterende standaardfout (RSE) is een andere statistische term die wordt gebruikt om het verschil in  standaarddeviaties  van waargenomen waarden versus voorspelde waarden te beschrijven, zoals blijkt uit punten in een regressieanalyse. Het is een  goodness-of-fit  maatstaf die kan worden gebruikt om te analyseren hoe goed een set datapunten past bij het daadwerkelijke model.

RSE wordt berekend door de RSS te delen door het aantal waarnemingen in de steekproef minus 2, en vervolgens de vierkantswortel te nemen: RSE = [RSS / (n-2)] 1/2

De resterende som van kwadraten (RSS), financiën en econometrie

Financiële markten worden steeds meer kwantitatief gestuurd; Daarom gebruiken veel beleggers, op zoek naar een voorsprong, geavanceerde statistische technieken om hen te helpen bij hun beslissingen. Big data, machine learning en kunstmatige intelligentietoepassingen vereisen verder het gebruik van statistische eigenschappen om hedendaagse investeringsstrategieën te sturen. De resterende som van kwadraten – of RSS-statistieken – is een van de vele statistische eigenschappen die een renaissance doormaken.

Statistische modellen worden door beleggers en portefeuillebeheerders gebruikt om de prijs van een investering te volgen en die gegevens te gebruiken om toekomstige bewegingen te voorspellen. De studie, regressieanalyse genaamd, kan betrekking hebben op het analyseren van de relatie in prijsbewegingen tussen een grondstof en de aandelen van bedrijven die de grondstof produceren.

Elk model kan afwijkingen hebben tussen de voorspelde waarden en de werkelijke resultaten. Hoewel de varianties verklaard kunnen worden door de regressieanalyse, geeft de RSS de varianties of fouten weer die niet verklaard worden.

Aangezien een voldoende complexe regressiefunctie kan worden gemaakt om nauw aan te sluiten bij vrijwel elke dataset, is verder onderzoek nodig om te bepalen of de regressiefunctie inderdaad nuttig is bij het verklaren van de variantie van de dataset. Meestal is een kleinere of lagere waarde voor de RSS echter ideaal in elk model, omdat dit betekent dat er minder variatie in de dataset is. Met andere woorden, hoe lager de som van de gekwadrateerde residuen, hoe beter het regressiemodel de gegevens kan verklaren.