25 juni 2021 4:50

Wat is een relatieve standaardfout?

In statistieken is een relatieve standaardfout (RSE) gelijk aan de standaardfout van een enquêteschatting gedeeld door de enquêteschatting en vervolgens vermenigvuldigd met 100. Het aantal wordt vermenigvuldigd met 100 zodat het kan worden uitgedrukt als een percentage. De RSE vertegenwoordigt niet noodzakelijk nieuwe informatie die verder gaat dan de standaardfout, maar het kan een superieure methode zijn om statistische betrouwbaarheid te presenteren.

Relatieve standaardfout versus standaardfout

Standaardfout meet hoeveel een enquêteschatting waarschijnlijk zal afwijken van de werkelijke populatie. Het wordt uitgedrukt als een getal. Daarentegen is relatieve standaardfout (RSE) de standaardfout uitgedrukt als een fractie van de schatting en wordt deze meestal weergegeven als een percentage. Schattingen met een RSE van 25% of meer zijn onderhevig aan hoge steekproeffouten en moeten met voorzichtigheid worden gebruikt.

Onderzoeksschatting en standaardfout

Enquêtes en standaardfouten zijn cruciale onderdelen van kansrekening en statistiek. Statistici gebruiken standaardfouten om betrouwbaarheidsintervallen te construeren op basis van hun onderzochte gegevens. De betrouwbaarheid van deze schattingen kan ook worden beoordeeld in termen van een betrouwbaarheidsinterval. Betrouwbaarheidsintervallen zijn belangrijk voor het bepalen van de validiteit van empirische tests en onderzoek.

Een betrouwbaarheidsinterval is een soort intervalschatting, berekend op basis van de statistieken van de geobserveerde gegevens, die de werkelijke waarde van een onbekende populatieparameter kan bevatten. Betrouwbaarheidsintervallen vertegenwoordigen het bereik waarin de populatiewaarde waarschijnlijk zal liggen. Ze zijn geconstrueerd op basis van de schatting van de populatiewaarde en de bijbehorende standaardfout. Er is bijvoorbeeld ongeveer 95% kans (dwz 19 kansen op 20) dat de populatiewaarde binnen twee standaardfouten van de schattingen ligt, dus het 95% betrouwbaarheidsinterval is gelijk aan de schatting plus of min twee standaardfouten.

In termen van de leek is de standaardfout van een gegevenssteekproef een maat voor het waarschijnlijke verschil tussen de steekproef en de gehele populatie. Een onderzoek onder 10.000 volwassenen die sigaretten roken, kan bijvoorbeeld iets andere statistische resultaten opleveren dan wanneer elke mogelijke volwassene die sigaretten rookt, zou worden ondervraagd.

Kleinere steekproeffouten duiden op betrouwbaardere resultaten. De centrale limietstelling in inferentiële statistieken suggereert dat grote steekproeven de neiging hebben om ongeveer normale verdelingen en lage steekproeffouten te hebben.

Standaarddeviatie en standaardfout

De standaarddeviatie van een dataset wordt gebruikt om de concentratie van onderzoeksresultaten uit te drukken. Minder variatie in de gegevens resulteert in een lagere standaarddeviatie. Meer variatie leidt waarschijnlijk tot een hogere standaarddeviatie.

De standaardfout wordt soms verward met de standaarddeviatie. De standaardfout verwijst eigenlijk naar de standaarddeviatie van het gemiddelde. Standaarddeviatie verwijst naar de variabiliteit binnen een bepaalde steekproef, terwijl een standaardfout de variabiliteit van de steekproefverdeling zelf is.

Relatieve standaardfout

De standaardfout is een absolute graadmeter tussen de steekproefenquête en de totale populatie. De relatieve standaardfout geeft aan of de standaardfout groot is in verhouding tot de resultaten; grote relatieve standaardfouten suggereren dat de resultaten niet significant zijn. De formule voor relatieve standaardfout is: