Betrouwbaarheidsinterval
Wat is een betrouwbaarheidsinterval?
Een betrouwbaarheidsinterval, in statistieken, verwijst naar de kans dat een populatieparameter gedurende een bepaald aantal keren tussen een set waarden valt.
Belangrijkste leerpunten
- Een betrouwbaarheidsinterval geeft de kans weer dat een parameter tussen een paar waarden rond het gemiddelde valt.
- Betrouwbaarheidsintervallen meten de mate van onzekerheid of zekerheid in een steekproefmethode.
- Ze worden meestal geconstrueerd met betrouwbaarheidsniveaus van 95% of 99%.
Inzicht in betrouwbaarheidsinterval
Betrouwbaarheidsintervallen meten de mate van onzekerheid of zekerheid in een steekproefmethode. Ze kunnen een willekeurig aantal waarschijnlijkheidsgrenzen aannemen, met als meest voorkomende een betrouwbaarheidsniveau van 95% of 99%. Betrouwbaarheidsintervallen worden uitgevoerd met behulp van statistische methoden, zoals een t-test.
Statistici gebruiken betrouwbaarheidsintervallen om de onzekerheid in een steekproefvariabele te meten. Een onderzoeker selecteert bijvoorbeeld willekeurig verschillende steekproeven uit dezelfde populatie en berekent een betrouwbaarheidsinterval voor elke steekproef om te zien hoe deze de werkelijke waarde van de populatievariabele kan vertegenwoordigen. De resulterende datasets zijn allemaal verschillend; sommige intervallen bevatten de werkelijke populatieparameter en andere niet.
Een betrouwbaarheidsinterval is een reeks waarden, begrensd boven en onder het gemiddelde van de statistiek, die waarschijnlijk een onbekende populatieparameter bevat. Betrouwbaarheidsniveau verwijst naar het percentage van de waarschijnlijkheid, of zekerheid, dat het betrouwbaarheidsinterval de ware populatieparameter zou bevatten wanneer u meerdere keren een willekeurige steekproef trekt. Of, in de volksmond, “we zijn 99% zeker ( betrouwbaarheidsniveau) dat de meeste van deze steekproeven (betrouwbaarheidsintervallen) de ware populatieparameter bevatten.”
De grootste misvatting over betrouwbaarheidsintervallen is dat ze het percentage gegevens van een bepaalde steekproef vertegenwoordigen dat tussen de boven- en ondergrens valt. Men zou bijvoorbeeld ten onrechte het bovengenoemde 99% -betrouwbaarheidsinterval van 70 tot 78 inch kunnen interpreteren als een indicatie dat 99% van de gegevens in een willekeurige steekproef tussen deze getallen valt. Dit is onjuist, hoewel er een aparte statistische analysemethode bestaat om een dergelijke vaststelling te doen. Dit omvat het identificeren van de gemiddelde en standaarddeviatie van het monster en het plotten van deze cijfers op een belcurve.
Vertrouwen interval en het vertrouwen niveau met elkaar verbonden zijn, maar zijn niet precies hetzelfde.
Betrouwbaarheidsinterval berekenen
Stel dat een groep onderzoekers de hoogtes van basketbalspelers op de middelbare school bestudeert. De onderzoekers nemen een willekeurige steekproef uit de populatie en stellen een gemiddelde lengte van 74 inch vast.
Het gemiddelde van 74 inch is een puntschatting van het populatiegemiddelde. Een puntschatting op zichzelf is van beperkt nut omdat deze de onzekerheid die met de schatting samenhangt niet onthult; je hebt geen goed idee hoe ver dit 74-inch steekproefgemiddelde zou kunnen zijn van het populatiegemiddelde. Wat ontbreekt, is de mate van onzekerheid in deze enkele steekproef.
Betrouwbaarheidsintervallen geven meer informatie dan puntschattingen. Door een betrouwbaarheidsinterval van 95% vast te stellen met behulp van de gemiddelde en standaarddeviatie van de steekproef, en door een normale verdeling aan te nemen zoals weergegeven door de belcurve, komen de onderzoekers tot een boven- en ondergrens die het ware gemiddelde 95% van de tijd bevat.
Stel dat het interval tussen 72 inch en 76 inch ligt. Als de onderzoekers 100 willekeurige steekproeven nemen van de populatie van basketbalspelers op de middelbare school als geheel, zou het gemiddelde in 95 van die steekproeven tussen 72 en 76 inch moeten liggen.
Als de onderzoekers nog meer vertrouwen willen, kunnen ze het interval uitbreiden naar 99% vertrouwen. Hierdoor ontstaat steevast een breder bereik, aangezien het ruimte maakt voor een groter aantal steekproeven. Als ze het 99% -betrouwbaarheidsinterval tussen 70 inch en 78 inch vaststellen, kunnen ze verwachten dat 99 van de 100 geëvalueerde monsters een gemiddelde waarde tussen deze getallen bevatten.
Een betrouwbaarheidsniveau van 90% impliceert daarentegen dat we verwachten dat 90% van de intervalschattingen de populatieparameter bevatten, enzovoort.
Veel Gestelde Vragen
Wat onthult een betrouwbaarheidsinterval?
Een betrouwbaarheidsinterval is een reeks waarden, begrensd boven en onder het gemiddelde van de statistiek, die waarschijnlijk een onbekende populatieparameter bevat. Betrouwbaarheidsniveau verwijst naar het percentage van de waarschijnlijkheid, of zekerheid, dat het betrouwbaarheidsinterval de ware populatieparameter zou bevatten wanneer u meerdere keren een willekeurige steekproef trekt.
Hoe worden betrouwbaarheidsintervallen gebruikt?
Statistici gebruiken betrouwbaarheidsintervallen om de onzekerheid in een steekproefvariabele te meten. Een onderzoeker selecteert bijvoorbeeld willekeurig verschillende steekproeven uit dezelfde populatie en berekent een betrouwbaarheidsinterval voor elke steekproef om te zien hoe deze de werkelijke waarde van de populatievariabele kan vertegenwoordigen. De resulterende datasets zijn allemaal verschillend, waarbij sommige intervallen de ware populatieparameter bevatten en andere niet.
Wat is een veel voorkomende misvatting over vertrouwensintervallen?
De grootste misvatting over betrouwbaarheidsintervallen is dat ze het percentage gegevens van een bepaalde steekproef vertegenwoordigen dat tussen de boven- en ondergrens valt. Met andere woorden, het zou onjuist zijn om aan te nemen dat een betrouwbaarheidsinterval van 99% betekent dat 99% van de gegevens in een willekeurige steekproef tussen deze grenzen valt. Wat het eigenlijk betekent, is dat men er 99% zeker van kan zijn dat het bereik het populatiegemiddelde zal bevatten.
Wat is een T-test?
Betrouwbaarheidsintervallen worden uitgevoerd met behulp van statistische methoden, zoals een t-test. Een t-toets is een soort inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die verband kunnen houden met bepaalde kenmerken. Voor het berekenen van een t-toets zijn drie belangrijke gegevenswaarden nodig. Ze omvatten het verschil tussen de gemiddelde waarden van elke gegevensset (het gemiddelde verschil genoemd), de standaarddeviatie van elke groep en het aantal gegevenswaarden van elke groep.