Hypothese testen
Wat is hypothesetesten?
Hypothesetesten is een handeling in de statistiek waarbij een analist een aanname test met betrekking tot een populatieparameter. De door de analist gehanteerde methodologie hangt af van de aard van de gebruikte gegevens en de reden voor de analyse.
Hypothesetoetsing wordt gebruikt om de plausibiliteit van een hypothese te beoordelen aan de hand van voorbeeldgegevens. Dergelijke gegevens kunnen afkomstig zijn van een grotere populatie of van een gegevensgenererend proces. Het woord “populatie” zal voor beide gevallen worden gebruikt in de volgende beschrijvingen.
Belangrijkste leerpunten
- Hypothesetoetsing wordt gebruikt om de plausibiliteit van een hypothese te beoordelen aan de hand van voorbeeldgegevens.
- De test levert bewijs voor de plausibiliteit van de hypothese, gegeven de gegevens.
- Statistische analisten testen een hypothese door een willekeurige steekproef van de geanalyseerde populatie te meten en te onderzoeken.
Hoe hypothesetests werken
Bij het testen van hypothesen toetst een analist een statistische steekproef, met als doel bewijs te leveren voor de plausibiliteit van de nulhypothese.
Statistische analisten testen een hypothese door een willekeurige steekproef van de geanalyseerde populatie te meten en te onderzoeken. Alle analisten gebruiken een willekeurige steekproef om twee verschillende hypothesen te testen: de nulhypothese en de alternatieve hypothese.
De nulhypothese is meestal een hypothese van gelijkheid tussen populatieparameters; een nulhypothese kan bijvoorbeeld stellen dat het gemiddelde populatierendement gelijk is aan nul. De alternatieve hypothese is in feite het tegenovergestelde van een nulhypothese (het gemiddelde populatierendement is bijvoorbeeld niet gelijk aan nul). Ze sluiten elkaar dus uit en er kan er maar één waar zijn. Een van de twee hypothesen zal echter altijd waar zijn.
4 stappen van hypothesetesten
Alle hypothesen worden getoetst aan de hand van een proces in vier stappen:
- De eerste stap is dat de analist de twee hypothesen formuleert, zodat er maar één gelijk kan hebben.
- De volgende stap is het opstellen van een analyseplan, waarin staat hoe de data worden geëvalueerd.
- De derde stap is om het plan uit te voeren en de voorbeeldgegevens fysiek te analyseren.
- De vierde en laatste stap is om de resultaten te analyseren en ofwel de nulhypothese te verwerpen, ofwel te stellen dat de nulhypothese aannemelijk is, gegeven de gegevens.
Voorbeeld uit de praktijk van hypothesetesten
Als iemand bijvoorbeeld wil testen dat een cent precies 50% kans heeft om op hoofden te landen, zou de nulhypothese zijn dat 50% correct is, en de alternatieve hypothese zou zijn dat 50% niet correct is.
Wiskundig gezien zou de nulhypothese worden weergegeven als Ho: P = 0,5. De alternatieve hypothese zou worden aangeduid als “Ha” en identiek zijn aan de nulhypothese, behalve met het gelijkteken doorgehaald, wat betekent dat het niet gelijk is aan 50%.
Er wordt een willekeurige steekproef van 100 coinflips genomen en de nulhypothese wordt vervolgens getest. Als blijkt dat de 100 coinflips werden verdeeld als 40 koppen en 60 staarten, zou de analist aannemen dat een cent geen 50% kans heeft om op kop te landen en zou hij de nulhypothese verwerpen en de alternatieve hypothese accepteren.
Als er daarentegen 48 koppen en 52 muntstukken waren, dan is het aannemelijk dat de munt eerlijk zou kunnen zijn en toch een dergelijk resultaat zou opleveren. In gevallen zoals deze waarin de nulhypothese “geaccepteerd” wordt, stelt de analist dat het verschil tussen de verwachte resultaten (50 koppen en 50 staarten) en de waargenomen resultaten (48 koppen en 52 staarten) “alleen door toeval verklaard kan worden”.