Nul-hypothese
Wat is een nulhypothese?
Een nulhypothese is een soort hypothese die in statistieken wordt gebruikt en die suggereert dat er geen verschil is tussen bepaalde kenmerken van een populatie (of gegevensgenererend proces).
Een gokker kan bijvoorbeeld geïnteresseerd zijn in de vraag of een kansspel eerlijk is. Als het eerlijk is, komt de verwachte winst per spel voor beide spelers op 0. Als het spel niet eerlijk is, zijn de verwachte inkomsten positief voor de ene speler en negatief voor de andere. Om te testen of het spel eerlijk is, verzamelt de gokker inkomstengegevens van vele herhalingen van het spel, berekent de gemiddelde inkomsten uit deze gegevens en test vervolgens de nulhypothese dat de verwachte inkomsten niet verschillen van nul.
Als de gemiddelde inkomsten uit de steekproefgegevens ver genoeg van nul liggen, zal de gokker de nulhypothese verwerpen en de alternatieve hypothese concluderen, namelijk dat de verwachte inkomsten per spel niet nul zijn. Als de gemiddelde inkomsten uit de steekproefgegevens bijna nul zijn, zal de gokker de nulhypothese niet verwerpen, maar in plaats daarvan concluderen dat het verschil tussen het gemiddelde van de gegevens en 0 alleen door toeval kan worden verklaard.
Belangrijkste leerpunten
- Een nulhypothese is een soort vermoeden dat in statistieken wordt gebruikt en die suggereert dat er geen verschil is tussen bepaalde kenmerken van een populatie of gegevensgenererend proces.
- De alternatieve hypothese stelt dat er een verschil is.
- Hypothesetesten bieden een methode om een nulhypothese binnen een bepaald betrouwbaarheidsniveau te verwerpen. (Null-hypothesen kunnen echter niet worden bewezen.)
Hoe een nulhypothese werkt
De nulhypothese, ook wel het vermoeden genoemd, gaat ervan uit dat elk verschil tussen de gekozen kenmerken die u in een set gegevens ziet, te wijten is aan toeval. Als de verwachte inkomsten voor het gokspel bijvoorbeeld echt gelijk zijn aan 0, dan is elk verschil tussen de gemiddelde inkomsten in de gegevens en 0 te wijten aan toeval.
Statistische hypothesen worden getoetst aan de hand van een proces in vier stappen. De eerste stap is dat de analist de twee hypothesen formuleert, zodat er maar één gelijk kan hebben. De volgende stap is het opstellen van een analyseplan, waarin staat hoe de data worden geëvalueerd. De derde stap is om het plan uit te voeren en de voorbeeldgegevens fysiek te analyseren. De vierde en laatste stap is om de resultaten te analyseren en de nulhypothese te verwerpen of te beweren dat de waargenomen verschillen alleen door toeval kunnen worden verklaard.
Analisten proberen de nulhypothese te verwerpen omdat dit een sterke conclusie is. Dit vereist sterk bewijs in de vorm van een waargenomen verschil dat te groot is om uitsluitend door toeval te worden verklaard. Het niet verwerpen van de nulhypothese – dat de resultaten alleen door het toeval kunnen worden verklaard – is een zwakke conclusie, omdat het toestaat dat andere factoren dan toeval een rol spelen, maar mogelijk niet sterk genoeg zijn om door de gebruikte statistische test te worden gedetecteerd.
Belangrijk
Analisten proberen de nulhypothese te verwerpen om het toeval alleen uit te sluiten als verklaring voor de verschijnselen die van belang zijn.
Voorbeelden van een nulhypothese
Hier is een eenvoudig voorbeeld. Een schooldirecteur beweert dat leerlingen op haar school gemiddeld een 7 op 10 scoren bij examens. De nulhypothese is dat de bevolking gemiddelde is 7,0. Om deze nulhypothese te testen, registreren we cijfers van bijvoorbeeld 30 studenten (steekproef) van de gehele studentenpopulatie van de school (zeg 300) en berekenen we het gemiddelde van die steekproef.
We kunnen dan het (berekende) steekproefgemiddelde vergelijken met het (hypothetische) populatiegemiddelde van 7,0 en proberen de nulhypothese te verwerpen. (De nulhypothese hier – dat het populatiegemiddelde 7,0 is – kan niet worden bewezen met behulp van de steekproefgegevens; het kan alleen worden verworpen.)
Neem een ander voorbeeld: het jaarlijkse rendement van een bepaald beleggingsfonds zou 8% zijn. Stel dat een beleggingsfonds al 20 jaar bestaat. De nulhypothese is dat het gemiddelde rendement 8% is voor het beleggingsfonds. We nemen een willekeurige steekproef van de jaarlijkse opbrengsten van het onderlinge fonds over bijvoorbeeld vijf jaar (steekproef) en berekenen het steekproefgemiddelde. Vervolgens vergelijken we het (berekende) steekproefgemiddelde met het (geclaimde) populatiegemiddelde (8%) om de nulhypothese te testen.
Voor de bovenstaande voorbeelden zijn nulhypothesen:
- Voorbeeld A: Leerlingen op school scoren gemiddeld 7 op 10 bij examens.
- Voorbeeld B: Het gemiddelde jaarlijkse rendement van het onderlinge fonds is 8% per jaar.
Om te bepalen of de nulhypothese al dan niet moet worden afgewezen, wordt, omwille van het argument, aangenomen dat de nulhypothese (afgekort H 0 ) waar is. Vervolgens wordt het waarschijnlijke bereik van mogelijke waarden van de berekende statistiek (bijv. De gemiddelde score op tests van 30 studenten) bepaald onder deze aanname (bijv. Het bereik van plausibele gemiddelden kan variëren van 6,2 tot 7,8 als het populatiegemiddelde 7,0 is). Als het steekproefgemiddelde buiten dit bereik valt, wordt de nulhypothese verworpen. Anders wordt gezegd dat het verschil “alleen door het toeval kan worden verklaard”, omdat het binnen het bereik valt dat alleen door het toeval wordt bepaald.
Een belangrijk punt om op te merken is dat we de nulhypothese testen omdat er twijfel bestaat over de geldigheid ervan. Welke informatie ook in strijd is met de gestelde nulhypothese, wordt vastgelegd in de alternatieve hypothese (H 1 ). Voor de bovenstaande voorbeelden zou de alternatieve hypothese zijn:
- Studenten scoren een gemiddelde dat niet gelijk is aan 7.
- Het gemiddelde jaarlijkse rendement van het onderlinge fonds is niet gelijk aan 8% per jaar.
Met andere woorden, de alternatieve hypothese is een directe tegenspraak met de nulhypothese.
Hypothesetesten voor investeringen
Stel dat Alice ziet dat haar beleggingsstrategie een hoger gemiddeld rendement oplevert dan alleen het kopen en aanhouden van aandelen. De nulhypothese stelt dat er geen verschil is tussen de twee gemiddelde rendementen, en Alice is geneigd dit te geloven totdat ze tegenstrijdige resultaten kan concluderen.
Om de nulhypothese te weerleggen, zou statistische significantie moeten worden aangetoond, die kan worden gevonden met behulp van een verscheidenheid aan tests. De alternatieve hypothese zou stellen dat de beleggingsstrategie een hoger gemiddeld rendement heeft dan een traditionele buy-and-hold-strategie.
Een hulpmiddel dat kan worden gebruikt om de statistische significantie van de resultaten te bepalen, is de p-waarde. Een p-waarde vertegenwoordigt de kans dat een verschil zo groot of groter dan het waargenomen verschil tussen de twee gemiddelde rendementen uitsluitend door toeval zou kunnen ontstaan.
Een p-waarde die kleiner is dan of gelijk is aan 0,05 wordt vaak gebruikt om aan te geven of er bewijs is tegen de nulhypothese. Als Alice een van deze tests uitvoert, zoals een test met het normale model, wat resulteert in een significant verschil tussen haar opbrengsten en de buy-and-hold-opbrengsten (de p-waarde is kleiner dan of gelijk aan 0,05), dan kan ze verwerp de nulhypothese en sluit de alternatieve hypothese af.