24 juni 2021 17:06

Hypothesetesten in de financiële sector: concept en voorbeelden

Uw beleggingsadviseur stelt u een maandelijks investeringsplan voor dat elke maand een variabel rendement belooft. U investeert er alleen in als u verzekerd bent van een gemiddeld maandelijks inkomen van $ 180. Uw adviseur vertelt u ook dat de regeling de afgelopen 300 maanden een beleggingsrendement had met een gemiddelde waarde van $ 190 en een standaarddeviatie van $ 75. Moet u in deze regeling investeren? Hypothesetoetsing is een hulpmiddel bij dergelijke besluitvorming.

Belangrijkste leerpunten

  • Hypothesetesten is een wiskundig hulpmiddel om een ​​financiële of zakelijke claim of idee te bevestigen.
  • Het testen van hypothesen is nuttig voor beleggers die proberen te beslissen waarin ze willen beleggen en of het instrument waarschijnlijk een bevredigend rendement zal opleveren.
  • Ondanks het bestaan ​​van verschillende methodologieën voor het testen van hypothesen, worden dezelfde vier stappen gebruikt: definieer de hypothese, stel de criteria vast, bereken de statistiek en kom tot een conclusie.
  • Dit wiskundige model heeft, net als de meeste statistische tools en modellen, beperkingen en is vatbaar voor bepaalde fouten, waardoor investeerders ook andere modellen moeten overwegen in combinatie met dit model.

Wat is hypothesetesten?

Hypothese- of significantietest is een wiskundig model voor het testen van een claim, idee of hypothese over een parameter die van belang is in een bepaalde populatieset, met behulp van gegevens die zijn gemeten in een steekproefset. Er worden berekeningen uitgevoerd op geselecteerde steekproeven om meer doorslaggevende informatie te verzamelen over de kenmerken van de gehele populatie, waardoor op een systematische manier claims of ideeën over de gehele dataset kunnen worden getoetst.

Hier is een eenvoudig voorbeeld: een schooldirecteur meldt dat leerlingen op hun school gemiddeld 7 op 10 scoren bij examens. Om deze “hypothese” te testen, registreren we cijfers van bijvoorbeeld 30 studenten (steekproef) van de gehele studentenpopulatie van de school (zeg 300) en berekenen we het gemiddelde van die steekproef. We kunnen dan het (berekende) steekproefgemiddelde vergelijken met het (gerapporteerde) populatiegemiddelde en proberen de hypothese te bevestigen.

Om een ​​ander voorbeeld te noemen: het jaarlijkse rendement van een bepaald beleggingsfonds is 8%. Stel dat het onderlinge fonds 20 jaar bestaat. We nemen een willekeurige steekproef van de jaarlijkse opbrengsten van het onderlinge fonds over bijvoorbeeld vijf jaar (steekproef) en berekenen het gemiddelde. Vervolgens vergelijken we het (berekende) steekproefgemiddelde met het (geclaimde) populatiegemiddelde om de hypothese te verifiëren.



Dit artikel gaat ervan uit dat de lezers bekend zijn met concepten van een normale distributietabel, formule, p-waarde en gerelateerde basisprincipes van statistieken.

Er bestaan ​​verschillende methodologieën voor het testen van hypothesen, maar het gaat om dezelfde vier basisstappen:

Stap 1: Definieer de hypothese

Gewoonlijk wordt de gerapporteerde waarde (of de claimstatistieken) vermeld als de hypothese en verondersteld waar te zijn. Voor de bovenstaande voorbeelden is de hypothese:

  • Voorbeeld A: Leerlingen op school scoren gemiddeld 7 op 10 bij examens.
  • Voorbeeld B: Het jaarlijkse rendement van het onderlinge fonds is 8% per jaar.

Deze verklaarde beschrijving vormt de ” nulhypothese (H 0 ) ” en wordt  verondersteld waar  te zijn – de manier waarop een verdachte in een juryrechtspraak voor onschuldig wordt gehouden totdat zijn schuld is bewezen door het bewijs dat in de rechtbank wordt gepresenteerd. Evenzo begint het testen van hypothesen met het stellen en aannemen van een ” nulhypothese “, en vervolgens bepaalt het proces of de aanname waarschijnlijk waar of onwaar is.

Het belangrijke punt om op te merken is dat we de nulhypothese testen omdat er een element van twijfel bestaat over de geldigheid ervan. Welke informatie dan ook die in strijd is met de gestelde nulhypothese, wordt vastgelegd in de  alternatieve hypothese (H 1 ). Voor de bovenstaande voorbeelden is de alternatieve hypothese:

  • Studenten scoren een gemiddelde dat niet gelijk is aan 7.
  • Het jaarlijkse rendement van het onderlinge fonds is niet gelijk aan 8% per jaar.

Met andere woorden, de alternatieve hypothese is een directe tegenspraak met de nulhypothese.

Net als bij een proces gaat de jury uit van de onschuld van de verdachte (nulhypothese). De officier van justitie moet het tegendeel bewijzen (alternatieve hypothese). Evenzo moet de onderzoeker bewijzen dat de nulhypothese waar of onwaar is. Als de aanklager de alternatieve hypothese niet kan bewijzen, moet de jury de verdachte laten gaan (de beslissing baseren op de nulhypothese). Evenzo, als de onderzoeker er niet in slaagt een alternatieve hypothese te bewijzen (of simpelweg niets doet), wordt aangenomen dat de nulhypothese waar is.



De besluitvormingscriteria moeten gebaseerd zijn op bepaalde parameters van datasets.

Stap 2: Stel de criteria in

De besluitvormingscriteria moeten gebaseerd zijn op bepaalde parameters van datasets en hier komt het verband met normale distributie in beeld.

Volgens de standaardstatistieken  over de steekproefverdeling : “Voor elke steekproefomvang n is de steekproefverdeling van X normal normaal als de populatie X waaruit de steekproef wordt getrokken normaal is verdeeld.” Daarom zijn de waarschijnlijkheden van alle andere mogelijke steekproeven die men zou kunnen selecteren normaal verdeeld.

Bepaal bijvoorbeeld of het gemiddelde dagelijkse rendement van een aandeel genoteerd aan de XYZ- aandelenmarkt rond nieuwjaarsdag groter is dan 2%.

H 0 : nulhypothese: gemiddelde = 2%

H 1 : Alternatieve hypothese: gemiddelde> 2% (dit is wat we willen bewijzen)

Neem de steekproef (zeg maar van 50 aandelen op een totaal van 500) en bereken het gemiddelde van de steekproef.

Voor een normale verdeling ligt 95% van de waarden binnen twee standaarddeviaties van het populatiegemiddelde. Daarom stelt deze aanname van normale verdeling en centrale limieten voor de voorbeelddataset ons in staat om 5% als significantieniveau vast te stellen. Het is logisch omdat er bij deze aanname minder dan 5% kans (100-95) is om uitschieters te krijgen die groter zijn dan twee standaarddeviaties van het populatiegemiddelde. Afhankelijk van de aard van datasets, kunnen andere significantieniveaus worden genomen op 1%, 5% of 10%. Voor financiële berekeningen (inclusief gedragsfinanciering) is 5% de algemeen aanvaarde limiet. Als we berekeningen vinden die verder gaan dan de gebruikelijke twee standaarddeviaties, dan hebben we een sterk geval van uitschieters om de nulhypothese te verwerpen. 

Grafisch wordt het als volgt weergegeven:

Als in het bovenstaande voorbeeld het gemiddelde van de steekproef veel groter is dan 2% (zeg 3,5%), dan verwerpen we de nulhypothese. De alternatieve hypothese (gemiddelde> 2%) wordt aanvaard, die bevestigt dat het gemiddelde dagelijkse rendement van de aandelen inderdaad boven de 2% ligt.

Als het gemiddelde van de steekproef echter waarschijnlijk niet significant groter is dan 2% (en bijvoorbeeld rond de 2,2% blijft), dan KUNNEN we de nulhypothese NIET verwerpen. De uitdaging is hoe te beslissen over dergelijke zaken op korte afstand. Om een ​​conclusie te trekken uit geselecteerde steekproeven en resultaten, moet een significantieniveau worden bepaald, waarmee een conclusie kan worden getrokken over de nulhypothese. De alternatieve hypothese maakt het mogelijk om het significantieniveau of het “kritische waarde” -concept vast te stellen voor het beslissen over dergelijke zaken op korte afstand.

Volgens destandaarddefinitie van het leerboek: “Een kritische waarde is een afkapwaarde die de grenzen definieert waarbuiten minder dan 5% van de steekproefgemiddelden kan worden verkregen als de nulhypothese waar is. Steekproefgemiddelden verkregen boven een kritische waarde zullen resulteren in een beslissing om de nulhypothese te verwerpen. ”  Als we in het bovenstaande voorbeeld de kritische waarde hebben gedefinieerd als 2,1%, en het berekende gemiddelde komt op 2,2%, dan verwerpen we de nulhypothese Een kritische waarde stelt een duidelijke afbakening vast over acceptatie of afwijzing.

Stap 3: Bereken de statistiek

Deze stap omvat het berekenen van de vereiste cijfers, ook wel teststatistieken genoemd (zoals gemiddelde, z-score, p-waarde, enz.), Voor de geselecteerde steekproef. (We komen hier later op terug.)

Stap 4: kom tot een conclusie

Bepaal met de berekende waarde (n) de nulhypothese. Als de kans om een ​​steekproefgemiddelde te krijgen kleiner is dan 5%, dan is de conclusie om de nulhypothese te verwerpen. Anders, accepteren en behouden van de nulhypothese.

Soorten fouten

Er kunnen vier mogelijke uitkomsten zijn bij het nemen van steekproeven, met betrekking tot de juiste toepasbaarheid op de gehele populatie:

De “juiste” gevallen zijn die waarin de beslissingen die op de steekproeven worden genomen echt van toepassing zijn op de hele populatie. De gevallen van fouten doen zich voor wanneer men besluit de nulhypothese te behouden (of te verwerpen) op basis van de steekproefberekeningen, maar die beslissing geldt niet echt voor de hele populatie. Deze gevallen zijn Type 1 ( alfa ) en Type 2 ( bèta ) fouten, zoals aangegeven in de bovenstaande tabel.

Door de juiste kritische waarde te selecteren, kunnen de type-1 alpha-fouten worden geëlimineerd of worden beperkt tot een acceptabel bereik.

Alpha geeft de fout op significantieniveau aan en wordt bepaald door de onderzoeker. Om het standaard significantie- of betrouwbaarheidsniveau van 5% voor kansberekeningen te behouden, wordt dit gehandhaafd op 5%.

Volgens de toepasselijke benchmarks en definities voor besluitvorming:

  • “Dit (alfa) criterium wordt meestal gesteld op 0,05 (a = 0,05), en we vergelijken het alfaniveau met de p-waarde. Als de kans op een Type I-fout kleiner is dan 5% (p <0,05), besluiten we de nulhypothese te verwerpen;anders behouden we de nulhypothese. "
  • De technische term die voor deze kans wordt gebruikt, is dep-waarde. Het wordt gedefinieerd als “de kans op het verkrijgen van een steekproefresultaat, aangezien de waarde vermeld in de nulhypothese waar is. De p-waarde voor het verkrijgen van een steekproefresultaat wordt vergeleken met het significantieniveau. “
  • Een Type II-fout, of bètafout, wordt gedefinieerd als de waarschijnlijkheid dat de nulhypothese onjuist wordt gehandhaafd, terwijl deze in feite niet van toepassing is op de hele populatie.

Nog een paar voorbeelden zullen deze en andere berekeningen demonstreren.

voorbeeld 1

Er bestaat een beleggingsregeling met een maandelijks inkomen die variabele maandelijkse rendementen belooft. Een belegger zal er alleen in investeren als hij verzekerd is van een gemiddeld maandelijks inkomen van $ 180. De belegger heeft een steekproef van het rendement van 300 maanden, met een gemiddelde van $ 190 en een standaarddeviatie van $ 75. Moeten ze in deze regeling investeren?

Laten we het probleem oplossen. De belegger zal in de regeling investeren als hij verzekerd is van het door de belegger gewenste gemiddelde rendement van $ 180.

H 0 : nulhypothese: gemiddelde = 180

H 1 : alternatieve hypothese: gemiddelde> 180

Methode 1: Kritische waardebenadering

Identificeer een kritische waarde X L voor het steekproefgemiddelde, die groot genoeg is om de nulhypothese te verwerpen – dwz verwerp de nulhypothese als het steekproefgemiddelde> = kritische waarde X L

P (identificeer een Type I alpha-fout) = P (verwerp H 0  aangezien H 0  waar is),

Dit zou worden bereikt wanneer het steekproefgemiddelde de kritische limieten overschrijdt.

= P (aangezien H 0  waar is) = alpha

Grafisch ziet het er als volgt uit:

Neem alfa = 0,05 (dwz 5% significantieniveau), Z 0,05  = 1,645 (van de Z-tabel of normale distributietabel)

           => X L  = 180 + 1,645 * (75 / sqrt (300)) = 187,12

Omdat het steekproefgemiddelde (190) groter is dan de kritische waarde (187,12), wordt de nulhypothese verworpen en wordt geconcludeerd dat het gemiddelde maandelijkse rendement inderdaad hoger is dan $ 180, zodat de belegger kan overwegen om in dit plan te investeren.

Methode 2: gestandaardiseerde teststatistieken gebruiken

Men kan ook gebruik maken van gestandaardiseerde waarde z.

Teststatistiek, Z = (steekproefgemiddelde – populatiegemiddelde) / (std-dev / sqrt (aantal steekproeven).

Dan wordt het afwijzingsgebied het volgende:

Z = (190 – 180) / (75 / sqrt (300)) = 2.309

Ons afwijzingsgebied bij een significantieniveau van 5% is Z> Z 0,05  = 1,645.

Aangezien Z = 2.309 groter is dan 1.645, kan de nulhypothese worden verworpen met een soortgelijke conclusie als hierboven vermeld.

Methode 3: Berekening van P-waarde

We streven ernaar om P te identificeren (steekproefgemiddelde> = 190, wanneer gemiddelde = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

De volgende tabel om berekeningen van de p-waarde af te leiden, concludeert dat er bevestigd bewijs is dat het gemiddelde maandrendement hoger is dan 180:

Voorbeeld 2

Een nieuwe effectenmakelaar (XYZ) beweert dat hun makelaarskosten lager zijn dan die van uw huidige effectenmakelaar (ABC). Gegevens die beschikbaar zijn van een onafhankelijk onderzoeksbureau geven aan dat het gemiddelde en de standaardwaarde van alle ABC-makelaarsklanten respectievelijk $ 18 en $ 6 bedragen.

Er wordt een steekproef van 100 klanten van ABC genomen en de bemiddelingskosten worden berekend met de nieuwe tarieven van XYZ-makelaar. Als het gemiddelde van de steekproef $ 18,75 is en std-dev hetzelfde is ($ 6), kan er dan enige conclusie worden getrokken over het verschil in de gemiddelde makelaarskosten tussen ABC- en XYZ-makelaar?

H 0 : nulhypothese: gemiddelde = 18

H 1 : Alternatieve hypothese: gemiddelde 18 (dit is wat we willen bewijzen.)

Afwijzingsgebied: Z = Z 2,5  (uitgaande van 5% significantieniveau, opgesplitst 2,5 elk aan beide zijden).

Z = (steekproefgemiddelde – gemiddelde) / (std-dev / sqrt (aantal steekproeven))

= (18,75 – 18) / (6 / (sqrt (100)) = 1,25

Deze berekende Z-waarde valt tussen de twee limieten gedefinieerd door:

– Z 2,5  = -1,96 en Z 2,5  = 1,96.

Hieruit wordt geconcludeerd dat er onvoldoende bewijs is om te concluderen dat er een verschil is tussen de tarieven van uw bestaande makelaar en de nieuwe makelaar.

Alternatief: De p-waarde = P (Z 1,25)

= 2 * 0,1056 = 0,2112 = 21,12% wat groter is dan 0,05 of 5%, wat tot dezelfde conclusie leidt.

Grafisch wordt het weergegeven door het volgende:

Kritiekpunten voor de hypothetische testmethode:

  • Een statistische methode gebaseerd op aannames
  • Foutgevoelig zoals gedetailleerd in termen van alfa- en bètafouten
  • Interpretatie van p-waarde kan dubbelzinnig zijn, wat tot verwarrende resultaten leidt

Het komt neer op

Door hypotheses te testen kan een wiskundig model een claim of idee valideren met een bepaald betrouwbaarheidsniveau. Net als de meeste statistische tools en modellen is het echter gebonden aan een aantal beperkingen. Het gebruik van dit model voor het nemen van financiële beslissingen moet met een kritische blik worden bekeken, waarbij alle afhankelijkheden in gedachten moeten worden gehouden. Alternatieve methoden zoals  Bayesian Inference zijn ook het onderzoeken waard voor vergelijkbare analyse.