24 juni 2021 23:35

Sample Selectie Bias

Wat is de afwijking van de sample-selectie?

Bias voor steekproefselectie is een soort vertekening die wordt veroorzaakt door het kiezen van niet-willekeurige gegevens voor statistische analyse. De vertekening bestaat als gevolg van een fout in het steekproefselectieproces, waarbij een subset van de gegevens systematisch wordt uitgesloten vanwege een bepaald kenmerk. De uitsluiting van de subset kan de statistische significantie van de test beïnvloeden en kan de schattingen van parameters van het statistische model vertekenen.

Bias voor bemonsteringskeuze begrijpen

Overlevingsvooroordeel is een veel voorkomende vorm van steekproefselectie. Wanneer u bijvoorbeeld een beleggingsstrategie backtest op een grote groep aandelen, kan het handig zijn om te zoeken naar effecten die gegevens hebben voor de gehele steekproefperiode. Als we de strategie zouden testen aan de hand van 15 jaar aan aandelengegevens, zouden we geneigd kunnen zijn om aandelen te zoeken die volledige informatie hebben voor de volledige periode van 15 jaar. Het elimineren van een aandeel dat stopte met handelen, of kort de markt verliet, zou echter een vertekening in onze gegevenssteekproef opleveren. Aangezien we alleen aandelen opnemen die de periode van 15 jaar hebben geduurd, zouden onze uiteindelijke resultaten gebrekkig zijn, aangezien deze goed genoeg presteerden om de markt te overleven.

Prestatie-indexen van hedgefondsen zijn een voorbeeld van een voorkeur voor steekproefselectie die onderhevig is aan vooringenomenheid bij overleving. Omdat hedgefondsen die het niet overleven, stoppen met het rapporteren van hun prestaties aan indexaggregators, zijn de resulterende indices van nature geneigd tot fondsen en strategieën die blijven bestaan, en dus ‘overleven’. Dit kan ook een probleem zijn met populaire rapportageservices voor beleggingsfondsen.

Analisten kunnen zich aanpassen om rekening te houden met deze vooroordelen, maar kunnen nieuwe vooroordelen in het proces introduceren.