Welk percentage van de bevolking heb je nodig in een representatieve steekproef?
Technisch gezien vereist een representatieve steekproef alleen het percentage van de statistische populatie dat nodig is om de kwaliteit of het kenmerk dat wordt bestudeerd of geanalyseerd zo goed mogelijk te repliceren. Bijvoorbeeld, in een populatie van 1.000, bestaande uit 600 mannen en 400 vrouwen die worden gebruikt in een analyse van kooptrends naar geslacht, kan een representatieve steekproef slechts uit vijf leden bestaan, drie mannen en twee vrouwen, of 0,5 procent van de bevolking. Hoewel deze steekproef nominaal representatief is voor de grotere populatie, zal het waarschijnlijk resulteren in een hoge mate van steekproeffout bij het maken van conclusies met betrekking tot de grotere populatie omdat deze zo klein is.
Steekproeffout is een onvermijdelijk gevolg van het gebruik van steekproeven om een grotere groep te analyseren. Het verkrijgen van gegevens van hen is een proces dat van nature beperkt en onvolledig is. Maar omdat het zo vaak nodig is gezien de beperkte beschikbaarheid van middelen, gebruiken economische analisten methoden die steekproeffouten kunnen terugbrengen tot statistisch verwaarloosbare niveaus. Hoewel representatieve steekproeven een van de meest effectieve methoden is die worden gebruikt om fouten te verminderen, is het vaak niet voldoende om dit op zichzelf voldoende te doen.
Een strategie die in combinatie met representatieve steekproeven wordt gebruikt, is ervoor te zorgen dat de steekproef groot genoeg is om fouten optimaal te verminderen. En hoewel, in het algemeen, hoe groter de subgroep, hoe waarschijnlijker het is dat de fout wordt verminderd, wordt de vermindering op een bepaald punt zo minimaal dat het niet de extra kosten rechtvaardigt die nodig zijn om de steekproef groter te maken.
Net zoals het gebruik van een technisch representatieve maar kleine steekproef op zichzelf niet voldoende is om de steekproeffout te verminderen, kan het simpelweg kiezen van een grote groep zonder rekening te houden met representatie leiden tot nog meer gebrekkige resultaten dan het gebruik van de kleine representatieve steekproef. Terugkerend naar het bovenstaande voorbeeld: een groep van 600 mannen is op zichzelf statistisch onbruikbaar bij het analyseren van genderverschillen in kooptrends.
Verrassend genoeg heeft de steekproeffractie heel weinig te maken met de fout in de resultaten wanneer willekeurige steekproeven worden gebruikt. De belangrijkste foutdeterminant is de absolute steekproefomvang, niet de steekproefomvang in verhouding tot de populatiegrootte.