Gestratificeerde willekeurige bemonstering
Wat is gestratificeerde willekeurige bemonstering?
Gestratificeerde willekeurige steekproef is een steekproefmethode waarbij een populatie wordt opgedeeld in kleinere subgroepen die bekend staan als strata. Bij gestratificeerde willekeurige steekproeven, of stratificatie, worden de strata gevormd op basis van gedeelde attributen of kenmerken van leden, zoals inkomen of opleidingsniveau.
Gestratificeerde willekeurige steekproeven worden ook wel proportionele willekeurige steekproeven of quota-willekeurige steekproeven genoemd.
Belangrijkste leerpunten
- Gestratificeerde willekeurige steekproeven stellen onderzoekers in staat een steekproefpopulatie te verkrijgen die het beste de gehele bestudeerde populatie vertegenwoordigt.
- Bij gestratificeerde willekeurige steekproeven wordt de gehele populatie opgedeeld in homogene groepen die strata worden genoemd.
- Gestratificeerde willekeurige steekproeven verschillen van eenvoudige willekeurige steekproeven, waarbij willekeurige gegevens uit een hele populatie worden geselecteerd, zodat de kans even groot is dat elke mogelijke steekproef voorkomt.
Hoe gestratificeerde willekeurige steekproeven werken
Bij het voltooien van een analyse of onderzoek naar een groep entiteiten met vergelijkbare kenmerken, kan een onderzoeker ontdekken dat de populatiegrootte te groot is om onderzoek te voltooien. Om tijd en geld te besparen, kan een analist een meer haalbare aanpak volgen door een kleine groep uit de populatie te selecteren. De kleine groep wordt een steekproefomvang genoemd, een subset van de populatie die wordt gebruikt om de hele populatie te vertegenwoordigen. Een steekproef kan op een aantal manieren uit een populatie worden geselecteerd, waaronder de gestratificeerde willekeurige steekproefmethode.
Een gestratificeerde willekeurige steekproef omvat het verdelen van de gehele populatie in homogene groepen die strata worden genoemd (meervoud voor stratum). Uit elk stratum worden vervolgens willekeurige monsters geselecteerd. Denk bijvoorbeeld aan een academische onderzoeker die graag zou willen weten hoeveel MBA-studenten in 2007 binnen drie maanden na afstuderen een vacature hebben ontvangen.
Hij zal al snel ontdekken dat er dat jaar bijna 200.000 MBA-afgestudeerden waren. Hij zou kunnen besluiten om willekeurige steekproef van 50.000 afgestudeerden te nemen en een enquête uit te voeren. Sterker nog, hij zou de populatie in strata kunnen verdelen en een willekeurige steekproef uit de strata kunnen nemen. Om dit te doen, zou hij bevolkingsgroepen creëren op basis van geslacht, leeftijdscategorie, ras, land van nationaliteit en loopbaanachtergrond. Een willekeurige steekproef van elk stratum wordt genomen in een getal dat evenredig is met de grootte van het stratum in vergelijking met de populatie. Deze subsets van de strata worden vervolgens samengevoegd om een willekeurige steekproef te vormen.
[Belangrijk: gestratificeerde steekproeven worden gebruikt om verschillen tussen groepen in een populatie te benadrukken, in tegenstelling tot eenvoudige willekeurige steekproeven, waarbij alle leden van een populatie als gelijk worden behandeld, met een gelijke kans om te worden steekproef.]
Voorbeeld van gestratificeerde willekeurige bemonstering
Stel dat een onderzoeksteam de GPA van universiteitsstudenten in de VS wil bepalen. Het onderzoeksteam heeft moeite met het verzamelen van gegevens van alle 21 miljoen studenten; het besluit om een willekeurige steekproef van de bevolking te nemen door 4.000 studenten te gebruiken.
Stel nu dat het team naar de verschillende attributen van de steekproefdeelnemers kijkt en zich afvraagt of er verschillen zijn in GPA’s en majors van studenten. Stel dat er wordt vastgesteld dat 560 studenten Engelse majors zijn, 1135 majors in de wetenschappen, 800 majors in computerwetenschappen, 1090 majors in engineering en 415 majors in wiskunde. Het team wil een proportioneel gestratificeerde willekeurige steekproef gebruiken waarbij het stratum van de steekproef evenredig is met de willekeurige steekproef in de populatie.
Stel dat het team de demografie van universiteitsstudenten in de VS onderzoekt en het percentage vindt van waar studenten in afstuderen: 12% afstudeerrichting Engels, 28% afstudeerrichting wetenschappen, 24% afstudeerrichting informatica, 21% afstudeerrichting techniek en 15% major in wiskunde. Er worden dus vijf strata gemaakt op basis van het gestratificeerde willekeurige steekproefproces.
Het team moet dan bevestigen dat het stratum van de populatie in verhouding staat tot het stratum in de steekproef; ze vinden echter dat de verhoudingen niet gelijk zijn. Het team moet vervolgens 4.000 studenten uit de populatie opnieuw bemonsteren en willekeurig 480 Engelse, 1.120 wetenschappen, 960 informatica, 840 engineering en 600 wiskundestudenten selecteren.
Daarmee heeft het een evenredige gestratificeerde willekeurige steekproef van universiteitsstudenten, wat een betere weergave geeft van de majors van studenten in de VS. De onderzoekers kunnen vervolgens een specifiek stratum markeren, de verschillende studies van Amerikaanse studenten observeren en de verschillende cijferpuntgemiddelden observeren..
Eenvoudige willekeurige versus gestratificeerde willekeurige monsters
Eenvoudige willekeurige steekproeven en gestratificeerde willekeurige steekproeven zijn beide statistische meetinstrumenten. Een eenvoudige willekeurige steekproef wordt gebruikt om de volledige gegevenspopulatie weer te geven. Een gestratificeerde willekeurige steekproef verdeelt de populatie in kleinere groepen, of strata, op basis van gedeelde kenmerken.
De eenvoudige willekeurige steekproef wordt vaak gebruikt wanneer er zeer weinig informatie beschikbaar is over de datapopulatie, wanneer de datapopulatie veel te veel verschillen vertoont om in verschillende subsets te verdelen, of wanneer er maar één duidelijk kenmerk is onder de datapopulatie.
Een snoepbedrijf wil bijvoorbeeld het koopgedrag van zijn klanten bestuderen om de toekomst van zijn productlijn te bepalen. Als er 10.000 klanten zijn, mag het als steekproef 100 van die klanten kiezen. Het kan dan wat het van die 100 klanten vindt, toepassen op de rest van zijn basis. In tegenstelling tot stratificatie, zal het 100 leden puur willekeurig bemonsteren zonder rekening te houden met hun individuele kenmerken.
Evenredige en onevenredige Stratificatie
Gestratificeerde aselecte steekproeven zorgen ervoor dat elke subgroep van een bepaalde populatie voldoende vertegenwoordigd is binnen de gehele steekproefpopulatie van een onderzoeksstudie. Stratificatie kan evenredig of onevenredig zijn. Bij een evenredige gestratificeerde methode is de steekproefomvang van elk stratum evenredig met de populatiegrootte van het stratum.
Als de onderzoeker bijvoorbeeld een steekproef van 50.000 afgestudeerden wil op basis van leeftijdscategorie, wordt de evenredige gestratificeerde willekeurige steekproef verkregen met behulp van deze formule: (steekproefomvang / populatiegrootte) x stratumgrootte. In de onderstaande tabel wordt uitgegaan van een populatiegrootte van 180.000 MBA-afgestudeerden per jaar.
De steekproefomvang voor MBA-afgestudeerden in de leeftijdscategorie van 24 tot 28 jaar wordt berekend als (50.000 / 180.000) x 90.000 = 25.000. Dezelfde methode wordt gebruikt voor de andere leeftijdsgroepen. Nu de steekproefomvang van de strata bekend is, kan de onderzoeker een eenvoudige willekeurige steekproef in elk stratum uitvoeren om zijn deelnemers aan het onderzoek te selecteren. Met andere woorden, 25.000 afgestudeerden uit de leeftijdsgroep van 24-28 zullen willekeurig worden geselecteerd uit de gehele populatie, 16.667 afgestudeerden uit de leeftijdscategorie van 29-33 zullen willekeurig uit de populatie worden geselecteerd, enzovoort.
In een disproportionele gestratificeerde steekproef is de grootte van elk stratum niet evenredig met de grootte in de populatie. De onderzoeker kan besluiten om de helft van de afgestudeerden in de leeftijdsgroep 34-37 jaar en 1/3 van de afgestudeerden in de leeftijdsgroep 29-33 te steekproeven.
Het is belangrijk op te merken dat één persoon niet in meerdere lagen kan passen. Elke entiteit mag maar in één laag passen. Het hebben van overlappende subgroepen betekent dat sommige individuen een grotere kans hebben om voor het onderzoek te worden geselecteerd, wat het concept van gestratificeerde steekproeven als een soort kanssteekproef volledig tenietdoet.
Portefeuillemanagers kunnen gestratificeerde willekeurige steekproeven gebruiken om portefeuilles te creëren door een index zoals een obligatie-index te repliceren.
Voordelen van gestratificeerde willekeurige steekproeven
Het belangrijkste voordeel van gestratificeerde willekeurige steekproeven is dat het de belangrijkste populatiekenmerken in de steekproef vastlegt. Vergelijkbaar met een gewogen gemiddelde, produceert deze steekproefmethode kenmerken in de steekproef die evenredig zijn met de totale populatie. Gestratificeerde willekeurige steekproeven werken goed voor populaties met verschillende kenmerken, maar zijn verder niet effectief als er geen subgroepen kunnen worden gevormd.
Stratificatie geeft een kleinere schattingsfout en een grotere precisie dan de eenvoudige willekeurige steekproefmethode. Hoe groter de verschillen tussen de lagen, hoe groter de winst in precisie.
Nadelen van gestratificeerde willekeurige steekproeven
Helaas kan deze onderzoeksmethode niet in elk onderzoek worden toegepast. Het nadeel van de methode is dat aan een aantal voorwaarden moet worden voldaan om deze goed te kunnen gebruiken. Onderzoekers moeten elk lid van een bestudeerde populatie identificeren en elk van hen indelen in één en slechts één subpopulatie. Als gevolg hiervan is gestratificeerde willekeurige steekproeven nadelig wanneer onderzoekers niet met vertrouwen elk lid van de populatie in een subgroep kunnen indelen. Het kan ook een uitdaging zijn om een volledige en definitieve lijst van een hele populatie te vinden.
Overlapping kan een probleem zijn als er onderwerpen zijn die in meerdere subgroepen vallen. Wanneer een eenvoudige willekeurige steekproef wordt uitgevoerd, is de kans groter dat degenen die zich in meerdere subgroepen bevinden, worden gekozen. Het resultaat kan een verkeerde voorstelling van zaken of een onnauwkeurige weergave van de populatie zijn.
De bovenstaande voorbeelden maken het gemakkelijk: niet-gegradueerden, afgestudeerden, mannen en vrouwen zijn duidelijk gedefinieerde groepen. In andere situaties kan het echter veel moeilijker zijn. Stel je voor dat je kenmerken opneemt zoals ras, etniciteit of religie. Het sorteerproces wordt moeilijker, waardoor gestratificeerde willekeurige steekproeven een ondoelmatige en minder dan ideale methode worden.