Tweezijdige test
Wat is een tweezijdige test?
In de statistiek is een tweezijdige test een methode waarbij het kritieke gebied van een distributie tweezijdig is en test of een steekproef groter of kleiner is dan een bepaald bereik van waarden. Het wordt gebruikt bij het testen van nulhypothesen en testen op statistische significantie. Als de geteste steekproef in een van de kritieke gebieden valt, wordt de alternatieve hypothese geaccepteerd in plaats van de nulhypothese.
Belangrijkste leerpunten
- In de statistiek is een tweezijdige test een methode waarbij het kritieke gebied van een distributie tweezijdig is en test of een steekproef groter of kleiner is dan een reeks waarden.
- Het wordt gebruikt bij het testen van nulhypothesen en testen op statistische significantie.
- Als de geteste steekproef in een van de kritieke gebieden valt, wordt de alternatieve hypothese geaccepteerd in plaats van de nulhypothese.
- Volgens afspraak worden tweezijdige tests gebruikt om de significantie te bepalen op het 5% -niveau, wat betekent dat elke kant van de verdeling wordt verlaagd met 2,5%.
Een tweezijdige test begrijpen
Een basisconcept van inferentiële statistieken is het testen van hypothesen, waarmee wordt bepaald of een bewering waar is of niet, gegeven een populatieparameter. Een hypothesetest die is ontworpen om aan te tonen of het gemiddelde van een steekproef significant groter en significant kleiner is dan het gemiddelde van een populatie, wordt een tweezijdige test genoemd. De tweezijdige test dankt zijn naam aan het testen van het gebied onder beide staarten van een normale verdeling, hoewel de test kan worden gebruikt in andere niet-normale distributies.
Een tweezijdige test is ontworpen om beide zijden van een gespecificeerd gegevensbereik te onderzoeken, zoals aangegeven door de betrokken kansverdeling. De kansverdeling moet de waarschijnlijkheid van een gespecificeerde uitkomst weergeven op basis van vooraf bepaalde normen. Dit vereist de instelling van een limiet die de hoogste (of bovenste) en laagste (of onderste) geaccepteerde variabele waarden binnen het bereik aanduidt. Elk gegevenspunt dat boven de bovengrens of onder de ondergrens bestaat, wordt beschouwd als buiten het acceptatiebereik en in een gebied dat het afkeurbereik wordt genoemd.
Er is geen inherente norm met betrekking tot het aantal datapunten dat binnen het acceptatiebereik moet bestaan. In gevallen waar precisie vereist is, zoals bij het maken van farmaceutische geneesmiddelen, kan een afwijzingspercentage van 0,001% of minder worden ingesteld. In gevallen waar precisie minder kritisch is, zoals het aantal etenswaren in een productzak, kan een afkeurpercentage van 5% geschikt zijn.
Willekeurige bemonstering
Een tweezijdige test kan ook praktisch worden gebruikt tijdens bepaalde productieactiviteiten in een bedrijf, zoals bij de productie en verpakking van snoep in een bepaalde faciliteit. Als de productiefaciliteit 50 snoepjes per zak als doel aanwijst, met een acceptabele verdeling van 45 tot 55 snoepjes, wordt elke zak die wordt gevonden met een hoeveelheid van minder dan 45 of meer dan 55 beschouwd als binnen het afkeurbereik.
Om te bevestigen dat de verpakkingsmechanismen correct zijn gekalibreerd om aan de verwachte output te voldoen, kan een willekeurige steekproef worden genomen om de nauwkeurigheid te bevestigen. Een eenvoudige willekeurige steekproef neemt een klein, willekeurig deel van de gehele populatie om de volledige gegevensset weer te geven, waarbij elk lid een gelijke kans heeft om gekozen te worden.
Om de verpakkingsmechanismen als nauwkeurig te beschouwen, is gemiddeld 50 snoepjes per zak met een geschikte verdeling gewenst. Bovendien moet het aantal zakken dat binnen het afkeurbereik valt, binnen de kansverdelingsgrens vallen die als een acceptabel foutenpercentage wordt beschouwd. Hier zou de nulhypothese zijn dat het gemiddelde 50 is, terwijl de alternatieve hypothese zou zijn dat het niet 50 is.
Als na het uitvoeren van de tweezijdige test de z-score in het afwijzingsgebied valt, waardoor de afwijking te ver van het gewenste gemiddelde ligt, kan het nodig zijn de faciliteit of bijbehorende apparatuur aan te passen om de fout te corrigeren. Regelmatig gebruik van tweezijdige testmethoden kan ertoe bijdragen dat de productie op lange termijn binnen de perken blijft.
Let op of een statistische test een- of tweezijdige toets is, aangezien dit de interpretatie van een model sterk zal beïnvloeden.
Tweezijdige Vs. Eenzijdige test
Wanneer een hypothesetest wordt opgezet om aan te tonen dat het steekproefgemiddelde hoger of lager zou zijn dan het populatiegemiddelde, wordt dit een eenzijdige test genoemd. De eenzijdige test dankt zijn naam aan het testen van het gebied onder een van de staarten (zijkanten) van een normale verdeling. Bij gebruik van een eenzijdige toets test een analist de mogelijkheid van de relatie in de ene richting van interesse, en negeert hij de mogelijkheid van een relatie in een andere richting volledig.
Als de geteste steekproef in het eenzijdige kritische gebied valt, wordt de alternatieve hypothese geaccepteerd in plaats van de nulhypothese. Een eenzijdige test is ook bekend als een directionele hypothese of directionele test.
Een tweezijdige test daarentegen is bedoeld om beide zijden van een gespecificeerd gegevensbereik te onderzoeken om te testen of een steekproef groter of kleiner is dan het bereik van waarden.
Voorbeeld van een tweezijdige test
Stel u als hypothetisch voorbeeld voor dat een nieuwe effectenmakelaar (XYZ) beweert dat zijn makelaarskosten lager zijn dan die van uw huidige effectenmakelaar (ABC). Gegevens die beschikbaar zijn van een onafhankelijk onderzoeksbureau geven aan dat de gemiddelde en standaarddeviatie van alle ABC-makelaarsklanten respectievelijk $ 18 en $ 6 bedragen.
Er wordt een steekproef van 100 klanten van ABC genomen en de bemiddelingskosten worden berekend met de nieuwe tarieven van XYZ-makelaar. Als het gemiddelde van de steekproef $ 18,75 is en de standaarddeviatie van de steekproef $ 6, kan er dan enige conclusie worden getrokken over het verschil in de gemiddelde bemiddelingsrekening tussen ABC- en XYZ-makelaar?
- H 0 : nulhypothese: gemiddelde = 18
- H 1 : Alternatieve hypothese: gemiddelde 18 (dit is wat we willen bewijzen.)
- Afwijzingsgebied: Z = Z 2,5 (uitgaande van 5% significantieniveau, opgesplitst 2,5 elk aan beide zijden).
- Z = (steekproefgemiddelde – gemiddelde) / (std-dev / sqrt (aantal steekproeven)) = (18,75 – 18) / (6 / (sqrt (100)) = 1,25
Deze berekende Z-waarde valt tussen de twee limieten gedefinieerd door: – Z 2,5 = -1,96 en Z 2,5 = 1,96.
Hieruit wordt geconcludeerd dat er onvoldoende bewijs is om te concluderen dat er een verschil is tussen de tarieven van uw bestaande makelaar en de nieuwe makelaar. Daarom kan de nulhypothese niet worden verworpen. Als alternatief leidt de p-waarde = P (Z 1,25) = 2 * 0,1056 = 0,2112 = 21,12%, wat groter is dan 0,05 of 5%, tot dezelfde conclusie.
Veel Gestelde Vragen
Hoe wordt een tweezijdige test ontworpen?
Een tweezijdige test is bedoeld om te bepalen of een claim waar is of niet, gegeven een populatieparameter. Het onderzoekt beide zijden van een gespecificeerd gegevensbereik zoals aangegeven door de betrokken kansverdeling. Als zodanig moet de kansverdeling de waarschijnlijkheid vertegenwoordigen van een gespecificeerd resultaat op basis van vooraf bepaalde normen. Dit vereist de instelling van een limiet die de hoogste (of bovenste) en laagste (of onderste) geaccepteerde variabele waarden binnen het bereik aanduidt. Elk gegevenspunt dat boven de bovengrens of onder de ondergrens bestaat, wordt beschouwd als buiten het acceptatiebereik en de claim wordt afgewezen.
Wat is het verschil tussen een tweezijdige en eenzijdige test?
Een tweezijdige hypothesetest is bedoeld om aan te tonen of het steekproefgemiddelde significant groter en significant kleiner is dan het gemiddelde van een populatie. De tweezijdige test dankt zijn naam aan het testen van het gebied onder beide staarten (zijkanten) van een normale verdeling. Aan de andere kant wordt een eenzijdige hypothesetest opgezet om aan te tonen dat het steekproefgemiddelde hoger of lager zou zijn dan het populatiegemiddelde. De eenzijdige test dankt zijn naam aan het testen van het gebied onder een van de staarten van een normale verdeling.
Wat is een Z-score?
Een Z-score beschrijft numeriek de relatie van een waarde met het gemiddelde van een groep waarden en wordt gemeten in termen van het aantal standaarddeviaties van het gemiddelde. Als een Z-score 0 is, geeft dit aan dat de score van het datapunt identiek is aan de gemiddelde score, terwijl Z-scores van 1,0 en -1,0 waarden zouden aangeven die één standaarddeviatie boven of onder het gemiddelde liggen. In de meeste grote datasets heeft 99% van de waarden een Z-score tussen -3 en 3, wat betekent dat ze binnen drie standaarddeviaties boven en onder het gemiddelde liggen.