Chi-Square (χ2) Statistische definitie
Wat is een Chi-Square-statistiek?
Een chikwadraat ( χ 2 ) statistiek is een test die meet hoe een model zich verhoudt tot werkelijk geobserveerde gegevens. De berekening a chi-kwadraat data statistiek moeten willekeurige, ruw, zijn onderling uitsluitend, verkregen uit onafhankelijke variabelen en getrokken uit een voldoende groot monster. De resultaten van het opgooien van een eerlijke munt voldoen bijvoorbeeld aan deze criteria.
Chi-kwadraattoetsen worden vaak gebruikt bij het testen van hypothesen. De chikwadraatstatistiek vergelijkt de grootte van eventuele discrepanties tussen de verwachte resultaten en de werkelijke resultaten, gegeven de grootte van de steekproef en het aantal variabelen in de relatie. Voor deze tests worden vrijheidsgraden gebruikt om te bepalen of een bepaalde nulhypothese kan worden verworpen op basis van het totale aantal variabelen en steekproeven binnen het experiment. Zoals bij elke statistiek geldt: hoe groter de steekproefomvang, hoe betrouwbaarder de resultaten.
Belangrijkste leerpunten
- Een chikwadraattatistiek ( stat 2 ) is een maat voor het verschil tussen de waargenomen en verwachte frequenties van de uitkomsten van een reeks gebeurtenissen of variabelen.
- χ 2 hangt af van de grootte van het verschil tussen werkelijke en waargenomen waarden, de vrijheidsgraden en de grootte van de steekproef.
- χ 2 kan worden gebruikt om te testen of twee variabelen gerelateerd of onafhankelijk van elkaar zijn of om de goedheid van overeenstemming tussen een waargenomen verdeling en een theoretische verdeling van frequenties te testen.
De formule voor Chi-Square is
Wat zegt een Chi-Square-statistiek u?
Er zijn twee hoofdtypen chikwadraattesten: de onafhankelijkheidstest, die een kwestie van relatie stelt, zoals: “Is er een verband tussen het geslacht van de student en de studiekeuze?”; en de goodness-of-fit test, die iets vraagt als “Hoe goed past de munt in mijn hand bij een theoretisch eerlijke munt?”
Onafhankelijkheid
Bij het overwegen van het geslacht van de student en de cursuskeuze, zou een χ 2- test voor onafhankelijkheid kunnen worden gebruikt. Om deze test te doen, zou de onderzoeker gegevens verzamelen over de twee gekozen variabelen (geslacht en gekozen cursussen) en vervolgens de frequenties vergelijken waarop mannelijke en vrouwelijke studenten selecteren uit de aangeboden lessen met behulp van de bovenstaande formule en een statistische tabel van χ 2.
Als er geen verband is tussen geslacht en cursuskeuze (dat wil zeggen, als ze onafhankelijk zijn), dan moet worden verwacht dat de feitelijke frequentie waarmee mannelijke en vrouwelijke studenten elke aangeboden cursus selecteren ongeveer gelijk is, of omgekeerd, het aandeel mannelijke en vrouwelijke studenten. vrouwelijke studenten in een geselecteerde cursus moeten ongeveer gelijk zijn aan het aandeel mannelijke en vrouwelijke studenten in de steekproef. Een χ 2- test voor onafhankelijkheid kan ons vertellen hoe waarschijnlijk het is dat willekeurige toeval elk waargenomen verschil tussen de werkelijke frequenties in de gegevens en deze theoretische verwachtingen kan verklaren.
Goodness-of-Fit
χ 2 biedt een manier om te testen hoe goed een steekproef van gegevens overeenkomt met de (bekende of veronderstelde) kenmerken van de grotere populatie die de steekproef beoogt te vertegenwoordigen. Als de steekproefgegevens niet passen bij de verwachte eigenschappen van de populatie waarin we geïnteresseerd zijn, dan zouden we deze steekproef niet willen gebruiken om conclusies te trekken over de grotere populatie.
Denk bijvoorbeeld aan een denkbeeldige munt met precies 50/50 kans om kop of munt te landen en een echte munt die je 100 keer opgooit. Als deze echte munt een is eerlijk, dan heeft hij ook een gelijke kans om aan beide kanten te landen, en het verwachte resultaat van het 100 keer gooien van de munt is dat kop 50 keer omhoog komt en munt 50 keer. In dit geval kan χ 2 ons vertellen hoe goed de werkelijke resultaten van 100 coinflips zich verhouden tot het theoretische model dat een eerlijke munt 50/50 resultaten zal opleveren. De daadwerkelijke worp kan oplopen tot 50/50, of 60/40, of zelfs 90/10. Hoe verder weg de feitelijke resultaten van de 100 worpen van 50/50 zijn, hoe minder goed de match van deze set worpen is voor de theoretische verwachting van 50/50 en hoe waarschijnlijker het is dat we kunnen concluderen dat deze munt eigenlijk niet eerlijk is. munt.