T-test - KamilTaylan.blog
25 juni 2021 1:18

T-test

Wat is een T-test?

Een t-toets is een soort inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die verband kunnen houden met bepaalde kenmerken. Het wordt meestal gebruikt wanneer de datasets, zoals de dataset die is geregistreerd als het resultaat van het 100 keer omdraaien van een munt, een normale verdeling zouden volgen en mogelijk onbekende varianties hebben. Een t-toets wordt gebruikt als hulpmiddel voor het testen van hypothesen, waarmee een aanname kan worden getoetst die van toepassing is op een populatie. 

Een t-toets kijkt naar de t-statistiek, de t-verdelingswaarden en de vrijheidsgraden om de statistische significantie te bepalen. Om een ​​test met drie of meer middelen uit te voeren, moet men een  variantieanalyse gebruiken.

Belangrijkste leerpunten

  • Een t-toets is een soort inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die verband kunnen houden met bepaalde kenmerken.
  • De t-toets is een van de vele tests die worden gebruikt voor het testen van hypothesen in statistieken.
  • Voor het berekenen van een t-toets zijn drie belangrijke gegevenswaarden nodig. Ze omvatten het verschil tussen de gemiddelde waarden van elke gegevensset (het gemiddelde verschil genoemd), de standaarddeviatie van elke groep en het aantal gegevenswaarden van elke groep.
  • Er zijn verschillende soorten t-tests die kunnen worden uitgevoerd, afhankelijk van de gegevens en het type analyse dat nodig is.

De T-test uitleggen

In wezen stelt een t-test ons in staat om de gemiddelde waarden van de twee datasets te vergelijken en te bepalen of ze uit dezelfde populatie kwamen. Als we in de bovenstaande voorbeelden een steekproef zouden nemen van leerlingen uit klas A en een andere steekproef van leerlingen uit klas B, zouden we niet verwachten dat ze exact dezelfde gemiddelde en standaarddeviatie zouden hebben. Evenzo moeten monsters die zijn genomen uit de met placebo gevoede controlegroep en die uit de groep die het geneesmiddel is voorgeschreven, een iets andere gemiddelde en standaardafwijking hebben.

Wiskundig gezien neemt de t-toets een steekproef uit elk van de twee sets en stelt de probleemstelling vast door een nulhypothese aan te nemen dat de twee gemiddelden gelijk zijn. Op basis van de toepasselijke formules worden bepaalde waarden berekend en vergeleken met de standaardwaarden, en de veronderstelde nulhypothese wordt dienovereenkomstig geaccepteerd of verworpen.

Als de nulhypothese kwalificeert om te worden verworpen, geeft dit aan dat de gegevensuitlezingen sterk zijn en waarschijnlijk niet aan toeval zijn toe te schrijven. De t-test is slechts een van de vele tests die hiervoor worden gebruikt. Statistici moeten bovendien andere tests dan de t-test gebruiken om meer variabelen en tests met grotere steekproefomvang te onderzoeken. Voor een grote steekproef gebruiken statistici een  z-toets. Andere testopties zijn de chikwadraattest en de f-test.

Er zijn drie soorten t-tests en ze worden gecategoriseerd als afhankelijke en onafhankelijke t-tests.

Dubbelzinnige testresultaten

Bedenk dat een medicijnfabrikant een nieuw uitgevonden medicijn wil testen. Het volgt de standaardprocedure om het medicijn bij de ene groep patiënten uit te proberen en een placebo aan een andere groep te geven, de controlegroep. De placebo die aan de controlegroep wordt gegeven, is een stof zonder beoogde therapeutische waarde en dient als maatstaf om te meten hoe de andere groep, die het eigenlijke medicijn krijgt, reageert.

Na de medicijnstudie rapporteerden de leden van de met placebo gevoede controlegroep een toename van de gemiddelde levensverwachting van drie jaar, terwijl de leden van de groep die het nieuwe medicijn voorgeschreven kregen een toename van de gemiddelde levensverwachting van vier jaar rapporteerden. Onmiddellijke observatie kan erop wijzen dat het medicijn inderdaad werkt, aangezien de resultaten beter zijn voor de groep die het medicijn gebruikt. Het is echter ook mogelijk dat de waarneming het gevolg is van een toevallige gebeurtenis, vooral een verrassend stukje geluk. Een t-toets is nuttig om te concluderen of de resultaten daadwerkelijk correct zijn en van toepassing op de gehele populatie.

Op een school scoorden 100 leerlingen in klas A gemiddeld 85% met een standaarddeviatie van 3%. Nog eens 100 leerlingen behorend tot klas B scoorden gemiddeld 87% met een standaarddeviatie van 4%. Hoewel het gemiddelde van klas B beter is dan dat van klas A, is het misschien niet juist om tot de conclusie te komen dat de algehele prestaties van leerlingen in klas B beter zijn dan die van leerlingen in klas A. Dit komt doordat er natuurlijke variabiliteit is. in de testscores in beide klassen, dus het verschil kan alleen aan toeval te wijten zijn. Een t-toets kan helpen om te bepalen of de ene klas het beter deed dan de andere.

Aannames van de T-test

  1. De eerste aanname bij t-testen betreft de meetschaal. De aanname voor een t-test is dat de meetschaal die wordt toegepast op de verzamelde gegevens een continue of ordinale schaal volgt, zoals de scores voor een IQ-test.
  2. De tweede veronderstelling is die van een eenvoudige willekeurige steekproef, dat de gegevens worden verzameld uit een representatief, willekeurig geselecteerd deel van de totale populatie.
  3. De derde veronderstelling is dat de gegevens, wanneer ze zijn geplot, resulteren in een normale, klokvormige verdelingskromme.
  4. De laatste aanname is de homogeniteit van variantie. Homogene of gelijke variantie bestaat wanneer de standaarddeviaties van steekproeven ongeveer gelijk zijn.

T-testen berekenen

Voor het berekenen van een t-toets zijn drie belangrijke gegevenswaarden nodig. Ze omvatten het verschil tussen de gemiddelde waarden van elke gegevensset (het gemiddelde verschil genoemd), de standaarddeviatie van elke groep en het aantal gegevenswaarden van elke groep.

De uitkomst van de t-toets levert de t-waarde op. Deze berekende t-waarde wordt vervolgens vergeleken met een waarde die is verkregen uit een kritische waardetabel (de zogenaamde T-distributietabel ). Deze vergelijking helpt om het effect van alleen kans op het verschil te bepalen, en of het verschil buiten dat kansbereik valt. De t-toets vraagt ​​zich af of het verschil tussen de groepen een echt verschil in het onderzoek vertegenwoordigt of dat het mogelijk een zinloos willekeurig verschil is.

T-distributietabellen

De T-verdeeltafel is verkrijgbaar in eenzijdige en tweezijdige formaten. De eerste wordt gebruikt voor het beoordelen van gevallen met een vaste waarde of bereik met een duidelijke richting (positief of negatief). Wat is bijvoorbeeld de kans dat de outputwaarde onder de -3 blijft, of meer dan zeven krijgt bij het gooien van een paar dobbelstenen? Dit laatste wordt gebruikt voor analyse van bereikgebonden, zoals vragen of de coördinaten tussen -2 en +2 vallen.

De berekeningen kunnen worden uitgevoerd met standaard softwareprogramma’s die de nodige statistische functies ondersteunen, zoals die in MS Excel.

T-waarden en vrijheidsgraden

De t-test levert twee waarden op als output: t-waarde en vrijheidsgraden. De t-waarde is een verhouding van het verschil tussen het gemiddelde van de twee sample sets en de variatie die binnen de sample sets bestaat. Hoewel de tellerwaarde (het verschil tussen het gemiddelde van de twee sample sets) eenvoudig te berekenen is, kan de noemer (de variatie die binnen de sample sets bestaat) een beetje gecompliceerd worden, afhankelijk van het type datawaarden dat erbij betrokken is. De noemer van de ratio is een maat voor de spreiding of variabiliteit. Hogere waarden van de t-waarde, ook wel t-score genoemd, geven aan dat er een groot verschil bestaat tussen de twee sample sets. Hoe kleiner de t-waarde, hoe meer overeenkomst er bestaat tussen de twee sample sets.

  • Een grote t-score geeft aan dat de groepen verschillend zijn.
  • Een kleine t-score geeft aan dat de groepen vergelijkbaar zijn.

Vrijheidsgraden verwijst naar de waarden in een studie die de vrijheid heeft om te variëren en die essentieel zijn voor het beoordelen van het belang en de validiteit van de nulhypothese. De berekening van deze waarden hangt meestal af van het aantal gegevensrecords dat beschikbaar is in de voorbeeldset.

Gecorreleerde (of gepaarde) T-test

De gecorreleerde t-test wordt uitgevoerd wanneer de monsters doorgaans bestaan ​​uit overeenkomende paren van vergelijkbare eenheden, of wanneer er gevallen zijn van herhaalde metingen. Het kan bijvoorbeeld voorkomen dat dezelfde patiënten herhaaldelijk worden getest – voor en na een bepaalde behandeling. In dergelijke gevallen wordt elke patiënt als controlemonster tegen zichzelf gebruikt.

Deze methode is ook van toepassing op gevallen waarin de monsters op de een of andere manier met elkaar verband houden of overeenkomende kenmerken hebben, zoals een vergelijkende analyse met kinderen, ouders of broers en zussen. Gecorreleerde of gepaarde t-tests zijn van een afhankelijk type, aangezien het hierbij gaat om gevallen waarin de twee sets monsters gerelateerd zijn.

De formule voor het berekenen van de t-waarde en vrijheidsgraden voor een gepaarde t-toets is:

De overige twee typen behoren tot de onafhankelijke t-toetsen. De samples van deze typen worden onafhankelijk van elkaar geselecteerd – dat wil zeggen dat de datasets in de twee groepen niet naar dezelfde waarden verwijzen. Ze omvatten gevallen zoals een groep van 100 patiënten die wordt opgesplitst in twee sets van elk 50 patiënten. Een van de groepen wordt de controlegroep en krijgt een placebo, terwijl de andere groep de voorgeschreven behandeling krijgt. Dit vormt twee onafhankelijke steekproefgroepen die niet met elkaar zijn gepaard.

Gelijke variantie (of gepoolde) T-test

De t-test met gelijke variantie wordt gebruikt als het aantal monsters in elke groep hetzelfde is, of als de variantie van de twee gegevenssets vergelijkbaar is. De volgende formule wordt gebruikt voor het berekenen van de t-waarde en vrijheidsgraden voor de t-test met gelijke variantie:

T-value=meeenn1-meeenn2(n1-1)