Wilcoxon-test - KamilTaylan.blog
25 juni 2021 5:34

Wilcoxon-test

Wat is de Wilcoxon-test?

De Wilcoxon-test, die kan verwijzen naar de Rank Sum-test of de Signed Rank-testversie, is een niet-parametrische statistische test die twee gepaarde groepen vergelijkt. De tests berekenen in wezen het verschil tussen sets paren en analyseren deze verschillen om vast te stellen of ze statistisch significant van elkaar verschillen.

Belangrijkste leerpunten

  • De Wilcoxon-test is een niet-parametrische statistische test die twee gepaarde groepen vergelijkt, en wordt geleverd in twee versies: de Rank Sum-test of de Signed Rank-test.
  • Het doel van de test is om te bepalen of twee of meer sets paren op statistisch significante wijze van elkaar verschillen.
  • Beide versies van het model gaan ervan uit dat de paren in de gegevens afkomstig zijn van afhankelijke populaties, dwz dezelfde persoon of aandelenkoers volgen door tijd of plaats.

De basisprincipes van de Wilcoxon-test

De Rank Sum- en Signed Rank-tests werden beide voorgesteld door de Amerikaanse statisticus Frank Wilcoxon in een baanbrekend onderzoeksdocument dat in 1945 werd gepubliceerd. De tests legden de basis voor het testen van hypothesen van niet- parametrische statistieken, die worden gebruikt voor populatiegegevens die kunnen worden gerangschikt, maar die niet numerieke waarden, zoals klanttevredenheid of muziekrecensies. Niet-parametrische verdelingen hebben geen parameters en kunnen niet worden gedefinieerd door een vergelijking zoals parametrische verdelingen dat wel kunnen.

De soorten vragen die de Wilcoxon-test ons kan helpen beantwoorden, zijn onder meer:

  • Zijn testscores verschillend van leerjaar 5 tot leerjaar 5 voor dezelfde studenten?
  • Heeft een bepaald medicijn een effect op de gezondheid wanneer het op dezelfde individuen wordt getest?

Deze modellen gaan ervan uit dat de gegevens afkomstig zijn van twee gematchte of afhankelijke populaties, die dezelfde persoon of stam door tijd of plaats volgen. De gegevens worden ook verondersteld continu te zijn in plaats van discreet. Omdat het een niet-parametrische test is, is er geen specifieke kansverdeling van de afhankelijke variabele in de analyse vereist.

Versies van de Wilcoxon-test

  • De Wilcoxon Rank Sum-test kan worden gebruikt om de nulhypothese te testen dat twee populaties dezelfde continue distributie hebben. De basisaannames die nodig zijn om deze testmethode te gebruiken, zijn dat de gegevens van dezelfde populatie zijn en gepaard zijn, de gegevens kunnen worden gemeten op ten minste een intervalschaal en dat de gegevens willekeurig en onafhankelijk zijn gekozen.
  • De Wilcoxon Signed Rank-test gaat ervan uit dat er informatie is in de grootte en tekenen van de verschillen tussen gepaarde waarnemingen. Als het niet- parametrische equivalent van de t-toets van de gepaarde student, kan de ondertekende rangschikking worden gebruikt als alternatief voor de t-toets wanneer de populatiegegevens geen normale verdeling volgen.

Berekening van een Wilcoxon-teststatistiek

De stappen om te komen tot een Wilcoxon Signed-Ranks Test Statistic, W, zijn als volgt:

  1. Voor elk punt in een steekproef van n items, krijgen een verschilscore D i tussen twee metingen (bijv aftrekken van elkaar).
  2. Negeer dan positieve of negatieve tekens en verkrijg een reeks van n absolute verschillen | D i |.
  3. Laat verschilscores van nul weg, waardoor u een set van n niet-nul absolute verschilscores krijgt, waarbij n ‘≤ n. Zo wordt n ‘ de werkelijke steekproefomvang.
  4. Wijs vervolgens de rangen R i van 1 tot n toe aan elk van de | D i | zodanig dat de kleinste absolute verschilscore rang 1 krijgt en de grootste rang n. Als er twee of meer | D i | gelijk zijn, krijgen ze elk de gemiddelde rang van de rangen toegewezen die ze afzonderlijk zouden hebben gekregen als er geen banden in de gegevens waren opgetreden.
  5. Wijs nu het symbool “+” of “-” toe aan elk van de n rangen R i, afhankelijk van of Di oorspronkelijk positief of negatief was.
  6. De Wilcoxon-teststatistiek W wordt vervolgens verkregen als de som van de positieve rangen.

In de praktijk kan deze test eenvoudig worden uitgevoerd met behulp van statistische analysesoftware of een spreadsheet.