24 juni 2021 7:14

Variantieanalyse (ANOVA)

Wat is variantieanalyse (ANOVA)?

Variantieanalyse (ANOVA) is een analysetool die in statistieken wordt gebruikt en die een waargenomen geaggregeerde variabiliteit binnen een gegevensset opsplitst in twee delen: systematische factoren en willekeurige factoren. De systematische factoren hebben een statistische invloed op de gegeven dataset, de willekeurige factoren niet. Analisten gebruiken de ANOVA-test om in een regressiestudie te bepalen welke invloed onafhankelijke variabelen hebben op de afhankelijke variabele.

De t- en z-testmethoden die in de 20e eeuw zijn ontwikkeld, werden gebruikt voor statistische analyse tot 1918, toen Ronald Fisher de variantieanalyse-methode creëerde.1  ANOVA wordt ook wel de Fisher-variantieanalyse genoemd en is de uitbreiding van de t- en z-toetsen. De term werd bekend in 1925, nadat hij in Fisher’s boek “Statistical Methods for Research Workers” was verschenen.  Het werd gebruikt in de experimentele psychologie en later uitgebreid tot onderwerpen die complexer waren.

De formule voor ANOVA is:

Wat onthult de variantieanalyse?

De ANOVA-test is de eerste stap bij het analyseren van factoren die van invloed zijn op een bepaalde dataset. Zodra de test is voltooid, voert een analist aanvullende tests uit op de methodische factoren die meetbaar bijdragen aan de inconsistentie van de dataset. De analist gebruikt de ANOVA-testresultaten in een f-test om aanvullende gegevens te genereren die aansluiten bij de voorgestelde regressiemodellen.

Met de ANOVA-test kunnen meer dan twee groepen tegelijkertijd worden vergeleken om te bepalen of er een relatie tussen hen bestaat. Het resultaat van de ANOVA-formule, de F-statistiek (ook wel de F-ratio genoemd), maakt het mogelijk om meerdere groepen gegevens te analyseren om de variabiliteit tussen steekproeven en binnen steekproeven te bepalen.

Als er geen echt verschil bestaat tussen de geteste groepen, wat de nulhypothese wordt genoemd, zal het resultaat van de F-ratio-statistiek van de ANOVA dicht bij 1 liggen. De verdeling van alle mogelijke waarden van de F-statistiek is de F-verdeling. Dit is eigenlijk een groep verdelingsfuncties, met twee karakteristieke getallen, de noemer vrijheidsgraden en de noemer vrijheidsgraden.

Belangrijkste leerpunten

  • Variantieanalyse, of ANOVA, is een statistische methode die de waargenomen variantie-gegevens scheidt in verschillende componenten om te gebruiken voor aanvullende tests.
  • Een one-way ANOVA wordt gebruikt voor drie of meer groepen gegevens, om informatie te verkrijgen over de relatie tussen de afhankelijke en onafhankelijke variabelen.
  • Als er geen echte variantie bestaat tussen de groepen, moet de F-ratio van de ANOVA dicht bij 1 liggen.

Voorbeeld van het gebruik van ANOVA

Een onderzoeker kan bijvoorbeeld studenten van meerdere hogescholen testen om te zien of studenten van een van de hogescholen consistent beter presteren dan studenten van de andere hogescholen. In een bedrijfsapplicatie kan een R & D-onderzoeker twee verschillende processen voor het maken van een product testen om te zien of het ene proces beter is dan het andere in termen van kostenefficiëntie.

Het type ANOVA-test dat wordt gebruikt, is afhankelijk van een aantal factoren. Het wordt toegepast wanneer gegevens experimenteel moeten zijn. Variantieanalyse wordt gebruikt als er geen toegang is tot statistische software, wat resulteert in het handmatig berekenen van ANOVA. Het is eenvoudig te gebruiken en het meest geschikt voor kleine monsters. Bij veel experimentele ontwerpen moeten de steekproefomvang hetzelfde zijn voor de verschillende combinaties van factorniveaus.

ANOVA is handig voor het testen van drie of meer variabelen. Het is vergelijkbaar met meerdere t-tests met twee steekproeven. Het resulteert echter in minder type I-fouten en is geschikt voor een reeks problemen. ANOVA groepeert verschillen door de gemiddelden van elke groep te vergelijken en omvat het spreiden van de variantie over verschillende bronnen. Het wordt ingezet bij proefpersonen, testgroepen, tussen groepen en binnen groepen.

Eenrichtings-ANOVA versus tweeweg-ANOVA

Er zijn twee hoofdtypen ANOVA: eenrichtings- (of unidirectioneel) en tweerichtingsverkeer. Er zijn ook variaties op ANOVA. MANOVA (multivariate ANOVA) verschilt bijvoorbeeld van ANOVA omdat de eerste test voor meerdere afhankelijke variabelen tegelijkertijd, terwijl de laatste slechts één afhankelijke variabele tegelijk beoordeelt. Eenrichtings- of tweerichtingsverkeer verwijst naar het aantal onafhankelijke variabelen in uw variantieanalyse. Een one-way ANOVA evalueert de impact van een enkele factor op een enkele responsvariabele. Het bepaalt of alle samples hetzelfde zijn. De eenrichtings-ANOVA wordt gebruikt om te bepalen of er statistisch significante verschillen zijn tussen de gemiddelden van drie of meer onafhankelijke (niet-verwante) groepen.

Een tweeweg-ANOVA is een uitbreiding van de eenrichtings-ANOVA. Met een eenrichtingsverkeer heb je één onafhankelijke variabele die van invloed is op een afhankelijke variabele. Met een bidirectionele ANOVA zijn er twee onafhankelijke apparaten. Een tweerichtings-ANOVA stelt een bedrijf bijvoorbeeld in staat om de productiviteit van werknemers te vergelijken op basis van twee onafhankelijke variabelen, zoals salaris en vaardigheden. Het wordt gebruikt om de interactie tussen de twee factoren te observeren en tegelijkertijd het effect van twee factoren te testen.