Graden van vrijheid
Wat zijn vrijheidsgraden?
Vrijheidsgraden verwijst naar het maximale aantal logisch onafhankelijke waarden, dit zijn waarden die de vrijheid hebben om te variëren, in het gegevensmonster.
Belangrijkste leerpunten
- Vrijheidsgraden verwijst naar het maximale aantal logisch onafhankelijke waarden, dit zijn waarden die de vrijheid hebben om te variëren, in het gegevensmonster.
- Vrijheidsgraden worden vaak besproken in relatie tot verschillende vormen van hypothesetesten in statistieken, zoals een Chi-Square.
- Het berekenen van vrijheidsgraden is van cruciaal belang om het belang van een Chi-Square-statistiek en de geldigheid van de nulhypothese te begrijpen.
Inzicht in graden van vrijheid
De gemakkelijkste manier om Degrees of Freedom conceptueel te begrijpen, is door middel van een voorbeeld:
- Beschouw een datamonster dat voor de eenvoud uit vijf positieve gehele getallen bestaat. De waarden kunnen elk getal zijn zonder bekende relatie tussen hen. Dit gegevensmonster zou theoretisch vijf vrijheidsgraden hebben.
- Vier van de getallen in de steekproef zijn {3, 8, 5 en 4} en het gemiddelde van de volledige gegevenssteekproef blijkt 6 te zijn.
- Dit moet betekenen dat het vijfde getal 10 moet zijn. Het kan niets anders zijn. Het heeft niet de vrijheid om te variëren.
- Dus de vrijheidsgraden voor dit gegevensvoorbeeld is 4.
De formule voor vrijheidsgraden is gelijk aan de grootte van het gegevensmonster min één:
Vrijheidsgraden worden vaak besproken in relatie tot verschillende vormen van hypothesetesten in statistieken, zoals een Chi-Square. Het is essentieel om vrijheidsgraden te berekenen om het belang van een Chi-Square-statistiek en de geldigheid van de nulhypothese te begrijpen.
Chi-Square-tests
Er zijn twee verschillende soorten Chi-Square-tests : de onafhankelijkheidstest, die een kwestie van relatie stelt, zoals: “Is er een verband tussen geslacht en SAT-scores?”; en de ‘ goodness-of-fit’-test, die zoiets vraagt als “Als een munt 100 keer wordt gegooid, komt het dan 50 keer met kop en 50 keer munt?’
Voor deze tests worden vrijheidsgraden gebruikt om te bepalen of een bepaalde nulhypothese kan worden verworpen op basis van het totale aantal variabelen en steekproeven binnen het experiment. Wanneer bijvoorbeeld studenten en cursuskeuze worden overwogen, is een steekproefomvang van 30 of 40 studenten waarschijnlijk niet groot genoeg om significante gegevens te genereren. Het is meer geldig om dezelfde of vergelijkbare resultaten te behalen met een onderzoek met een steekproefomvang van 400 of 500 studenten.
Geschiedenis van de vrijheidsgraden
Het vroegste en meest fundamentele concept van vrijheidsgraden werd opgemerkt in het begin van de 19e eeuw en was verweven met de werken van wiskundige en astronoom Carl Friedrich Gauss. Het moderne gebruik en begrip van de term werden eerst uiteengezet door William Sealy Gosset, een Engelse statisticus, in zijn artikel “The Probable Error of a Mean”, gepubliceerd in Biometrika in 1908 onder een pseudoniem om zijn anonimiteit te bewaren.
In zijn geschriften gebruikte Gosset niet specifiek de term “graden van vrijheid”. Hij gaf echter wel een verklaring voor het concept tijdens de ontwikkeling van wat uiteindelijk bekend zou worden als Student’s T-distribution. De eigenlijke term werd pas in 1922 populair. De Engelse bioloog en statisticus Ronald Fisher begon de term “Degrees of Freedom” te gebruiken toen hij begon met het publiceren van rapporten en gegevens over zijn werk bij het ontwikkelen van chi-squares.