24 juni 2021 14:57

Goodness-of-Fit

Wat is Goodness-Of-Fit?

De goodness-of-fit-test is een statistische hypothesetest om te zien hoe goed steekproefgegevens passen bij een verdeling van een populatie met een normale verdeling. Anders gezegd, deze test laat zien of uw steekproefgegevens de gegevens vertegenwoordigen die u in de werkelijke populatie zou verwachten of dat ze op de een of andere manier scheef zijn. Goodness-of-fit stelt de discrepantie vast tussen de waargenomen waarden en de waarden die in een normaal distributiegeval van het model zouden worden verwacht.

Er zijn meerdere methoden om de goodness of fit te bepalen. Enkele van de meest populaire methoden die in statistieken worden gebruikt, zijn de chikwadraat, de Kolmogorov-Smirnov-test, de Anderson-Darling-test en de Shipiro-Wilk-test.

Belangrijkste leerpunten

  • Goodness-of-fit-tests zijn statistische tests die tot doel hebben te bepalen of een reeks waargenomen waarden overeenkomt met de waarden die onder het toepasselijke model worden verwacht.
  • Er zijn meerdere soorten goodness-of-fit-tests, maar de meest voorkomende is de chikwadraattoets.
  • Chi-kwadraat bepaalt of er een verband bestaat tussen categorische gegevens.
  • De Kolmogorov-Smirnov-test – gebruikt voor grote steekproeven – bepaalt of een steekproef afkomstig is uit een specifieke verdeling van een populatie.
  • Goodness-of-fit-tests kunnen u laten zien of uw steekproefgegevens passen bij een verwachte set gegevens van een populatie met een normale verdeling.

Goodness-Of-Fit begrijpen

Goodness-of-fit-tests zijn statistische methoden die vaak worden gebruikt om conclusies te trekken over waargenomen waarden. Deze tests bepalen hoe de werkelijke waarden gerelateerd zijn aan de voorspelde waarden in een model, en wanneer ze worden gebruikt bij de besluitvorming, kunnen goodness-of-fit-tests helpen toekomstige trends en patronen te voorspellen.

De meest voorkomende goodness-of-fit-test is de chikwadraattest, die doorgaans wordt gebruikt voor discrete distributies. De chikwadraattest wordt uitsluitend gebruikt voor gegevens die in klassen (bakken) zijn geplaatst en vereist voldoende steekproefomvang om nauwkeurige resultaten te produceren.



Goodness-of-fit-tests worden vaak gebruikt om te testen op de normaliteit van residuen of om te bepalen of twee monsters worden verzameld uit identieke distributies.

Soorten Goodness-Of-Fit-tests

Chikwadraattoets

De chikwadraattoets, ook wel de chikwadraattoets voor onafhankelijkheid genoemd, is een inferentiële statistische methode die op basis van een willekeurige steekproef de geldigheid van een bewering over een populatie test. Het geeft echter niet het type of de intensiteit van de relatie aan. Het concludeert bijvoorbeeld niet of de relatie positief of negatief is.



Om in aanmerking te komen voor de chikwadraattoets voor onafhankelijkheid, moeten variabelen elkaar uitsluiten.

Om een ​​chi-kwadraat goodness-of-fit te berekenen, is het nodig om het gewenste alpha-significantieniveau in te stellen (bijv. Als uw betrouwbaarheidsniveau 95% of 0,95 is, dan is de alpha 0,05), identificeer de categorische variabelen test en definieer hypotheseverklaringen over de onderlinge relaties. De nulhypothese stelt dat er geen verband bestaat tussen variabelen, en de alternatieve hypothese gaat ervan uit dat er een verband bestaat. De frequentie van de waargenomen waarden wordt gemeten en vervolgens gebruikt met de verwachte waarden en de vrijheidsgraden om chikwadraat te berekenen. Als het resultaat lager is dan alfa, is de nulhypothese ongeldig, wat aangeeft dat er een verband bestaat tussen de variabelen.

Kolmogorov-Smirnov-test

D=max. hoogte⁡1≤ik≤N(F.(Yik)-ik-1N,ikN-F.(Yik))D = \ max \ limieten_ {1 \ leq i \ leq N} \ bigg (F (Y_i) – \ frac {i-1} {N}, \ frac {i} {N} -F (Y_i) \ bigg)D=1≤ik≤Nmeenx​( F(Yik​)-N

De Kolmogorov-Smirnov-test (ook bekend als de KS-test), vernoemd naar de Russische wiskundigen Andrey Kolmogorov en Nikolai Smirnov, is een statistische methode die bepaalt of een steekproef afkomstig is van een specifieke distributie binnen een populatie. De Kolmogorov-Smirnov-test – aanbevolen voor grote steekproeven (bijv. Ouder dan 2000) – is niet-parametrisch, wat betekent dat deze niet afhankelijk is van enige distributie om geldig te zijn. Het focust Het doel is om de nulhypothese te bewijzen, die de steekproef is van de normale verdeling.

In tegenstelling tot de chikwadraattest is de Kolmogorov-Smirnov-test van toepassing op continue distributies. Net als chikwadraat gebruikt het een nulhypothese en alternatieve hypothese en een alfaniveau van significantie. Null geeft aan dat de gegevens een specifieke verdeling binnen de populatie volgen, en alternatief geeft aan dat de gegevens geen specifieke verdeling binnen de populatie volgden. De alfa wordt gebruikt om de kritische waarde te bepalen die in de test wordt gebruikt.

De berekende teststatistiek, vaak aangeduid als D, bepaalt of de nulhypothese wordt geaccepteerd of verworpen. Als D groter is dan de kritische waarde bij alpha, wordt de nulhypothese verworpen. Als D kleiner is dan de kritische waarde, wordt de nulhypothese geaccepteerd, aangeeft

Shipiro-Wilk-test

De Shipiro-Wilk-test bepaalt of een monster een normale verdeling volgt. Met behulp van een steekproef met één variabele van continue gegevens, controleert de Shipiro-Wilk-test alleen op normaliteit. Het wordt aanbevolen voor kleine steekproeven tot 2000. Net als de andere gebruikt het alfa en vormt het twee hypothesen: nul en alternatief. De nulhypothese stelt dat de steekproef uit de normale verdeling komt, terwijl de alternatieve hypothese stelt dat de steekproef niet uit de normale verdeling komt.

De Shipiro-Wilk-test gebruikt een waarschijnlijkheidsgrafiek die de QQ-plot wordt genoemd. Deze scatterplot geeft visueel twee sets kwantielen weer op de y-as, gerangschikt van klein naar groot. Als elk kwantiel uit dezelfde verdeling kwam, zal de scatterplot een lineaire reeks grafieken weergeven. De Shipiro-Wilk-test gebruikt de QQ-plot om de variantie te schatten. Door QQ Plot-variantie samen met de geschatte variantie van de populatie te gebruiken, kan men bepalen of de steekproef tot een normale verdeling behoort. Als het quotiënt van beide varianties gelijk is aan of dichtbij 1 ligt, kan de nulhypothese worden aanvaard. Indien aanzienlijk lager dan 1, kan het worden afgewezen.

Voorbeeld van een Goodness-of-Fit-test

Een kleine gemeenschapsgymnastiek zou bijvoorbeeld kunnen werken in de veronderstelling dat deze de hoogste opkomst heeft op maandag, dinsdag en zaterdag, de gemiddelde opkomst op woensdag en donderdag, en de laagste opkomst op vrijdag en zondag. Op basis van deze aannames heeft de sportschool elke dag een bepaald aantal personeelsleden in dienst om leden in te checken, faciliteiten schoon te maken, trainingsdiensten aan te bieden en lessen te geven.

De sportschool presteert echter financieel niet goed en de eigenaar wil weten of deze aannames en personeelsbezetting correct zijn. De eigenaar besluit zes weken lang elke dag het aantal sportschoolbezoekers te tellen. Hij kan vervolgens de veronderstelde aanwezigheid van de sportschool vergelijken met de waargenomen aanwezigheid door middel van bijvoorbeeld een chi-square goodness-of-fit test. Met de nieuwe gegevens kan hij bepalen hoe hij de sportschool het beste kan beheren en de winstgevendheid kan verbeteren.

Goodness-of-Fit Veelgestelde vragen

Wat betekent Goodness-of-Fit?

Goodness-of-Fit is een statistische hypothesetest die wordt gebruikt om te zien hoe nauwkeurig geobserveerde gegevens overeenkomen met verwachte gegevens. Goodness-of-Fit-tests kunnen helpen bepalen of een steekproef een normale verdeling volgt, of categorische variabelen gerelateerd zijn, of dat willekeurige steekproeven uit dezelfde verdeling komen.

Waarom is goedheid belangrijk?

Goodness-of-Fit-tests helpen bepalen of de waargenomen gegevens overeenkomen met wat wordt verwacht. Op basis van de uitkomst van de uitgevoerde hypothesetest kunnen beslissingen worden genomen. Een winkelier wil bijvoorbeeld weten welk productaanbod jongeren aanspreekt. De winkelier onderzoekt een willekeurige steekproef van ouderen en jongeren om te bepalen welk product de voorkeur heeft. Met behulp van chikwadraat stellen ze vast dat er met 95% vertrouwen een relatie bestaat tussen product A en jongeren. Op basis van deze resultaten kon worden vastgesteld dat deze steekproef de populatie van jongvolwassenen vertegenwoordigt. Retailmarketeers kunnen dit gebruiken om hun campagnes te hervormen.

Wat is Goodness-of-Fit in de Chi-Square-test?

De chikwadraattoets of er relaties bestaan ​​tussen categorische variabelen en of de steekproef het geheel vertegenwoordigt. Het schat hoe nauwkeurig de waargenomen gegevens overeenkomen met de verwachte gegevens, of hoe goed ze passen.

Hoe voer je de Goodness-of-Fit-test uit?

De Goodness-of-FIt-test bestaat uit verschillende testmethoden. Het doel van de test zal helpen bepalen welke methode moet worden gebruikt. Als het doel bijvoorbeeld is om normaliteit te testen op een relatief kleine steekproef, kan de Shipiro-Wilk-test geschikt zijn. Als je wilt bepalen of een steekproef afkomstig is uit een specifieke distributie binnen een populatie, wordt de Kolmogorov-Smirnov-test gebruikt. Elke test gebruikt zijn eigen unieke formule. Ze hebben echter overeenkomsten, zoals een nulhypothese en significantieniveau.

Het komt neer op

Goodness-of-fit-tests bepalen hoe goed de steekproefgegevens passen bij wat van een populatie wordt verwacht. Uit de voorbeeldgegevens wordt een waargenomen waarde verzameld en vergeleken met de berekende verwachte waarde met behulp van een discrepantiemaatstaf. Er zijn verschillende goodness-of-fit hypothesetests beschikbaar, afhankelijk van de uitkomst die u zoekt.

Het kiezen van de juiste goodness-of-fit-test hangt grotendeels af van wat u wilt weten over een sample en hoe groot de sample is. Als u bijvoorbeeld wilt weten of waargenomen waarden voor categorische gegevens overeenkomen met de verwachte waarden voor categorische gegevens, gebruikt u chikwadraat. Als u wilt weten of een kleine steekproef een normale verdeling volgt, kan de Shipiro-Wilk-test een voordeel zijn. Er zijn veel tests beschikbaar om de goodness-of-fit te bepalen.