Niet-parametrische statistieken - KamilTaylan.blog
24 juni 2021 20:39

Niet-parametrische statistieken

Wat zijn niet-parametrische statistieken?

Niet-parametrische statistiek verwijst naar een statistische methode waarbij niet wordt aangenomen dat de gegevens afkomstig zijn van voorgeschreven modellen die worden bepaald door een klein aantal parameters; voorbeelden van dergelijke modellen zijn onder meer het normale distributiemodel en het lineaire regressiemodel. Niet-parametrische statistieken gebruiken soms gegevens die ordinaal zijn, wat betekent dat ze niet afhankelijk zijn van cijfers, maar eerder van een rangschikking of volgorde van soorten. Een enquête die bijvoorbeeld de voorkeuren van de consument overbrengt, variërend van sympathie tot afkeer, zou als ordinale gegevens worden beschouwd.

Niet-parametrische statistieken omvatten niet-parametrische beschrijvende statistieken, statistische modellen, gevolgtrekkingen en statistische tests. De modelstructuur van niet-parametrische modellen wordt niet a priori gespecificeerd, maar wordt in plaats daarvan bepaald op basis van gegevens. De term niet- parametrisch is niet bedoeld om te impliceren dat dergelijke modellen volledig parameters missen, maar eerder dat het aantal en de aard van de parameters flexibel zijn en niet van tevoren vastgelegd. Een histogram is een voorbeeld van een niet-parametrische schatting van een kansverdeling.

Belangrijkste leerpunten

  • Niet-parametrische statistieken zijn gemakkelijk te gebruiken, maar bieden niet de uiterste nauwkeurigheid van andere statistische modellen.
  • Dit type analyse is vaak het meest geschikt om de volgorde van iets in overweging te nemen, waarbij de resultaten waarschijnlijk hetzelfde zullen blijven als de numerieke gegevens veranderen.

Inzicht in niet-parametrische statistieken

In statistieken omvatten parametrische statistieken parameters zoals het gemiddelde, standaarddeviatie, Pearson-correlatie, variantie, enz. Deze vorm van statistieken gebruikt de waargenomen gegevens om de parameters van de verdeling te schatten. Bij parametrische statistieken wordt er vaak van uitgegaan dat de gegevens afkomstig zijn van een normale verdeling met onbekende parameters μ (populatiegemiddelde) en σ2 (populatievariantie), die vervolgens worden geschat met behulp van het steekproefgemiddelde en de steekproefvariantie.



Niet-parametrische statistieken doen geen veronderstellingen over de steekproefomvang of dat de waargenomen gegevens kwantitatief zijn.

Bij niet-parametrische statistieken wordt er niet van uitgegaan dat gegevens uit een normale verdeling worden gehaald. In plaats daarvan wordt de vorm van de verdeling geschat onder deze vorm van statistische meting. Hoewel er veel situaties zijn waarin een normale verdeling kan worden aangenomen, zijn er ook enkele scenario’s waarin het echte gegevensgenererende proces verre van normaal verdeeld is.

Voorbeelden van niet-parametrische statistieken

Beschouw in het eerste voorbeeld een financieel analist die de Value-at-Risk (VaR) van een investering wil schatten. De analist verzamelt winstgegevens van honderden vergelijkbare beleggingen over een vergelijkbare tijdshorizon. In plaats van aan te nemen dat de inkomsten een normale verdeling volgen, gebruikt ze het histogram om de verdeling niet-parametrisch te schatten. Het 5e percentiel van dit histogram geeft de analist vervolgens een niet-parametrische schatting van VaR.

Neem voor een tweede voorbeeld een andere onderzoeker die wil weten of het gemiddelde aantal uren slaap verband houdt met hoe vaak iemand ziek wordt. Omdat veel mensen zelden of helemaal niet ziek worden, en af ​​en toe anderen veel vaker ziek worden dan de meeste anderen, is de spreiding van de ziektefrequentie duidelijk niet normaal, recht scheef en vatbaar voor uitbijter. Dus in plaats van een methode te gebruiken die uitgaat van een normale verdeling van de ziektefrequentie, zoals bijvoorbeeld gebeurt bij klassieke regressieanalyse, besluit de onderzoeker om een ​​niet-parametrische methode te gebruiken, zoals kwantielregressieanalyse.

Speciale overwegingen

Niet-parametrische statistieken worden gewaardeerd vanwege hun gebruiksgemak. Naarmate de behoefte aan parameters wordt verlicht, worden de gegevens beter toepasbaar op een grotere verscheidenheid aan tests. Dit type statistieken kan worden gebruikt zonder het gemiddelde, de steekproefomvang, de standaarddeviatie of de schatting van andere gerelateerde parameters als die informatie niet beschikbaar is.

Omdat niet-parametrische statistieken minder aannames doen over de voorbeeldgegevens, is de toepassing ervan breder dan parametrische statistieken. In gevallen waarin parametrisch testen geschikter is, zullen niet-parametrische methoden minder efficiënt zijn. Dit komt doordat niet-parametrische statistieken bepaalde informatie negeren die beschikbaar is in de gegevens, in tegenstelling tot parametrische statistieken.