Gewonnen gemiddelde definitie
Wat is het Winsorized-gemiddelde?
Gewonnen gemiddelde is een methode voor het middelen die in eerste instantie de kleinste en grootste waarden vervangt door de waarnemingen die het dichtst bij hen liggen. Dit wordt gedaan om het effect van uitschieters of abnormale extreme waarden of uitschieters op de berekening te beperken. Nadat de waarden zijn vervangen, wordt de rekenkundige gemiddelde formule gebruikt om het winorized gemiddelde te berekenen.
belangrijkste leerpunten
- Het winsorized gemiddelde is een middelingsmethode waarbij de kleinste en grootste waarden van een gegevensset worden vervangen door de waarnemingen die het dichtst bij hen liggen.
- Het verzacht de effecten van uitschieters door ze te vervangen door minder extreme waarden.
- Het winsorized gemiddelde is niet hetzelfde als het getrimde gemiddelde, wat inhoudt dat gegevenspunten worden verwijderd in plaats van ze te vervangen – hoewel de resultaten van de twee meestal dichtbij zijn.
Formule voor het gewonnen gemiddelde
Gewonnen middelen worden op twee manieren uitgedrukt. Een “k n ” winsorized gemiddelde verwijst naar de vervanging van de ‘k’ kleinste en grootste waarnemingen, waarbij ‘k’ een geheel getal is. Een winorized gemiddelde van “X%” houdt in dat een bepaald percentage van de waarden van beide uiteinden van de gegevens wordt vervangen.
Het gewonnen gemiddelde wordt bereikt door de kleinste en grootste gegevenspunten te vervangen, vervolgens alle gegevenspunten op te tellen en de som te delen door het totale aantal gegevenspunten.
Wat zegt het overwonnen gemiddelde u?
Het winsorized gemiddelde is minder gevoelig voor uitschieters omdat het deze kan vervangen door minder extreme waarden. Dat wil zeggen, het is minder vatbaar voor uitschieters ten opzichte van het rekenkundig gemiddelde. Als een verdeling echter vetstaarten heeft, zal het effect van het verwijderen van de hoogste en laagste waarden in de verdeling weinig invloed hebben vanwege de hoge mate van variabiliteit in de verdelingscijfers.
Voorbeeld van het gebruik van Winsorized Mean
Laten we het winsorized gemiddelde berekenen voor de volgende dataset: 1, 5, 7, 8, 9, 10, 34. In dit voorbeeld gaan we ervan uit dat het winsorized gemiddelde in de eerste volgorde staat, waarin we de kleinste en grootste waarden vervangen door hun dichtstbijzijnde waarnemingen.
De dataset ziet er nu als volgt uit: 5, 5, 7, 8, 9, 10, 10. Het nemen van een rekenkundig gemiddelde van de nieuwe set levert een winsorized gemiddelde op van 7,7, of (5 + 5 + 7 + 8 + 9 + 10 + 10) gedeeld door 7. Merk op dat het rekenkundig gemiddelde hoger zou zijn – 10,6. Het winsorized gemiddelde vermindert effectief de invloed van de 34-waarde als uitbijter.
Of overweeg een overwinningsgemiddelde van 20% dat de bovenste 10% en de onderste 10% neemt en deze vervangt door de volgende dichtstbijzijnde waarde. We zullen de volgende dataset winnen: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. De twee kleinste en grootste datapunten – 10% van de 20 datapunten – worden vervangen door hun eerstvolgende dichtstbijzijnde waarde. De nieuwe dataset is dus als volgt: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Het gewonnen gemiddelde is 33,9, of het totaal van de gegevens (678) gedeeld door het totale aantal gegevenspunten (20).
Gewonnen gemiddelde vs. getrimde gemiddelde
Het gewonnen gemiddelde omvat het wijzigen van datapunten, terwijl het getrimde gemiddelde het verwijderen van datapunten omvat. Het is gebruikelijk dat het winsorized gemiddelde en het getrimde gemiddelde dicht bij elkaar liggen of soms in waarde gelijk zijn aan elkaar.
Beperkingen van het Winsorized-gemiddelde
Een groot nadeel van winsorized middelen is dat ze van nature enige vertekening in de dataset introduceren. Door de invloed van uitschieters te verminderen, wordt de analyse aangepast voor een betere analyse, maar wordt ook informatie over de onderliggende data verwijderd.