24 juni 2021 22:32

Kwartiel

Wat is een kwartiel?

Een kwartiel is een statistische term die een indeling van waarnemingen in vier gedefinieerde intervallen beschrijft op basis van de waarden van de gegevens en hoe ze zich verhouden tot de volledige set waarnemingen. 

Inzicht in kwartielen

Om het kwartiel te begrijpen, is het belangrijk om de mediaan te begrijpen   als een  maat voor centrale tendens. De mediaan in statistieken is de middelste waarde van een reeks getallen. Het is het punt waarop precies de helft van de gegevens onder en boven de centrale waarde ligt.

Dus, gegeven een set van 13 getallen, zou de mediaan het zevende getal zijn. De zes cijfers voorafgaand aan deze waarde zijn de laagste cijfers in de gegevens en de zes cijfers na de mediaan zijn de hoogste cijfers in de gegeven dataset. Omdat de mediaan niet wordt beïnvloed door extreme waarden of uitschieters in de verdeling, heeft deze soms de voorkeur boven het  gemiddelde.

De mediaan is een robuuste schatter van de locatie, maar zegt niets over hoe de gegevens aan weerszijden van de waarde worden verspreid of verspreid. Daar komt het kwartiel tussenbeide. Het kwartiel meet de spreiding van waarden boven en onder het gemiddelde door de verdeling in vier groepen te verdelen.

Belangrijkste leerpunten

  • Het kwartiel meet de spreiding van waarden boven en onder het gemiddelde door de verdeling in vier groepen te verdelen.
  • Een kwartiel verdeelt gegevens in drie punten – een onderste kwartiel, mediaan en bovenste kwartiel – om vier groepen van de gegevensset te vormen.
  • Kwartielen worden gebruikt om het interkwartielbereik te berekenen, wat een maat is voor variabiliteit rond de mediaan.

Hoe kwartielen werken

Net zoals de mediaan de gegevens in tweeën deelt zodat 50% van de meting onder de mediaan ligt en 50% erboven, splitst het kwartiel de gegevens op in kwartalen zodat 25% van de metingen kleiner is dan het onderste kwartiel, 50 % is kleiner dan de mediaan en 75% is kleiner dan het bovenste kwartiel.

Een kwartiel verdeelt gegevens in drie punten – een onderste kwartiel, mediaan en bovenste kwartiel – om vier groepen van de gegevensset te vormen. Het onderste kwartiel, of eerste kwartiel, wordt aangeduid als Q1 en is het middelste getal dat valt tussen de kleinste waarde van de dataset en de mediaan. Het tweede kwartiel, Q2, is ook de mediaan. Het bovenste of derde kwartiel, aangeduid als Q3, is het centrale punt dat tussen de mediaan en het hoogste nummer van de verdeling ligt.

Nu kunnen we de vier groepen uit de kwartielen in kaart brengen. De eerste groep waarden bevat het kleinste getal tot Q1; de tweede groep omvat Q1 tot de mediaan; de derde reeks is de mediaan tot Q3; de vierde categorie omvat Q3 tot het hoogste datapunt van de hele set.

Elk kwartiel bevat 25% van de totale waarnemingen. Over het algemeen zijn de gegevens gerangschikt van klein naar groot:

  1. Eerste kwartiel: de laagste 25% van de cijfers
  2. Tweede kwartiel : tussen 25,1% en 50% (tot de mediaan)
  3. Derde kwartiel: 50,1% tot 75% (boven de mediaan)
  4. Vierde kwartiel: de hoogste 25% van de cijfers

Voorbeeld van kwartiel

Stel dat de verdeling van de wiskundescores in een klas van 19 leerlingen in oplopende volgorde is:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Eerst, mark beneden de mediaan, Q2, die in dit geval is de 10 ste waarde: 75.

Q1 is het centrale punt tussen de kleinste score en de mediaan. In dit geval valt Q1 tussen de eerste en vijfde score: 68. [Merk op dat de mediaan ook kan worden meegenomen bij het berekenen van Q1 of Q3 voor een oneven reeks waarden. Als we de mediaan aan weerszijden van het middelpunt bevatten dan Q1 de middenwaarde tussen de eerste en 10 zijn th score, die het gemiddelde is van de vijfde en zesde score-(vijfde zesde +) / 2 = ( 68 + 69) / 2 = 68,5].

Q3 is de middelste waarde tussen Q2 en de hoogste score: 84. [Of als je de mediaan meetelt, Q3 = (82 + 84) / 2 = 83].

Nu we onze kwartielen hebben, laten we hun cijfers interpreteren. Een score van 68 (Q1) de eerste kwartiel en 25 ste  percentiel. 68 is de mediaan van de onderste helft van de score die in de beschikbare gegevens is vastgesteld, dat wil zeggen de mediaan van de scores van 59 tot 75.

Q1 vertelt ons dat 25% van de scores lager is dan 68 en 75% van de klassenscores hoger is. Q2 (de mediaan) is het 50 ste  percentiel en laat zien dat 50% van de scores lager dan 75 en 50% van de scores boven 75. Tenslotte, Q3, de 75 ste percentiel, blijkt dat 25% van de scores groter en 75% zijn kleiner dan 84.

Speciale overwegingen

Als het datapunt voor Q1 verder van de mediaan ligt dan Q3 van de mediaan, dan kunnen we zeggen dat er een grotere spreiding is tussen de kleinere waarden van de dataset dan tussen de grotere waarden. Dezelfde logica is van toepassing als Q3 verder van Q2 verwijderd is dan Q1 van de mediaan.

Als alternatief, als er een even aantal datapunten is, is de mediaan het gemiddelde van de middelste twee getallen. In ons voorbeeld hierboven, als we hadden 20 studenten in plaats van 19, de mediaan van hun scores zullen zijn  rekenkundig gemiddelde  van de 10 ste en 11 ste nummer.

Kwartielen worden gebruikt om het interkwartielbereik te berekenen, wat een maat is voor variabiliteit rond de mediaan. Het interkwartielbereik wordt eenvoudig berekend als het verschil tussen het eerste en derde kwartiel: Q3-Q1. In feite is het het bereik van de middelste helft van de gegevens dat laat zien hoe verspreid de gegevens zijn.

Voor grote datasets heeft Microsoft Excel een QUARTILE-functie om kwartielen te berekenen.