Beschrijvende statistieken
Wat zijn beschrijvende statistieken?
Beschrijvende statistieken zijn korte beschrijvende coëfficiënten die een gegeven dataset samenvatten, die een weergave kan zijn van de gehele populatie of een steekproef van een populatie. Beschrijvende statistieken worden onderverdeeld in maten van centrale tendens en maten van variabiliteit (spreiding). Metingen van centrale tendens omvatten het gemiddelde, mediaan en modus, terwijl variabiliteitsmetingen kurtosis en scheefheid omvatten.
Belangrijkste leerpunten
- Beschrijvende statistieken geven een samenvatting of beschrijving van de kenmerken van een dataset.
- Beschrijvende statistieken bestaan uit twee basiscategorieën metingen: metingen van centrale tendens en metingen van variabiliteit (of spreiding).
- Metingen van centrale tendens beschrijven het centrum van een gegevensverzameling.
- Maatregelen van variabiliteit of spreiding beschrijven de spreiding van gegevens binnen de set.
Inzicht in beschrijvende statistieken
Kortom, beschrijvende statistieken helpen bij het beschrijven en begrijpen van de kenmerken van een specifieke gegevensset door korte samenvattingen te geven over de steekproef en metingen van de gegevens. De meest bekende soorten beschrijvende statistieken zijn metingen van het midden: het gemiddelde, de mediaan en de modus, die op bijna alle niveaus van wiskunde en statistiek worden gebruikt. Het gemiddelde, of het gemiddelde, wordt berekend door alle cijfers in de dataset bij elkaar op te tellen en vervolgens te delen door het aantal cijfers in de set. De som van de volgende dataset is bijvoorbeeld 20: (2, 3, 4, 5, 6). Het gemiddelde is 4 (20/5). De modus van een dataset is de waarde die het vaakst voorkomt, en de mediaan is het cijfer in het midden van de dataset. Het is het cijfer dat de hogere cijfers scheidt van de lagere cijfers binnen een dataset. Er zijn echter minder vaak voorkomende soorten beschrijvende statistieken die nog steeds erg belangrijk zijn.
Mensen gebruiken beschrijvende statistieken om moeilijk te begrijpen kwantitatieve inzichten uit een grote dataset om te zetten in hapklare beschrijvingen. Het Grade Point Average (GPA) van een student geeft bijvoorbeeld een goed begrip van beschrijvende statistieken. Het idee van een GPA is dat het gegevenspunten van een breed scala aan examens, klassen en cijfers neemt en deze samen middelen om een algemeen inzicht te krijgen in de algehele academische prestaties van een student. De persoonlijke GPA van een student weerspiegelt hun gemiddelde academische prestaties.
Maatregelen van beschrijvende statistieken
Alle beschrijvende statistieken zijn ofwel maatstaven van centrale tendens ofwel maatstaven voor variabiliteit, ook wel bekend als maatstaven voor spreiding. Metingen met een centrale tendens richten zich op de gemiddelde of middelste waarden van gegevenssets, terwijl metingen van variabiliteit zich richten op de verspreiding van gegevens. Deze twee metingen gebruiken grafieken, tabellen en algemene discussies om mensen te helpen de betekenis van de geanalyseerde gegevens te begrijpen.
Maatregelen van centrale tendens beschrijven de middenpositie van een distributie voor een gegevensverzameling. Een persoon analyseert de frequentie van elk datapunt in de distributie en beschrijft het met behulp van het gemiddelde, de mediaan of de modus, waarmee de meest voorkomende patronen van de geanalyseerde dataset worden gemeten.
Maatstaven van variabiliteit, of de maatstaven van spreiding, helpen bij het analyseren van de spreiding van de spreiding voor een set gegevens. Hoewel de metingen van centrale tendens een persoon bijvoorbeeld het gemiddelde van een gegevensverzameling kunnen geven, beschrijft het niet hoe de gegevens binnen de verzameling worden verdeeld. Dus hoewel het gemiddelde van de gegevens 65 van de 100 kan zijn, kunnen er nog steeds gegevenspunten zijn op zowel 1 als 100. Variabiliteitsmetingen helpen dit te communiceren door de vorm en spreiding van de gegevensverzameling te beschrijven. Bereik, kwartielen, absolute afwijking en variantie zijn allemaal voorbeelden van variabiliteitsmetingen.
Beschouw de volgende dataset: 5, 19, 24, 62, 91, 100. Het bereik van die dataset is 95, dat wordt berekend door het laagste getal (5) in de dataset af te trekken van het hoogste getal (100).
Veel Gestelde Vragen
Waarom hebben we statistieken nodig die alleen gegevens beschrijven?
Beschrijvende statistieken worden gebruikt om de kenmerken van een steekproef of gegevensverzameling, zoals het gemiddelde, de standaarddeviatie of de frequentie van een variabele, te beschrijven of samen te vatten. Inferentiële statistieken. Dit soort statistieken kan ons helpen de collectieve eigenschappen van de elementen van een gegevenssteekproef te begrijpen. Deze maatregelen kunnen een idee over de waarschijnlijkheid geeft verdeling, of de totale “vorm” van de gegevens, die kan worden afgebeeld op een grafiek zoals een histogram of dot plot. Als we het steekproefgemiddelde, de variantie en de verdeling van een variabele kennen, kunnen we de wereld om ons heen beter begrijpen.
Wat zijn gemiddelde en standaarddeviatie?
Dit zijn twee veelgebruikte beschrijvende statistieken. Het gemiddelde is het gemiddelde niveau dat in een bepaald stuk gegevens wordt waargenomen, terwijl de standaarddeviatie de variantie beschrijft, of hoe verspreid de gegevens die in die variabele worden waargenomen, rond het gemiddelde zijn verdeeld.
Kunnen beschrijvende statistieken worden gebruikt om gevolgtrekkingen of voorspellingen te doen?
Nee. Hoewel deze beschrijvingen behulpzaam zijn bij het begrijpen van de attributen van gegevens, zijn inferentiële statistische technieken – een aparte tak van statistieken – nodig om te begrijpen hoe variabelen met elkaar interageren in een dataset.