Geaggregeerde functie
Wat is een geaggregeerde functie?
Een geaggregeerde functie is een wiskundige berekening met een reeks waarden die resulteert in slechts één enkele waarde die de significantie uitdrukt van de verzamelde gegevens waaruit deze is afgeleid. Aggregatiefuncties worden vaak gebruikt om beschrijvende statistieken af te leiden.
Geaggregeerde functies worden vaak gebruikt in databases, spreadsheets en statistische softwarepakketten die nu gebruikelijk zijn op de werkplek. Geaggregeerde functies worden op grote schaal gebruikt in economie en financiën om sleutelcijfers te geven die de economische gezondheid of marktprestaties vertegenwoordigen.
Belangrijkste leerpunten
- Geaggregeerde functies leveren een enkel getal om een grotere gegevensset weer te geven. De gebruikte nummers kunnen zelf producten zijn van geaggregeerde functies.
- Veel beschrijvende statistieken zijn het resultaat van geaggregeerde functies.
- Economen gebruiken de output van gegevensaggregatie om veranderingen in de tijd in kaart te brengen en toekomstige trends te voorspellen.
- De modellen die op basis van geaggregeerde gegevens zijn gemaakt, kunnen worden gebruikt om beleids- en zakelijke beslissingen te beïnvloeden.
Inzicht in de geaggregeerde functie
De geaggregeerde functie verwijst eenvoudig naar de berekeningen die op een gegevensset worden uitgevoerd om een enkel getal te krijgen dat de onderliggende gegevens nauwkeurig weergeeft. Het gebruik van computers heeft de manier waarop deze berekeningen worden uitgevoerd verbeterd, waardoor geaggregeerde functies zeer snel resultaten kunnen produceren en zelfs wegingen kunnen aanpassen op basis van het vertrouwen dat de gebruiker in de gegevens heeft. Dankzij computers kunnen geaggregeerde functies steeds grotere en complexere datasets aan.
Enkele veel voorkomende verzamelfuncties zijn onder meer:
- Gemiddeld (ook wel rekenkundig gemiddelde genoemd )
- Tellen
- Maximaal
- Minimum
- Bereik
- NaNmean (het gemiddelde negeren van NaN-waarden, ook wel ‘nihil’ of ‘null’ genoemd)
- Mediaan
- Modus
- Som
Geaggregeerde functies in economische modellering
De wiskunde voor geaggregeerde functies kan vrij eenvoudig zijn, zoals het vinden van de gemiddelde groei van het bruto binnenlands product (bbp) voor de VS over de afgelopen 10 jaar. Gegeven een lijst met BBP-cijfers, die zelf een product is van een geaggregeerde functie op een dataset, zou je het verschil van jaar tot jaar vinden en vervolgens de verschillen optellen en delen door 10. De wiskunde is te doen met potlood en papier, maar Stel je voor dat je die berekening probeert uit te voeren voor een dataset met BBP-cijfers voor elk land ter wereld. In dit geval verkort een Excel-sheet de verwerkingstijd aanzienlijk en is een programmatische oplossing zoals modelleersoftware nog beter. Dit type verwerkingskracht heeft economen enorm geholpen bij het uitvoeren van reeksen geaggregeerde functies op enorme datasets.
Econometrie en andere velden binnen de discipline gebruiken dagelijks geaggregeerde functies, en soms herkennen ze dat in de naam van de resulterende figuur. Geaggregeerde vraag en aanbod is een visuele weergave van de resultaten van twee geaggregeerde functies, een uitgevoerd op een productiedataset en een andere op een bestedingsdataset. De geaggregeerde vraagcurve wordt geproduceerd uit een vergelijkbare bestedingsgegevensset en toont het geaggregeerde aantal van de subsets uitgezet over een periode om een curve te produceren die de veranderingen over de tijdreeks weergeeft. Dit type visualisatie of modellering helpt om de huidige toestand van de economie te laten zien en kan worden gebruikt om real-world beleids- en zakelijke beslissingen te nemen.
Geaggregeerde functies in het bedrijfsleven
Het is duidelijk dat er in het bedrijfsleven veel geaggregeerde functies zijn: totale kosten, totaal inkomen, totaal aantal uren, enzovoort. Dat gezegd hebbende, is een van de interessantere manieren waarop de aggregatiefunctie in de financiële sector wordt gebruikt, het modelleren van geaggregeerde risico’s.
risicowaarde. De berekeningen die worden gebruikt om tot deze cijfers te komen, moeten een nauwkeurige weergave zijn van risico’s die zelf waarschijnlijkheden zijn op basis van datasets.
Bij een hoge mate van complexiteit kan een zonnige aanname op de verkeerde plaats het hele model ondermijnen. Dit exacte probleem speelde een rol bij de gevolgen rond de ineenstorting van Lehman Brothers.