24 juni 2021 8:25

Big data

Wat zijn big data?

Big data verwijst naar de grote, diverse soorten informatie die steeds sneller groeien. Het omvat de hoeveelheid informatie, de snelheid of snelheid waarmee deze wordt gemaakt en verzameld, en de verscheidenheid of reikwijdte van de datapunten die worden bestreken (bekend als de “drie v’s” van big data). Big data is vaak afkomstig van datamining en komt in meerdere formaten aan.

Belangrijkste leerpunten

  • Big data is een grote hoeveelheid uiteenlopende informatie die in steeds grotere hoeveelheden en met een steeds hogere snelheid binnenkomt.
  • Big data kunnen gestructureerd zijn (vaak numeriek, gemakkelijk opgemaakt en opgeslagen) of ongestructureerd (meer vrije vorm, minder kwantificeerbaar).
  • Bijna elke afdeling in een bedrijf kan de bevindingen van big data-analyse gebruiken, maar het omgaan met de rommel en ruis kan problemen opleveren.
  • Big data kunnen worden verzameld via openbaar gedeelde opmerkingen op sociale netwerken en websites, vrijwillig verzameld via persoonlijke elektronica en apps, via vragenlijsten, productaankopen en elektronische check-ins.
  • Big data wordt meestal opgeslagen in computerdatabases en wordt geanalyseerd met software die speciaal is ontworpen om grote, complexe datasets te verwerken.

Hoe Big Data werkt

Big data kunnen worden gecategoriseerd als ongestructureerd of gestructureerd. Gestructureerde data bestaat uit informatie die al door de organisatie wordt beheerd in databases en spreadsheets; het is vaak numeriek van aard. Ongestructureerde data is informatie die ongeorganiseerd is en niet in een vooraf bepaald model of formaat valt. Het bevat gegevens die zijn verzameld uit sociale mediabronnen, waarmee instellingen informatie kunnen verzamelen over de behoeften van klanten.

Big data kunnen worden verzameld via openbaar gedeelde opmerkingen op sociale netwerken en websites, vrijwillig verzameld via persoonlijke elektronica en apps, via vragenlijsten, productaankopen en elektronische check-ins. Door de aanwezigheid van sensoren en andere inputs in slimme apparaten kunnen gegevens worden verzameld over een breed spectrum van situaties en omstandigheden.

Big data wordt meestal opgeslagen in computerdatabases en wordt geanalyseerd met software die speciaal is ontworpen om grote, complexe datasets te verwerken. Veel software-as-a-service (SaaS) -bedrijven zijn gespecialiseerd in het beheren van dit soort complexe gegevens.

Het gebruik van big data

Gegevensanalisten kijken naar de relatie tussen verschillende soorten gegevens, zoals demografische gegevens en aankoopgeschiedenis, om te bepalen of er een verband bestaat. Dergelijke beoordelingen kunnen intern of extern worden uitgevoerd door een derde partij die zich richt op het verwerken van big data in verteerbare formaten. Bedrijven gebruiken de beoordeling van big data door dergelijke experts vaak om deze om te zetten in bruikbare informatie.



Veel bedrijven, zoals Alphabet en Facebook, gebruiken big data om advertentie-inkomsten te genereren door gerichte advertenties te plaatsen voor gebruikers op sociale media en degenen die op internet surfen.

Bijna elke afdeling in een bedrijf kan de bevindingen van data-analyse gebruiken, van human resources en technologie tot marketing en verkoop. Het doel van big data is om de snelheid waarmee producten op de markt komen te verhogen, de hoeveelheid tijd en middelen te verminderen die nodig zijn om marktacceptatie en doelgroepen te bereiken en ervoor te zorgen dat klanten tevreden blijven.

Voordelen en nadelen van Big Data

De toename van de hoeveelheid beschikbare gegevens biedt zowel kansen als problemen. Over het algemeen zou het hebben van meer gegevens over klanten (en potentiële klanten) bedrijven in staat moeten stellen om producten en marketinginspanningen beter af te stemmen om het hoogste niveau van tevredenheid en terugkerende klanten te creëren. Bedrijven die een grote hoeveelheid gegevens verzamelen, krijgen de mogelijkheid om diepere en rijkere analyses uit te voeren ten behoeve van alle belanghebbenden.



Gezien de hoeveelheid persoonlijke gegevens die tegenwoordig over individuen beschikbaar zijn, is het van cruciaal belang dat bedrijven maatregelen nemen om deze gegevens te beschermen; een onderwerp dat in de huidige online wereld een heet hangijzer is geworden, vooral vanwege de vele datalekken die bedrijven de afgelopen jaren hebben meegemaakt.

Hoewel een betere analyse positief is, kunnen big data ook overbelasting en ruis veroorzaken, waardoor het nut ervan afneemt. Bedrijven moeten grotere hoeveelheden gegevens verwerken en bepalen welke gegevens signalen vertegenwoordigen in vergelijking met ruis. Beslissen wat de gegevens relevant maakt, wordt een sleutelfactor.

Bovendien kunnen de aard en het formaat van de gegevens een speciale behandeling vereisen voordat er actie op wordt ondernomen. Gestructureerde gegevens, bestaande uit numerieke waarden, kunnen eenvoudig worden opgeslagen en gesorteerd. Voor ongestructureerde gegevens, zoals e-mails, video’s en tekstdocumenten, moeten mogelijk meer geavanceerde technieken worden toegepast voordat ze bruikbaar worden.