Datamining - KamilTaylan.blog
24 juni 2021 11:36

Datamining

Wat is datamining?

Datamining is een proces dat door bedrijven wordt gebruikt om ruwe data om te zetten in bruikbare informatie. Door software te gebruiken om patronen in grote hoeveelheden gegevens te zoeken, kunnen bedrijven meer te weten komen over hun klanten om effectievere marketingstrategieën te ontwikkelen, de verkoop te verhogen en de kosten te verlagen. Datamining is afhankelijk van effectieve gegevensverzamelingopslag en computerverwerking.



Dataminingprocessen worden gebruikt om machine learning-modellen te bouwen die toepassingen mogelijk maken, waaronder zoekmachinetechnologie en website-aanbevelingsprogramma’s.

Hoe datamining werkt

Datamining omvat het verkennen en analyseren van grote blokken informatie om zinvolle patronen en trends te verzamelen. Het kan op verschillende manieren worden gebruikt, zoals databasemarketing, kredietrisicobeheer, fraudedetectie, spam-e-mailfiltering of zelfs om het sentiment of de mening van gebruikers te achterhalen.

Het dataminingproces valt uiteen in vijf stappen. Ten eerste verzamelen organisaties gegevens en laden deze in hun datawarehouses. Vervolgens slaan ze de gegevens op en beheren ze deze, hetzij op interne servers, hetzij in de cloud. Bedrijfsanalisten, managementteams en IT-professionals hebben toegang tot de gegevens en bepalen hoe ze deze willen organiseren. Vervolgens sorteert applicatiesoftware de gegevens op basis van de resultaten van de gebruiker, en ten slotte presenteert de eindgebruiker de gegevens in een gemakkelijk te delen indeling, zoals een grafiek of tabel.

Software voor datawarehousing en mijnbouw

Dataminingprogramma’s analyseren relaties en patronen in gegevens op basis van wat gebruikers vragen. Een bedrijf kan bijvoorbeeld datamining-software gebruiken om informatieklassen te creëren. Om dit te illustreren, stel je voor dat een restaurant datamining wil gebruiken om te bepalen wanneer het bepaalde specials moet aanbieden. Het kijkt naar de informatie die het heeft verzameld en maakt klassen op basis van wanneer klanten bezoeken en wat ze bestellen.

In andere gevallen vinden datamijnwerkers clusters van informatie op basis van logische verbanden of kijken ze naar associaties en opeenvolgende patronen om conclusies te trekken over trends in consumentengedrag.

Warehousing is een belangrijk aspect van datamining. Warehousing is wanneer bedrijven hun gegevens centraliseren in één database of programma. Met een datawarehouse kan een organisatie segmenten van de gegevens afsplitsen zodat specifieke gebruikers deze kunnen analyseren en gebruiken.

In andere gevallen kunnen analisten echter beginnen met de gegevens die ze willen en een datawarehouse creëren  op basis van die specificaties. Ongeacht hoe bedrijven en andere entiteiten hun gegevens organiseren, ze gebruiken deze om de besluitvormingsprocessen van het management te ondersteunen.

Voorbeeld van datamining

Supermarkten zijn bekende gebruikers van dataminingtechnieken. Veel supermarkten bieden klanten gratis klantenkaarten aan die hen toegang geven tot verlaagde prijzen die niet beschikbaar zijn voor niet-leden. Met de kaarten kunnen winkels gemakkelijk bijhouden wie wat koopt, wanneer en tegen welke prijs. Na analyse van de gegevens kunnen winkels deze gegevens gebruiken om klanten kortingsbonnen aan te bieden die zijn afgestemd op hun koopgedrag en om te beslissen wanneer ze artikelen in de uitverkoop of wanneer ze voor de volle prijs verkopen.

Datamining kan een reden tot bezorgdheid zijn wanneer een bedrijf alleen geselecteerde informatie, die niet representatief is voor de totale steekproefgroep, gebruikt om een ​​bepaalde hypothese te bewijzen.

Belangrijkste leerpunten

  • Datamining is het analyseren van een grote hoeveelheid informatie om trends en patronen te ontdekken.
  • Datamining kan door bedrijven worden gebruikt voor alles, van het leren over waar klanten in geïnteresseerd zijn of willen kopen tot fraudedetectie en spamfiltering.
  • Dataminingprogramma’s breken patronen en verbindingen in gegevens af op basis van de informatie die gebruikers vragen of verstrekken.