24 juni 2021 11:36

Data opslagplaats

Wat is datawarehousing?

Datawarehousing is de elektronische opslag van een grote hoeveelheid informatie door een bedrijf of organisatie. Datawarehousing is een essentieel onderdeel van business intelligence waarbij analytische technieken op bedrijfsgegevens worden toegepast.

Het concept van datawarehousing werd in 1988 geïntroduceerd door IBM- onderzoekers Barry Devlin en Paul Murphy. De behoefte om gegevens op te slaan is geëvolueerd naarmate computersystemen complexer werden en steeds meer gegevens verwerkt. Een belangrijk boek over datawarehousing is WH Inmon’s “Building the Data Warehouse”, dat voor het eerst werd gepubliceerd in 1990 en sindsdien verschillende keren is herdrukt.

Hoe datawarehousing werkt

Datawarehousing wordt gebruikt om meer inzicht te geven in de prestaties van een bedrijf door gegevens te vergelijken die zijn geconsolideerd uit meerdere heterogene bronnen. Een datawarehouse is ontworpen om query’s en analyses uit te voeren op historische gegevens die zijn afgeleid van transactionele bronnen.

Zodra de gegevens in het magazijn zijn opgenomen, veranderen ze niet en kunnen ze niet worden gewijzigd, aangezien een datawarehouse analyses uitvoert op gebeurtenissen die al hebben plaatsgevonden door zich te concentreren op de veranderingen in gegevens in de loop van de tijd. Opslaggegevens moeten worden opgeslagen op een manier die veilig, betrouwbaar, gemakkelijk terug te vinden en gemakkelijk te beheren is.

Er zijn bepaalde stappen die worden genomen om een ​​datawarehouse te creëren. De eerste stap is gegevensextractie, waarbij grote hoeveelheden gegevens uit meerdere bronpunten worden verzameld. Nadat de gegevens zijn verzameld, doorloopt het gegevensopschoning, het proces van het doorzoeken van de gegevens op fouten en het corrigeren of uitsluiten van gevonden fouten.

De opgeruimde gegevens worden vervolgens geconverteerd van een databaseformaat naar een magazijnformaat. Zodra ze in het magazijn zijn opgeslagen, worden de gegevens gesorteerd, geconsolideerd, samengevat, enz. Zodat ze beter gecoördineerd en gemakkelijker te gebruiken zijn. Na verloop van tijd worden er meer gegevens aan het magazijn toegevoegd naarmate de meerdere gegevensbronnen worden bijgewerkt.

Belangrijkste leerpunten

  • Datawarehousing is de elektronische opslag van een grote hoeveelheid informatie door een bedrijf of organisatie.
  • Een datawarehouse is ontworpen om query’s en analyses uit te voeren op historische gegevens die zijn afgeleid van transactionele bronnen voor bedrijfsinformatie en datamining.
  • Datawarehousing wordt gebruikt om meer inzicht te geven in de prestaties van een bedrijf door gegevens te vergelijken die zijn geconsolideerd uit meerdere heterogene bronnen.

Speciale overwegingen: datamining

Bedrijven kunnen gegevens opslaan voor gebruik bij verkenning en datamining, op zoek naar informatiepatronen die hen kunnen helpen hun bedrijfsprocessen te verbeteren. Een goed datawarehousing-systeem kan het ook voor verschillende afdelingen binnen een bedrijf gemakkelijker maken om toegang te krijgen tot elkaars gegevens.

Met een datawarehouse kan een bedrijf bijvoorbeeld gemakkelijk de gegevens van het verkoopteam beoordelen en helpen bij het nemen van beslissingen over hoe de verkoop kan worden verbeterd of de afdeling kan worden gestroomlijnd. Het bedrijf zou ervoor kunnen kiezen om zich te concentreren op het bestedingspatroon van zijn klanten om zijn producten beter te positioneren en de verkoop te verhogen.

Met datawarehousing kan het bedrijf historische gegevens verzamelen over de uitgaven van zijn klanten in het verleden – zeg 20 jaar – en analyses uitvoeren op deze gegevens. De resulterende informatie zou inzicht kunnen geven in de voorkeuren van haar consumenten; de tijd van de dag, maand of jaar met grotere verkopen; of de best betaalde klant voor het jaar.

Effectieve gegevensopslag en -beheer zijn ook wat processen mogelijk maakt, zoals het initiëren van reisreserveringen en het gebruik van geldautomaten.

Het datamining-proces is onderverdeeld in vijf stappen:

  1. Organisaties verzamelen gegevens en laden deze in hun datawarehouses.
  2. Ze slaan en beheren de gegevens vervolgens op, hetzij op interne servers, hetzij in de cloud.
  3. Bedrijfsanalisten, managementteams en IT-professionals hebben toegang tot de gegevens en bepalen hoe ze deze willen organiseren.
  4. Applicatiesoftware sorteert de gegevens vervolgens op basis van de resultaten van de gebruiker
  5. De eindgebruiker presenteert de gegevens ten slotte in een gemakkelijk te delen formaat, zoals een grafiek of tabel.

Datawarehousing versus databases

Een datawarehouse is niet per se hetzelfde concept als een standaarddatabase. Een database is een transactiesysteem dat is ingesteld om realtime gegevens te bewaken en bij te werken om alleen de meest recente gegevens beschikbaar te hebben. Een datawarehouse is geprogrammeerd om gestructureerde gegevens gedurende een bepaalde periode samen te voegen. Een database kan bijvoorbeeld alleen het meest recente adres van een klant hebben, terwijl een datawarehouse mogelijk alle adressen heeft waar de klant de afgelopen 10 jaar heeft gewoond.