Data uit bronsystemen weergeven in een rapportage is mogelijk zonder datawarehouse. Vaak wordt er door middel van bijvoorbeeld export en import data naar Excel gehaald om vervolgens op een ander werkblad middels allerlei functies en opschoonacties een toonbaar geheel te creëren.
Dit document vind zijn weg door het bedrijf en is een belangrijke bron voor beslissingen die genomen worden.
Een datawarehouse vervangt als het ware dit document en zorgt ervoor dat deze data verzameld wordt in een database op een centraal punt. De formules zijn in het datawarehouse ingebouwd en opschoonacties worden tijdens het laden uitgevoerd.
De business analist die zich normaal gesproken bezighoudt met het opstellen en bijhouden van het Excel document kan zich gaan richten op het daadwerkelijk analyseren van de cijfers en nieuwe wensen verzamelen onder de gebruikers voor het datawarehouse.
Opzet van een datawarehouse
Een typische opzet van het datawarehouse bestaat uit twee databases, een staging en het datawarehouse zelf. In de staging wordt de data uit de bron ingelezen, dit kan vanuit allerlei verschillende bronsystemen zijn. Tijdens het ETL-proces, wordt de data geschikt gemaakt voor het datawarehouse, daarbij vindt over het algemeen ook opschoning plaats of aanvulling van de gegevens vanuit externe databronnen zoals een online KVK-register.
Nadat de data in de staging database aanwezig is en de opschoning en aanvulling heeft plaatsgevonden, wordt de data overgezet naar het datawarehouse. De data wordt op een bepaalde manier, meestal volgens het ster-schema, opgeslagen en is daarmee zeer geschikt voor rapporten, multidimensional en tabular model.
Meerdere bronsystemen koppelen
Om een datawarehouse op te zetten zijn een aantal stappen nodig die in iedere situatie gelijk zijn, daarom is dit door ons vastgelegd in een model dat we toepassen bij verschillende bedrijven. Dit model voorziet in het ophalen van de data, het modelleren van de data om geschikt te maken voor een datawarehouse en is geschikt voor diverse bronsystemen. Dit kan een SQL Server database zijn, maar ook een webservice, SharePoint lijst, Excel document of andere databasesystemen.
Doordat veel werk al uitgedacht is ons model datawarehouse kan er direct gestart worden met het verzamelen van de benodigde data en is een datawarehouse in korte tijd operationeel.
Starten met analyseren
Bent u bezig met dashboards en analyses die rechtstreeks data uit de bron halen, bedenk dan dat vrij eenvoudig gerealiseerd kan worden, maar u zult ook snel tegen de beperkingen aanlopen van deze methodiek. Het opzetten van een datawarehouse blijft nodig om echt goede analyses te kunnen doen met de data in uw bedrijf.
Bovendien kan de data in het datawarehouse ook ingezet worden voor nieuwe technieken die er zijn, zoals Power BI, Machine Learning. Dit soort systemen functioneren alleen bij correcte en opgeschoonde gegevens.