Aujourd’hui lorsque vous ressentez le besoin de préparer les informations qui supporteront les décisions de votre entreprise, vous avez un énorme pourcentage de chances de finir avec un Datawarehouse ! Deux choses viennent alors à l’esprit : un développement bien plus long que prévu, et toujours des surprises désagréables au niveau du budget. Mais aujourd’hui un nouveau joueur est arrivé, qui pourrait bien ringardiser le Datawarehouse...
Permettez-moi de diverger un peu et de vous dire comment je gère mon courrier. Je pense en effet qu’il y a un parallèle fort avec la façon dont les entreprises construisent (ou au moins essaient de construire) un entrepôt de données.
Trier mon courrier
Pendant des années, j’ai consacré beaucoup de temps à organiser mes boites aux lettres. Un dossier par client, par marché, par produit, par partenaire et ainsi de suite. Au départ, j’effectuais ce travail de classement une fois par semaine, mais c’est vite devenu une activité quotidienne qui me prenait un tel temps précieux sur mes disponibilités business.
Le nombre d’email que je reçois maintenant a explosé. Non seulement à cause du plus grand nombre de clients, de partenaires et de collègues qui m’informent, mais également à cause d’un nombre toujours croissant d’email venant de différents forums et des notifications des réseaux sociaux. C’est devenu ingérable et j’ai arrêté ce rangement fastidieux.
Et pour finir, je n’ai rien perdu, au contraire, les possibilités de recherche sont devenue aujourd’hui tellement puissantes que j’arrive à trouver mes email en recherchant par sujet ou par toute combinaison possible de mots. Je retrouve même l’information encore plus rapidement qu’avant, et de façon plus complète, vu qu’avant je devais puiser les informations de différents dossiers, en fonction de mes rangements. Aujourd’hui les capacités de recherche email me présente toute les informations pertinentes que je recherche, peu importe leurs emplacements.
Il en va de même aujourd’hui pour les projets Datawarehouse. Voulez-vous encore consacrer du temps et du budget à ranger méticuleusement les données qui pourraient peut-être, un jour, vous être nécessaires ? Votre seul but c’est de prendre rapidement les bonnes décisions, pas d’avoir des données bien rangées !
La bonne vieille prison de données...
La mise en place d’un Datawarehouse va vous prendre beaucoup de temps, il faudra le conceptualiser, le concevoir, le construire (ou le faire construire). Une chose est sûre : au moment où il sera (partiellement) terminé, la vitesse du business aidant, votre entreprise aura déjà changé. Pire : vous vous ferez face à de nouvelles questions, qui n’auront pas été planifiées dans la structure sur laquelle ceux qui ont réalisé votre Datawarehouse ont transpiré.
... ou le nouveau joueur, le Data Lake.
De plus en plus d’entreprises renoncent à construire leur joli entrepôt de données (Conscientes qu’il y a peu de chances qu’elles y arrivent..). Elles se concentrent plutôt sur la mise en place d’une technologie qui leur permet de rechercher des informations dans un ensemble de données non préparées, juste « Stockées ». L’idée c’est de rassembler (déverser) toutes les données en un seul endroit, le Data Lake, et en confiant au service informatique la responsabilité de gouverner ces données, au niveau exactitude, cohérences temporelles, versions, et bien sûr, droits d’accès des utilisateurs. Il ne reste plus qu’à choisir l’outil qui permettra de surfer sur ce Data Lake, procurant aux futurs décideurs la possibilité de visualiser et de découvrir les données, de les associer, de les analyser, de prédire les comportements et obtenir les informations désirées au moment voulu !
Gouvernance des données
La gouvernance des données devient un élément crucial. Offrir aux utilisateurs finaux des fonctionnalités accrues d’accès et d’analyse des données, implique une solide stratégie de gouvernance, afin d’éviter les pertes de temps consacrées à corroborer des données différentes, dans le temps ou leur globalité.
Dois-je choisir ?
Eh bien, pas vraiment. Même si vous avez déjà un Datawarehouse ou des Datamart en place, vous pouvez très bien y ajouter le concept Data Lake. Je n’ai pas supprimé le rangement initial de mes mails, il est toujours disponible et vient s’ajouter aux données rapatriées par mes recherches. Combiner les informations du passé et du présent, en gagnant du temps, et disposer d’un rapidement d’accès plus complet aux éléments pertinents soutenant les décisions, fait partie des vœux les plus chers de chaque décideur.
Pour télécharger le livre blanc « Evaluating governed Data Discovery », cliquez sur le bouton ci-dessous.