Connexion
14 759 Livres Blancs | 2 471 |

Construire un Data Lake dans le Cloud

Obtenir une source unique de données fiable, rapide et sécurisée.

Construire un Data Lake dans le Cloud

Introduction ou extrait du livre blanc

"Les organisations qui ont une approche orientée données cherchent à tirer des enseignements à partir de toutes leurs données au travers de leurs activités et des exigences de leurs clients. Elles collectent et analysent des volumes toujours plus importants de données issues de sources traditionnelles, telles que les ERP, les CRM et les systèmes de points de vente, mais aussi de sources nouvelles, à savoir les logs de connexion, les applications web et mobiles, les objets connectés (IoT) et d’autres encore.

Cependant, cette démarche nécessite de disposer d’un référentiel unique pour stocker, réconcilier et exploiter facilement et efficacement les données. Mais charger un tel volume d’informations dans un data warehouse traditionnel peut se révéler compliqué, long, coûteux voire impossible. Les données provenant de nouvelles sources arrivent souvent en formats semi-structurés et nécessitent d’être transformées et traitées avant le chargement. De plus, le coût et la complexité des opérations liées à la conservation de vastes quantités de données brutes dans un entrepôt classique à partir d’un nombre toujours croissant de sources seraient excessifs.

Le data lake a fait son apparition il y a plus d’une décennie dans le but de résoudre les problématiques suivantes :

• Créer un référentiel de données évolutif et peu onéreux pour rassembler les données brutes issues de sources multiples, puis les découvrir et les croiser.

• Rendre ces données affinées, organisées et certifiées accessibles au plus grand nombre vers d’autres systèmes, y compris un data warehouse, pour effectuer des tâches d’analyse, de découverte de données en libre-service et de reporting avancées.

Une idée a priori simple mais qui dans la pratique ne l’est pas forcément. Sans la bonne technologie, une qualité de données acceptable et une gouvernance appropriée, le « lac » peut bien vite se transformer en marécage – un réservoir de données difficiles à utiliser et à comprendre, et dans la pratique inaccessible à ceux qui en ont vraiment besoin. Plus les données qui se déversent dans le data lake sont nombreuses et diversifiées, plus le problème prend de l’ampleur. Il est alors difficile d’en extraire des informations significatives et donc d’en tirer de la valeur."

Pour recevoir ce livre blanc, merci de cliquer ci-dessous :

Obtenir le livre blanc