Découvrez dans ce livre blanc comment basculer dans le monde du Cloud : les pièges à éviter au moment de déployer ses données
"Basculer dans le monde du cloud : les pièges à éviter au moment de déployer ses données
Cloud et big data, une alliance convoitée
Le stockage des données est une question essentielle pour les entreprises. Globalement, le choix se divise entre un envi- ronnement déployé on-premise et un environnement déployé dans le Cloud. Avec le Big Data, le Cloud s’impose de plus en plus comme une solution d’avenir. Pourquoi ?
Tout d’abord, contrairement aux solutions on-premise, le Cloud est un environnement bien plus scalable (ou élastique). Il est possible en quelques clics d’augmenter son espace de stockage, afin de suivre le volume toujours grandissant du patrimoine data de son entreprise. Cela permet aux entreprises d’éviter ce que l’on appelle le « data overload dilemma » qu’elles peuvent rencontrer on-premise, à savoir une trop grande quantité de données pour leur capacité de stockage.
Le Cloud est également un environnement plus rapide, qui per- met de réduire la latence de manière exponentielle. Les capacités inhérentes du Cloud lui permettent de charger et de stocker les données bien plus rapidement que les installations on-premise.
Mais le Cloud n’est pas que plus rapide ou élastique : il est également bien moins cher.
Si nous regardons notre cas d’usage, il faut compter 3 mois pour un déploiement on-premise sur un data lake Hadoop et un coût de data engineering s’élevant à 25 000 $2. Pour le déploiement de ces mêmes données dans le datalake d’AWS, Amazon S3, le délai de chargement est quasiment instantané et l’ensemble des frais ne s’élève qu’à 100 $. Il s’agit d’une grande économie à la fois de temps et d’argent, d’autant plus si l’on prend en compte le temps libéré pour le data engineer, pouvant désormais travailler sur d’autres projets que le déploiement sur Hadoop."