Profil et évaluation des produits : Talend et Informatica.
"Ces dix dernières années, Hadoop a acquis une position dominante dans le domaine de la gestion des informations en renforçant les stratégies numériques avec des possibilités à grande échelle. Bien qu'Hadoop aide les organisations orientées données (ou souhaitant le devenir) à surmonter les obstacles liés au volume à stocker et traiter, et au coût de traitement inhérent à des volumes de données croissants, il ne résout pas le problème de l'intégration des données hautes performances : une activité qui utilise au moins 80 % du temps d’obtention d’informations exploitables depuis les big data (mégadonnées).
Les outils d'intégration de données modernes ont été conçus dans un monde de données structurées, de bases de données relationnelles et d'entrepôts de données (warehouses). La révolution conceptuelle des big data et d'Hadoop a modifié et rendu caduques certaines des méthodes utilisées pour transformer des données en valeur commerciale. Malheureusement, le domaine des outils d'intégration de données n'a pas su se mettre au diapason de cette révolution. Ceux qui ont, dès leur apparition, fait le choix des big data pour leur architecture d'entreprise n'ont découvert que récemment la variété et sélection d'outils et de fonctionnalités d'intégration de données qui peuvent accompagner leurs capacités croissantes de stockage de données.
Hadoop a beaucoup évolué depuis ses débuts où il traitait simplement de grands volumes de données par lot de manière à la fois économique et évolutive. Nombre d’approches et outils sont apparus depuis permettant l’amélioration des capacités et l’élargissement des utilisations potentielles d'Hadoop. Un des nouveaux outils les plus intéressants est Spark, un moteur de traitement multi-étapes en mémoire qui offre des vitesses haute performance, beaucoup plus rapides que celles de ses prédécesseurs basés sur disque.
Malgré leurs efforts pour acquérir toutes ces prometteuses capacités les entreprises s'obstinent encore dans l'ancien concept de systèmes OLTP relationnels structurés qui exécutent leurs activités quotidiennes. Ce monde bien présent le restera encore longtemps La solution consiste donc à associer ces capacités afin de rapprocher ces deux mondes. Et la clé en est l'intégration de données qui rapproche les données transactionnelles et de référence des bases de données relationnelles traditionnelles basées sur le SQL et les big data provenant d'une large gamme et variété de sources."