Dans cet article Ippon évoque les trois distributions majeures que sont Cloudera, Hortonworks et MapR, toutes les trois se basant sur Apache Hadoop.
"En 2004, Google a publié un article présentant son algorithme de calcul à grande échelle, MapReduce, ainsi que son système de fichier en cluster, GoogleFS. Rapidement (2005) une version open source voyait le jour sous l’impulsion de Yahoo.
Aujourd’hui il est difficile de se retrouver dans la jungle d’Hadoop pour les raisons suivantes :
Dans une distribution Hadoop on va retrouver les éléments suivants (ou leur équivalence) : HDFS, MapReduce, ZooKeeper, HBase, Hive, Oozie, Pig, Sqoop, …
Ces solutions sont des projets Apache et sont donc disponibles unitairement mais l’intérêt d’un package complet est évident :
Dans cet article on évoquera les trois distributions majeures que sont Cloudera, Hortonworks et MapR, toutes les trois se basant sur Apache Hadoop."