mise à jour : 23/12/2020 Hadoop

Version étudiée : 1.1.01.0 Site web http://hadoop.apache.org Distribuée par : Fondation (Apache ) Licence : Apache Technologie : Java

Appréciations

Smile 4.3
Internautes 3.9
Global 4.1 5

Présentation

Hadoop est aujourd’hui la plateforme de référence permettant l’écriture d’application de stockage et de traitement de données distribuées en mode batch.

Hadoop se présente comme un framework mettant à la disposition des développeurs et des administrateurs un certain nombre de briques essentielles :

  • Les éléments d’infrastucture permettant la mise en place de clusters de stockage  et de traitement des données. Le stockage des données s’appuie HDFS, un système de fichier  permettant d’héberger les données à traiter sous forme de fichiers distribués.
  • MapReduce : Un framework Java de traitement distribué qui permet de développer des tâches de traitement sur les données du cluster
  • Hadoop fournit par ailleurs un ensemble d’outils qui permet le lancement de tâches ainsi que leur suivi à l’échelle du cluster

L’idée principale derrière Hadoop : les données sont automatiquement distribuées dans le cluster par HDFS, les traitements doivent s’effectuer au plus près de la donnée (ce que permet MapReduce). Les transferts de données sont ainsi réduits au minimum.

Hadoop est écrit en Java et soutenu par plusieurs startups américaines. Il est en outre devenu une sorte de standard de fait pour l’écriture d’application de traitement de données ralliant l’ensemble des acteurs majeurs du secteur.

Avis des internautes

FR Mohammed LAHBOUB a noté la solution le 26/08/2014

“ Je travail depuis plus d'1 an avec Hadoop et l'ecosystème Hortonworks, un système en constant évolution il manque des ressources sert mais il faut attendre quelques années encore pour avoir une solution complète. je tiens a dire que la distribution Cloudera et Hortonworks fournie une excellente documentation d'hadoop pour les débutants te les experts. ”

4 personnes ont le même avis
FR Igor Ngouagna a noté la solution le 30/01/2014

“ Pour ma part le leader en matière d'outil de BigData. En constante évolution et offrant de plus en plus de possibilités, d'autant plus que le domaine est grandissant. Dommage qu'il n'y ait pas assez de ressources (humaines) adéquates. ”

7 personnes ont le même avis