04/10/2019

Cloudera lance sa plate-forme de données en nuage intégrée entièrement ouverte

logo cloudera

Deux mois après avoir adopté une stratégie entièrement basée sur l' open source , Cloudera Inc. annonce aujourd'hui une plate-forme de données intégrée entièrement composée d'éléments open source.

Pour rappel, Cloudera Data Platform se positionne comme un service cloud à guichet unique pour les organisations qui souhaitent effectuer des analyses dans des environnements hybrides et multicouches avec une sécurité et une gouvernance de niveau entreprise. Le paquetage associe un entrepôt de données natif dans le nuage, un service d'apprentissage machine et un hub de données, chacun fonctionnant en tant qu'instances dans les environnements conteneurisés. Les requêtes sont gérées par Apache Hive ou Apache Impala, ce dernier étant développé par Cloudera.

Simplification de mise en oeuvre

La plate-forme de données Cloudera se concentre sur la réduction du temps nécessaire pour installer et configurer plusieurs éléments nécessaires à la création d'un entrepôt de données, d'un atelier d'analyse ou d'une suite de formation à l'apprentissage automatique. En utilisant des composants existants dans le cloud, la plate-forme réduit les délais de déploiement de quelques semaines à quelques heures, a déclaré Murthy. Le logiciel fonctionne en mode natif sur les données Amazon Web Services Inc. S3 et prend en charge le système de fichiers distribué Hadoop. C’est d’ailleurs Hadoop et sa complexité qui est clairement attaquée par cette initiative de Cloudera.

La plate-forme tire également parti de l' expérience des données partagées de Cloudera, une infrastructure de données unifiée qui comprend un schéma, des autorisations et des artefacts de gouvernance. Il permet à plusieurs utilisateurs de travailler à partir des mêmes données et du même catalogue en utilisant les outils de leur choix et de migrer des charges de travail vers le cloud.

Les clients utilisant le logiciel sur site de Cloudera peuvent obtenir une vue unique de leurs charges de travail locales et dans le nuage. Cloudera Data Platform est actuellement un service de nuage uniquement pour les charges de travail s’exécutant sur une infrastructure Amazon. Une version de prévisualisation du nuage Azure de Microsoft Corp. devrait être disponible dans quelques mois et le support pour le nuage de Google LLC est prévu pour le début de l’année prochaine.

Source : https://fr.cloudera.com/

Actualités