Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Certification Hadoop avec Spark pour Développeurs de Cloudera

Certification Hadoop avec Spark pour Développeurs de Cloudera

BIG DATA LES DISTRIBUTIONS HADOOP

hadoop

Objectifs

  • Spark avec Hadoop pour Développeurs de Cloudera vous permettra de :
  • Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
  • Comment utiliser Sqoop et Flume pour intégrer les données ?
  • Comment enregistrer des données distribuées avec Apache Spark ?
  • Comment modéliser des données structurées en tant que tableau dans Impala et Hive ?
  • Comment choisir le meilleur format de stockage de données pour différents patterns d’utilisation de données ?
  • Les meilleures pratiques pour le stockage de données.

Public

  • Spark avec Hadoop pour Développeurs de Cloudera est destinée aux développeurs et ingénieurs qui développeront, maintiendront et optimiseront des tâches Hadoop.

Prérequis

  • Cette formation Certification Spark avec Hadoop pour Développeurs de Cloudera nécessite d'avoir une expérience dans le développement, si possible avec Scala ou Python.

Programme de la formation

  • Introduction 
  • Présentation de Hadoop et de son écosystème
  • L’architecture et HDFS 
  • Importer des données relationnelles avec Apache Sqoop
  • Introduction à Impala et Hive 
  • Les formats de données
  • La partition des données 
  • Les données Apache Flume
  • Les bases de
  • Rédiger et déployer des applications Spark
  • La programmation parallèle avec Spark 
  • Spark : mise en cache et persistence
  • Le traitement de données avec Spark et « Common patterns » 
  • Spark SQL et DataFrames
  • Conclusion