Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
> > > Hadoop - Cloudera / Hortonworks pour architectes et administrateurs

Hadoop - Cloudera / Hortonworks pour architectes et administrateurs

BIG DATA LES DISTRIBUTIONS HADOO

hadoop

Objectifs

  • Comment élaborer une architecture Hadoop
  • Comment Hadoop Distributed File System (HDFS) et YARN/MapReduce fonctionnent
  • Comment exploiter et gérer un cluster Hadoop
  • Comment configurer Hadoop et ses outils
  • Comment mettre en œuvre un cluster Hadoop
  • Comment gérer la maintenance des nœuds dans un cluster
  • Comment déplacer et gérer les données dans un cluster
  • Comment administrer un cluster Hadoop

Public

  •  administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.

Prérequis

  • savoir naviguer et modifier des fichiers dans Linux
  •  Une connaissance préliminaire d’Hadoop n’est pas exigée.

Programme de la formation

INTRODUCTION

  • Présentation générale d’Hadoop
  • Exemples d’utilisation dans différents secteurs
  • Historique et chiffres clés : Quand parle-t-on de Big Data ?
  • Les possibilités d’implantation de l’infrastructure et les coûts associés

L’ECOSYSTEME D’HADOOP

  • Le système de fichier HDFS
  • Le paradigme MapReduce et l’utilisation à travers YARN
  • Le garant des informations : Zookeeper
  • Le système de stockage de la donnée basé sur le socle : HBase
  • La présentation de l’architecture globale : où installer les services ?
  • La définition du dimensionnement pour un cluster Hadoop
  • Les particularités de MapR

INSTALLATION DU SOCLE D’HADOOP

  • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase

MANIPULATION DES DONNEES DANS UN CLUSTER HADOOP

  • Architecture, Objectif et fonctionnement de : Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark
  • Mise en pratique sur les différents outils

EXPLOITATION D’UN CLUSTER HADOOP

  • Architecture, objectif et fonctionnement du Manager : MapR Control System
  • Mise en pratique

CONCEPTS D’ARCHITECTURE COMPLEXE

  • Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
  • Scalabilité et performances : le Namenode Federation
  • High Availability des serveurs maitres
  • Utilisation des snapshots : sauvegarde et restauration