Formation Hadoop : stockage Hbase

Hadoop - HBase, mise en oeuvre et administration

Télécharger le plan de cours

Demander un devis

Obtenir un renseignement

Informations générales

Référence CB034

Durée 2 jours (14h)

Tarif 1 570 €HT

Repas 46 €HT (en option)

Objectifs

Après ce cours, vous serez capable de :

Appréhender l’écosystème Hadoop
Identifier l’architecture et le fonctionnement de HBase
Identifier les apports d’HBase en termes de stockage distribué des données
Mener à bien l’installation du système
Savoir mettre en place une configuration distribuée

Public

Ce cours s'adresse avant tout aux personnes suivantes :

Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase.

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

Connaissance des principes de base Hadoop et des bases de données.

Programme de la formation

Appréhender l’écosystème Hadoop

Rappels rapides sur l'écosystème Hadoop. Fonctionnalités.
Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
Présentation HBase. Historique. Lien avec HDFS.

Comprendre l’architecture et le fonctionnement de HBase

Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, ...
Fonctionnalités : failover automatique, sharding, requêtage
HBase master node, Region Master, liens avec les clients HBase. Haute disponibilité. Consistance des données.
Présentation du rôle de Zookeeper.
Atelier : définition d'une architecture HBase en fonction de contraintes d'utilisation

Identifier les apports d’HBase en termes de stockage distribué des données

Format des données dans HBase. Comparaison avec d'autres bases clés/valeurs.
Présentation des différentes interfaces disponibles.
Outils HBase : hbase pe et hbase ltt pour les performances, hbase shell pour l'exploitation
Atelier : gestion de base avec hbase shell.

Mener à bien l’installation

Choix des paquets. Vérification des pré-requis.
Installation et configuration en mode distribué. Mise en oeuvre avec HDFS dans un environnement distribué.
Test de connexion avec hbase shell.
Atelier : installation d'une grappe de serveurs HBase en mode distribué
Atelier : interrogations depuis le serveur http intégré.

Savoir mettre en place une configuration distribuée

Fonctionnement en mode distribué
Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper). Gestion de la consistance. Mise en évidence.
Atelier : utilisationn des outils d'exploitation : hbck, hfile, ...
Atelier : mise en oeuvre des splits sur un exemple de tables réparties. regionsplitter.

plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Mis à jour le 13/07/2023