Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Big Data - Mise en oeuvre des traitements de flux de données avec Storm

Big Data - Mise en oeuvre des traitements de flux de données avec Storm

Gérer en temps réel des flux massifs de données

Les volumes de données à gérer ne cessent de croitre. Les flux de données suivent et amplifient naturellement cette évolution. Les applications et solutions à disposition des utilisateurs se doivent donc d'exploiter dans des délais toujours plus courts des masses d'informations toujours plus importantes pour gagner en efficacité et en pertinence. (Exemple : sur une page web, l'affichage d'informations directement liées aux actions sur le ou les sites consultés quelques secondes auparavant). Storm est une solution qui permet de gérer en temps réel des flux massifs de données et qui répond en cela efficacement aux nouvelles problématiques liées au Big Data. Les participants à cette formation très pratique apprendront à mettre en oeuvre la solution.

Objectifs

  • Disposer des connaissances nécessaires pour configurer un environnement de développement
  • Savoir mettre en oeuvre Storm pour le traitement des flux de données
  • Comprendre comment assurer le traitement de gros volumes de flux de données de façon performante grâce à la mise en oeuvre de la haute disponibilité

Public

  • Chefs de projet, data scientists, développeurs

Prérequis

  • Connaissance d'un langage de programmation comme Java ou Python

Programme de la formation

Introduction

  • Présentation de Storm : fonctionnalités, architecture, langages supportés
  • Définitions : spout, bolt, topology

Architecture

  • Étude des composants d'un cluster Storm : master node nimbus et worker nodes
  • Positionnement par rapport à un cluster Hadoop
  • Le modèle de données
  • Différents types de flux

Premiers pas

  • Configuration d'un environnement de développement
  • Installation d'un cluster Storm
  • Travaux pratiques sur le projet storm-starter

Flux de données

  • Définition du nombre de flux dans un noeud, création de topologies regroupant des flux entre différents noeuds
  • Communication entre flux en JSON, lecture de flux d'origines diverses (JMS, Kafka, ...)

Haute disponibilité

  • Tolérance aux pannes : principe de fiabilisation des master node, workers node, nimbus
  • Garantie de traitement des flux : principe, paramètres
  • TOPOLOGY_MESSAGE_TIMEOUT_SECS, TOPOLOGY_ACKERS
  • Traitements temps réel avec Trident
  • Scalabilité : parallélisme dans un cluster storm, ajouts de noeuds, commande storm rebalance

Les plus de cette formation

  • Les nombreux retours d'expériences de consultants expérimentés permettent d'illustrer les concepts abordés et d’en faciliter la compréhension.
  • Des ateliers et mises en situations qui permettent d’acquérir une première expérience concrète de la mise en oeuvre de Storm.

 

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.