Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Développement > Frameworks > IBM InfoSphere Advanced DataStage - Parallel Framework v11.5

IBM InfoSphere Advanced DataStage - Parallel Framework v11.5

ibm

Ce cours est conçu pour présenter les techniques avancées de développement de travaux parallèles dans DataStage v11.5. Dans ce cours, vous développerez une compréhension plus approfondie de l'architecture DataStage, y compris une compréhension plus approfondie des environnements de développement DataStaged et d'exécution. Cela vous permettra de concevoir des tâches parallèles robustes, moins sujettes aux erreurs, réutilisables et optimisées pour de meilleures performances.

Objectifs

  • Compiler et exécuter des travaux
  • Partitionner et collecter des données
  • Trier des données
  • Mettre en mémoire tampon dans les travaux parallèles
  • Connaitre les types de données d'infrastructure parallèles
  • Créer des composants réutilisables
  • Activer la fonctionnalité d'optimisation équilibrée dans Designer

Public

  • Développeurs DataStage expérimentés recherchant une formation aux techniques de travail plus avancées de DataStage et cherchant à comprendre l'architecture de la structure parallèle

Prérequis

  • cours IBM InfoSphere DataStage Essentials ou équivalent
  • au moins un an d'expérience dans le développement de travaux parallèles à l'aide de DataStage

 

Programme de la formation

Introduction à l'architecture du framework parallèle

  • Décrire l'architecture de traitement parallèle
  • Décrire le parallélisme des pipelines et des partitions
  • Décrire le rôle du fichier de configuration
  • Concevoir un travail qui crée des données de test robustes

Compiler et exécuter des travaux

  • Décrire les parties principales du fichier de configuration
  • Décrire le processus de compilation et le SST généré par le processus de compilation
  • Décrivez le rôle et les principales parties de la partition
  • Décrire le processus d'exécution du travail

Partitionner et collecter des données

  • Comprendre le fonctionnement du partitionnement dans la structure
  • Affichage des partitionneurs dans la partition
  • Sélection d'algorithmes de partitionnement
  • Générer des séquences de nombres (clés de substitution) dans un environnement parallèle partitionné

Tri des données

  • Trier les données dans le cadre parallèle
  • Trouver des tris insérés dans le score
  • Réduire le nombre de tris insérés
  • Optimiser les tâches Fork-Join
  • Utilisez les étapes de tri pour déterminer la dernière ligne d'un groupe
  • Décrire la clé de tri et la logique de la clé de partitionnement dans le cadre parallèle

Mise en mémoire tampon dans les travaux parallèles

  • Décrire le fonctionnement de la mise en mémoire tampon dans les travaux parallèles
  • Ajuster les tampons dans les travaux parallèles
  • Eviter les conflits de tampon

Types de données d'infrastructure parallèles

  • Décrire les ensembles de données virtuels
  • Décrire les schémas
  • Décrire les mappages et les conversions de types de données
  • Décrivez comment les données externes sont traitées
  • Gérer les nulls
  • Travailler avec des données complexes

 Composants réutilisables

  • Créer un fichier de schéma
  • Lire un fichier séquentiel à l'aide d'un schéma
  • Décrire la propagation de colonne d'exécution (RCP)
  • Activer et désactiver le RCP
  • Créer et utiliser des conteneurs partagés

Optimisation équilibrée

  • Activer la fonctionnalité d'optimisation équilibrée dans Designer
  • Décrire le flux de travail d'optimisation équilibrée
  • Répertoriez les différentes options d'optimisation équilibrée.
  • Traitement en phase poussée vers une source de données
  • Traitement du stade poussé vers une cible de données
  • Optimiser une tâche en accédant au système de fichiers Hadoop HDFS
  • Comprendre les limites des optimisations équilibrées

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.