Organisme de Formation aux technologies et métiers de L'informatique
google

Formation Google Cloud Platform - Ingénierie de données

Concevoir et développer des systèmes de traitement de données sur GCP

Informations générales

GCP200DE
4 jours (28h)
3 250 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Concevoir des systemes de traitement de donnees evolutifs dans Google Cloud.
  • Differencier les architectures de donnees et implementer les concepts de lakehouse et de pipelines de donnees.
  • Construire et gerer des pipelines de donnees robustes en streaming et en batch.
  • Utiliser les outils IA/ML pour optimiser les performances et obtenir des informations sur les processus et les donnees.

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Ingenieurs de données
  • Analystes de données
  • Architectes de données

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Comprehension des principes d'ingenierie des donnees, y compris les processus ETL/ELT, la modelisation des donnees et les formats de donnees courants (Avro, Parquet, JSON).
  • Familiarite avec les concepts d'architecture de donnees, en particulier les entrepots de donnees (Data Warehouses) et les lacs de donnees (Data Lakes).
  • Maitrise de SQL pour l'interrogation des donnees.
  • Maitrise d'un langage de programmation courant (Python recommande).
  • Familiarite avec l'utilisation des interfaces de ligne de commande (CLI).
  • Familiarite avec les concepts et services de base de Google Cloud (Compute, Storage et gestion des identites).

Programme de la formation

Acquerez une experience pratique dans la conception et la creation de systemes de traitement de donnees sur Google Cloud. Ce cours utilise des presentations, des demonstrations et des travaux pratiques pour vous montrer comment concevoir des systemes de traitement de donnees, creer des pipelines de donnees de bout en bout, analyser des donnees et implementer le machine learning. Ce cours couvre les donnees structurees, non structurees et en streaming.

Introduction a l'ingenierie des données sur Google Cloud

  • Taches et composants de l'ingenierie des donnees
  • Le modele de pipeline de donnees d'extraction et de chargement
  • Le modele de pipeline de donnees d'extraction, de chargement et de transformation
  • Le modele de pipeline de données d'extraction, de transformation et de chargement
  • Techniques d'automatisation

Construire des lacs de données et des entrepots de données avec Google Cloud

  • Introduction a l'ingenierie des donnees moderne sur Google Cloud
  • Construire un lakehouse de donnees avec Cloud Storage, les formats ouverts et BigQuery
  • Moderniser les entrepots de donnees avec BigQuery et BigLake
  • Modeles avances de lakehouse et gouvernance des donnees

Construire des pipelines de données en batch sur Google Cloud

  • Quand choisir les pipelines de donnees en batch
  • Concevoir et construire des pipelines de donnees en batch evolutifs
  • Controler la qualite des donnees dans les pipelines de donnees en batch
  • Orchestrer et surveiller les pipelines de donnees en batch

Construire des pipelines de données en streaming sur Google Cloud

  • Cas d'utilisation du streaming et architectures de reference
  • Plongee approfondie dans les produits
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 11/03/2026
Le contenu peut faire l'objet de légères adaptations selon les besoins et la progression des participants.