Google Cloud Platform - Ingénierie de données
Concevoir et développer des systèmes de traitement de données sur GCP
Si les bénéfices liés à l’adoption du Cloud sont aujourd’hui nombreux (disponibilité, agilité, adaptabilité, gains financiers,...), l’une des principales vertus de cette révolution est de pouvoir accéder à des outils et à des puissances de traitement qu’il serait bien souvent difficile de s’offrir (et de rentabiliser) dans un modèle traditionnel. C’est notamment dans le cadre du traitement et de l’analyse de très importants volumes de données (Big Data) que se mesure sans doute le mieux cet avantage. Comme tous les grands acteurs du Cloud, Google propose ainsi de nombreux services dédiés au traitement et à l’analyse dite de type Big Data ainsi que des solutions permettant de tirer par exemple parti du Machine Learning. Les participants à cette formation apprendront à concevoir des systèmes de traitement de données, à créer des pipelines de données, à réaliser des traitements sur des données structurées et non structurées et enfin à exploiter ces données grâce à de puissants outils d’analyse.
Objectifs
- Savoir concevoir et développer des systèmes de traitement de données sur Google Cloud Platform
- Savoir traiter des données par lot ou par flux en implémentant des pipelines de données d'autoscaling sur Cloud Dataflow
- Comprendre comment obtenir des informations métier à partir de très grands ensembles de données à l'aide de Google BigQuery
- Pouvoir établir des prédictions avec des modèles de Machine Learning en utilisant Tensorflow et Cloud ML
- Savoir tirer parti des données non structurées à l'aide de Spark et des API de Machine Learning sur Cloud Dataproc
- Comprendre comment activer Instant Insights à partir des données par flux
Public
- Développeurs expérimentés en charge des transformations du Big Data
Prérequis
- Avoir suivi la formation "Google Cloud Platform - Les fondamentaux du Big Data et du Machine Learning" ou bénéficier d'une expérience équivalente
- Maîtriser les principes de base des langages de requête courants tels que SQL
- Avoir de l'expérience en modélisation, extraction, transformation et chargement des données
- Savoir développer des applications à l'aide d'un langage de programmation courant tel que Python
- Savoir utiliser le Machine Learning et/ou les statistiques
- Pour suivre cette formation dans des conditions optimales, nous vous recommandons de venir en formation avec un ordinateur portable
Certification
Cette formation prépare au test "Professional Data Engineer" et entre en jeu dans le cursus de certification "Google Cloud Certified Professional Data Engineer".