Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > éditeurs > Google > Google Cloud Platform - Les fondamentaux du Big Data et du Machine Learning

Google Cloud Platform - Les fondamentaux du Big Data et du Machine Learning

Les fondamentaux du Big Data et du Machine Learning sur Google Cloud Platform

google

Objectifs

  • Comprendre l'utilité et la valeur des principaux produits Big Data et Machine Learning de Google Cloud Platform
  • Savoir utiliser Cloud SQL et Cloud Dataproc pour migrer les workloads MySQL et Hadoop / Pig / Spark / Hive existantes vers Google Cloud Platform
  • Comprendre comment utiliser BigQuery et Cloud Datalab pour effectuer une analyse interactive des données
  • Être capable de créer et d'utiliser un réseau de neurones à l'aide de TensorFlow
  • Comprendre comment utiliser des API Machine Learning
  • Savoir choisir parmi différents produits de traitement de données sur Google Cloud Platform

Public

  • Analystes de données, data scientists et analystes d'affaires qui font leurs premiers pas avec Google Cloud Platform
  • Toute personne en charge des opérations suivantes : conception de pipelines et d'architectures pour le traitement de données, création et gestion de modèles de Machine Learning et de modèles statistiques, interrogation d'ensembles de données, visualisation de résultats de requête, et création de rapports
  • Cadres dirigeants et décideurs informatiques qui évaluent la pertinence de Google Cloud Platform pour les data scientists

Prérequis

  • Maîtriser les principes de base des langages de requête courants tels que SQL
  • Avoir de l'expérience en modélisation, extraction, transformation et chargement des données
  • Savoir développer des applications à l'aide d'un langage de programmation courant tel que Python
  • Savoir utiliser le Machine Learning et/ou les statistiques
  • Pour suivre cette formation dans des conditions optimales, nous vous recommandons de venir en formation avec un ordinateur portable

Programme de la formation

Présentation de Google Cloud Platform

  • Présentation des principes de base de Google Cloud Platform
  • Produits de Big Data Google Cloud Platform

Principes de base du calcul et du stockage

  • CPU à la demande (Compute Engine)
  • Un système de fichiers à l'échelle mondiale (Cloud Storage)
  • Cloud Shell
  • Atelier : Configurer un pipeline de traitement de données (Ingestion-Transformation-Publication)

L'analyse de données dans le Cloud

  • Transition pas-à-pas vers le Cloud
  • Cloud SQL : votre base de données SQL dans le cloud
  • Atelier : Importer des données dans Cloud SQL et exécuter des requêtes
  • Spark sur Dataproc
  • Atelier : Recommandations pour le Machine Learning – Spark sur Dataproc

Évolutivité de l'analyse des données

  • Accès aléatoire rapide
  • Datalab
  • BigQuery
  • Atelier : Créer un ensemble de données de Machine Learning

Machine Learning

  • Machine Learning avec TensorFlow
  • Atelier : Exécuter le ML avec TensorFlow
  • Modèles prédéfinis pour les besoins courants
  • Atelier : Utiliser les API de ML

Architectures de traitement de données

  • Architectures de messagerie avec Pub/Sub
  • Créer des pipelines avec Dataflow
  • Architecture de référence pour le traitement des données en temps réel et par lots

Résumé

  • Pourquoi utiliser GCP ?
  • Quelles sont les prochaines étapes ?
  • Autres ressources

Certification

Cette formation prépare au test "Professional Data Engineer" et entre en jeu dans le cursus de certification "Google Cloud Certified Professional Data Engineer".