Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
> > > From Data to Insights with Google Cloud (GCPBID)

From Data to Insights with Google Cloud (GCPBID)

google

Vous voulez savoir comment interroger et traiter des pétaoctets de données en quelques secondes ? Êtes-vous curieux de savoir que l'analyse des données évolue automatiquement à mesure que vos données grandissent ? Bienvenue dans le cours Data Insights ! Ce cours explique aux participants comment obtenir des informations grâce à l'analyse et à la visualisation de données à l'aide de la plate-forme Google Cloud. Le cours propose des scénarios interactifs et des travaux pratiques au cours desquels les participants explorent, extraient, chargent, visualisent et extraient des informations à partir de divers ensembles de données Google BigQuery. Le cours couvre le chargement de données, l'interrogation, la modélisation de schéma, l'optimisation des performances, la tarification de l'interrogation et la visualisation de données.

Objectifs

  • Tirer parti des informations à partir des données à l'aide des outils d'analyse et de visualisation de la plateforme Google Cloud.
  • Interroger de manière interactive des ensembles de données à l'aide de Google BigQuery
  • Charger, nettoyer et transformer les données à l'échelle
  • Visualiser les données à l'aide de Google Data Studio et d'autres plateformes tierces
  • Faire la distinction entre les analyses exploratoire et explicative et le moment d'utiliser chaque approche
  • Explorer de nouveaux jeux de données et découvrez des informations cachées rapidement et efficacement
  • Optimiser les modèles de données et les requêtes pour le prix et la performance

Public

  • Analystes de données, Business Analysts, professionnels de la Business Intelligence
  • Ingénieurs de données dans le cloud qui collaboreront avec des analystes de données pour créer des solutions de données évolutives sur la plate-forme Google Cloud

Prérequis

  • Maîtrise des bases avec ANSI SQL

Programme de la formation

Module 1: Introduction aux données sur la plateforme Google Cloud

  • Avant et maintenant: Analyse de données évolutive dans le cloud
  • Sujets couverts
  • Souligner les problèmes d’analyse auxquels font face les analystes de données
  • Comparez les données volumineuses sur site et dans le cloud
  • Apprenez des exemples concrets d'entreprises transformées grâce à Analytics sur le cloud
  • Parcourir les bases du projet de la plateforme Google Cloud
  • Atelier: Initiation à Google Cloud Platform

Module 2: Présentation des outils Big Data

  • Affûter les outils dans votre boîte à outils Data Analyst
  • Sujets couverts
  • Procédures pas à pas d'analyste de données, défis et présentation des outils de données de la plateforme Google Cloud
  • Démo: Analysez 10 milliards de disques avec Google BigQuery
  • Explorez 9 fonctionnalités fondamentales de Google BigQuery
  • Comparaison des outils GCP pour les analystes, les informaticiens et les ingénieurs de données
  • Atelier: Exploration de jeux de données avec Google BigQuery

Module 3: Explorer vos données avec SQL

  • Familiarisez-vous avec Google BigQuery et découvrez les meilleures pratiques SQL
  • Sujets couverts
  • Comparer les techniques courantes d'exploration de données
  • Apprenez à coder du code SQL standard de haute qualité
  • Explorez les jeux de données publics BigQuery de Google
  • Aperçu de la visualisation: Google Data Studio
  • Atelier: Résoudre les erreurs SQL courantes

Module 4: Tarification Google BigQuery

  • Calculer les coûts de stockage et de requête Google BigQuery
  • Sujets couverts
  • Procédure pas à pas d'un travail BigQuery
  • Calculer la tarification BigQuery: coûts de stockage, d'interrogation et de streaming
  • Optimiser les requêtes pour le coût
  • Laboratoire: Calculer le tarif Google BigQuery

Module 5: Nettoyer et transformer vos données

  • Transformez vos données brutes en un jeu de données plus propre et plus riche
  • Sujets couverts
  • Examiner les 5 principes d'intégrité de l'ensemble de données
  • Caractériser la forme et l'inclinaison du jeu de données
  • Nettoyer et transformer les données en utilisant SQL
  • Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur: Présentation de Cloud Dataprep
  • Atelier: Exploration et mise en forme de données avec Cloud Dataprep

Module 6: Stockage et exportation de données

  • Créer de nouvelles tables et exporter les résultats
  • Sujets couverts
  • Comparer les tables permanentes et temporaires
  • Enregistrer et exporter les résultats de la requête
  • Aperçu des performances: cache de requête
  • Atelier: Créer de nouvelles tables permanentes

Module 7: Intégration de nouveaux jeux de données dans Google BigQuery

  • Introduisez vos données dans le cloud
  • Sujets couverts
  • Requête à partir de sources de données externes
  • Évitez les pièges d'ingestion de données
  • Intégrer de nouvelles données dans des tables permanentes
  • Discuter des inserts en streaming
  • Atelier: Acquisition et interrogation de nouveaux jeux de données

Module 8: Visualisation des données

  • Explorez et expliquez efficacement vos données grâce à la visualisation
  • Sujets couverts
  • Vue d'ensemble des principes de visualisation de données
  • Approches d'analyse exploratoire vs explicative
  • Démo: interface utilisateur de Google Data Studio
  • Connectez Google Data Studio à Google BigQuery
  • Atelier: Exploration d'un jeu de données dans Google Data Studio

Module 9: Jointure et fusion de jeux de données

  • Combinez et enrichissez vos jeux de données avec plus de données
  • Sujets couverts
  • Fusionner des tables de données historiques avec UNION
  • Introduire des wildcards de table pour des fusions faciles
  • Examiner les schémas de données: Lier des données sur plusieurs tables
  • Procédure pas à pas pour rejoindre des exemples et des pièges
  • Laboratoire: Jointure et union de données de plusieurs tables

Module 10: Plongée Profonde dans la table Google BigQuery

  • Qu'est-ce qui distingue l'architecture Cloud?
  • Sujets couverts
  • Comparer les méthodes de stockage de l'entrepôt de données
  • Plongée profonde dans le stockage en colonne
  • Examiner les vues logiques, les tables avec partitionnement par date et les meilleures pratiques
  • Interrogez le passé avec des instantanés

Module 11: Conception de schéma et structures de données imbriquées

  • Modélisez vos jeux de données pour la balance dans Google BigQuery
  • Sujets couverts
  • Comparez Google BigQuery et l’architecture de données de SGBDR classique
  • Normalisation vs dénormalisation: compromis entre performances
  • Révision du schéma: le bon, le mauvais et le truand
  • Tableaux et données imbriquées dans Google BigQuery
  • Laboratoire: Interrogation de données imbriquées et répétées

Module 12: Visualisation avancée avec Google Data Studio

  • Créer des tableaux de bord Pixel-Perfect
  • Sujets couverts
  • Créer des instructions de cas et des champs calculés
  • Éviter les pièges de performance avec le cache
  • Partage des tableaux de bord et discussion sur les considérations relatives à l'accès aux données
  • Atelier: Visualiser Insights avec Google Data Studio

Module 13: Fonctions avancées et clauses

  • Plongez dans l'écriture de requêtes avancée avec Google BigQuery
  • Sujets couverts
  • Examiner les déclarations de cas SQL
  • Introduire les fonctions de la fenêtre d'analyse
  • Protéger les données avec le chiffrement de champ à sens unique
  • Discuter de la conception efficace des sous-requêtes et du CTE
  • Comparez les UDF SQL et Javascript
  • Atelier: Dérivation d'Insights avec des fonctions SQL avancées

Module 14: Optimisation des performances

  • Résoudre et résoudre les problèmes de performances de la requête
  • Sujets couverts
  • Évitez les pièges de performance de Google BigQuery
  • Empêcher les points chauds dans vos données
  • Diagnostiquer les problèmes de performances avec la mappe Explication de requête
  • Atelier: Optimisation et dépannage des performances de requête

Module 15: Insights avancés

  • Pensez, analysez et partagez des aperçus comme un scientifique de données
  • Sujets couverts
  • Distiller des requêtes complexes
  • Réfléchissez sur des hypothèses basées sur les données
  • Pensez comme un scientifique de données
  • Présentation de Cloud Datalab
  • Atelier: Lecture d'un ordinateur portable Google Cloud Datalab

Module 16: Accès aux données

  • Gardez la sécurité des données à l'esprit dans le cloud
  • Sujets couverts
  • Comparaison des rôles de jeux de données IAM et BigQuery
  • Évitez les pièges d'accès
  • Examiner les membres, les rôles, les organisations, l'administration des comptes et les comptes de service