Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
> > > Google BigQuery pour les Data Analystes (CPB 200)

Google BigQuery pour les Data Analystes (CPB 200)

google

Découvrez comment stocker, transformer, analyser et visualiser des données à l'aide de Google BigQuery. Lors de cette formation, les participants découvrent Google BigQuery. Grâce à une combinaison de présentations animées par un formateur, de démonstrations et de travaux pratiques, ils apprennent à stocker, transformer, analyser et visualiser des données à l'aide de Google BigQuery.

Objectifs

  • Découvrir les objectifs et cas d'utilisation de Google BigQuery
  • Partager les meilleures pratiquesdes clients qui ont utilisé Google BigQuery pour améliorer leurs activités
  • Identifier l'architecture de BigQuery et voircomment les requêtes sont traitées
  • Interagir avec BigQuery à l'aide de l'interface utilisateur Web et de l'interface en ligne de commande
  • Définir les objectifs et la structure des schémas BigQuery et des types de données
  • identifier les avantages des tables de destinations BigQuery et de la mise en cache
  • Utiliser les travaux BigQuery
  • Transformer et charger des données dans BigQuery
  • Exporter des données de BigQuery
  • Stocker les résultats de la requête dans une table de destination
  • Créer une requête fédérée
  • Exporter les données du journal vers BigQuery et l'interroger
  • Comprendre la structure de prix BigQuery et évaluer les mécanismes de contrôle des coûts de requête et de stockage
  • Partager les meilleures pratiques pour optimiser les performances des requêtes
  • Résoudre les erreurs courantes dans BigQuery
  • Utiliser diverses fonctions BigQuery
  • Utiliser des outils externes tels que des feuilles de calcul pour interagir avec BigQuery
  • Visualiser les données BigQuery
  • Utiliser les contrôles d'accès pour restreindre l'accès aux données BigQuery
  • Interroger les données Google Analytics Premium exportées vers BigQuery

Public

  • Cette formation vise les analystes de données et data scientists chargés d'analyser et visualiser des big data, mettre en oeuvre des solutions Big Data basées sur le cloud,déployer ou migrer des applications Big Data vers le cloud public, implémenteret maintenir des environnements de stockage de données à grande échelle, etc.

Prérequis

  • Avoir suivi la formation sur les principes de base de Google Cloud Platform (GO8324) ou de Google Cloud Platform sur les données massives et le Machine Learning (GO8325), ou posséderune expérience équivalente
  • Avoir de l'expérience dans l'utilisation d'un langage de requête de type SQL pour analyser les données

Programme de la formation

Présentation de Google BigQuery

  • Objectif et cas d'utilisation de Google BigQuery
  • Comment les clients ont utilisé Google BigQuery pour améliorer leurs activités
  • S'inscrireà Google Cloud Platform
  • Créer un projet à l'aide de la console Cloud Platform

Présentation fonctionnelle de BigQuery

  • Composants d'un projet BigQuery
  • Comment BigQuery stocke les données et énumère les avantages du modèle de stockage
  • Architecture de BigQuery et comment les requêtes sont traitées
  • Méthodes d'interaction avec BigQuery
  • Caractéristiques de l'interface utilisateur Web BigQuery
  • Comment utiliser le shell bq
  • Exécuter des requêtes à l'aide de la CLI BigQuery dans Cloud Shell

Principes fondamentaux de BigQuery

  • Objectif de la dénormalisation des données
  • Objectif et structure des schémas BigQuery et des types de données
  • Types d'actions disponibles dans les travaux BigQuery
  • But et avantages des tables de destinations BigQuery et de la mise en cache
  • Comment les données sont organisées dans BigQuery
  • Deux types de schémas de table
  • Gestion des Jobs et comment les annuler
  • Tables de mise en cache et de destination

Ingérer, transformer et stocker des données

  • Méthodes d'acquisition de données, de transformation de données et de stockage de données à l'aide de BigQuery
  • Fonction des requêtes fédérées BigQuery
  • Charger un fichier CSV dans une table BigQuery à l'aide de l'interface utilisateur Web
  • Charger un fichier JSON dans une table BigQuery à l'aide de l'interface de ligne de commande
  • Transformer les données et joignez les tables à l'aide de l'interface utilisateur Web
  • Stocker les résultats de la requête dans une table de destination
  • Interroger une table de destination à l'aide de l'interface utilisateur Web pour vérifier que les données ont été correctement transformées et chargées
  • Exporter les résultats de la requête d'une table de destination vers Google Cloud Storage
  • Créer une requête fédérée qui interroge des données dans Cloud Storage
  • Configurer Google Cloud Logging pour exporter les données du journal App Engine à partir de l'application Guestbook
  • Utiliser l'interface utilisateur Web BigQuery pour interroger les données de journal

Prix et quotas

  • Avantages du modèle de tarification BigQuery
  • Utiliser le calculateur de tarification pour calculer les coûts de stockage et de requête
  • Les quotas qui s'appliquent aux projets BigQuery
  • Évaluer la taille d'une requête dans BigQuery à l'aide de l'interface utilisateur Web BigQuery
  • Utiliser le calculateur de prix et la taille totale de la requête pour estimer le coût de la requête
  • Comment la modification d'une requête affecte le coût de la requête

Clauses et fonctions

  • Différences entre BigQuery SQL et ANSI SQL
  • Objectif et cas d'utilisation pour les fonctions définies par l'utilisateur
  • Objectif de diverses fonctions BigQuery
  • Créer et exécuter une requête en utilisant une fonction générique
  • Créer et exécuter une requête en utilisant une fonction de fenêtre
  • Créer et exécuter une requête à l'aide d'une fonction définie par l'utilisateur

Champs imbriqués et répétés

  • Objectif et structure des champs BigQuery imbriqués, répétés et imbriqués répétés
  • Cas d'utilisation pour les champs répétés imbriqués, répétés et imbriqués
  • Créer une table BigQuery à l'aide de données imbriquées
  • Exécuter des requêtes pour explorer la structure des données imbriquées
  • Créer une table BigQuery en utilisant des données répétées
  • Exécuter des requêtes pour explorer la structure des données répétées
  • Créer une table BigQuery à l'aide de données répétées imbriquées
  • Exécuter des requêtes pour explorer la structure des données répétées imbriquées

Performance de requête

  • Impact des éléments suivants dans les performances des requêtes: JOIN et GROUP BY, caractères génériques de table et décorateurs de table
  • Diverses bonnes pratiques pour optimiser les performances des requêtes
  • Utiliser la dénormalisation pour améliorer les performances des requêtes
  • Utiliser des sous-sélections pour améliorer les performances des requêtes avec les clauses JOIN
  • Utiliser les tables de destination pour réduire les coûts lors de l'exécution de plusieurs requêtes similaires
  • Utiliser des décorateurs de table et des caractères génériques de table pour améliorer les performances des requêtes et réduire les coûts

Dépannage des erreurs

  • Comment gérer les erreurs BigQuery les plus courantes: demander des erreurs de codage, des erreurs de ressources et des erreurs HTTP
  • Corriger les requêtes qui génèrent des messages d'erreur liés à la syntaxe
  • Corriger une erreur impliquant l'ordre d'une clause JOIN
  • Corriger une erreur impliquant un nom de table non valide
  • Modifier les requêtes qui dépassent les contraintes de ressources

Contrôle d'accès

  • But des listes de contrôle d'accès dans BigQuery
  • Les rôles de projet et de jeu de données disponibles dans BigQuery
  • Appliquer les vues pour la sécurité au niveau de la ligne
  • Gérer l'accès aux ensembles de données à l'aide des listes de contrôle d'accès au niveau du projet
  • Gérer l'accès aux ensembles de données à l'aide d'ACL au niveau de l'ensemble de données
  • Définir les autorisations au niveau de la ligne à l'aide des vues

Exportation de données

  • Méthodes d'exportation des données de BigQuery et des formats de données disponibles
  • Processus de création d'un travail pour exporter des données depuis BigQuery
  • Objectif des exportations génériques pour partitionner les données d'exportation
  • Exporter les données de BigQuery à l'aide de l'interface utilisateur Web et de l'interface de ligne de commande
  • Exporter de grandes tables à l'aide d'URI génériques

Interfaçage avec des outils externes

  • Comment utiliser des outils externes pour s'interfacer avec BigQuery, notamment: les tableurs, les pilotes ODBC et JDBC, le client crypté BigQuery et R
  • Configurer le module complémentaire BigQuery Reports pour Google Sheets
  • Utiliser le module Rapports pour interroger les données BigQuery

Travailler avec les données Premium de Google Analytics

  • Schéma des données Google Analytics Premium et AdSense exportées vers BigQuery
  • Générer des requêtes pour analyser les données de Google Analytics Premium

Visualisation des données

  • Options disponibles pour visualiser les données BigQuery
  • Utiliser Google Cloud Datalab pour visualiser les données