Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > éditeurs > Amazon (AWS) > AWS : Big Data sur Amazon Web Services

AWS : Big Data sur Amazon Web Services

aws

La formation Big Data sur AWS présente des solutions de Big Data basées sur le cloud ainsi qu'Amazon Elastic MapReduce (EMR), la plate-forme de Big Data d'AWS, Amzaon Redshift et Amazon Kinesis. Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Hive et Hue. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift et Amazon Kinesis, Amazon QuickSight, Amazon Athena et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.

Objectifs

  • Solutionner Fit AWS au sein d'un écosystème Big Data
  • Comprendre les applications Apache Hadoop dans le contexte d'Amazon EMR
  • Identifier les composants d'un cluster Amazon EMR
  • Lancer et configurer un cluster Amazon EMR
  • Utiliser les frameworks de programmation courants disponibles pour Amazon EMR notamment Hive, Pig and Streaming.
  • Utiliser Hue pour améliorer la facilité d'utilisation de Amazon EMR
  • Utiliser les analyses en mémoire avec Spark sur Amazon EMR
  • Choisir les options de stockage de données appropriées
  • Identifier les avantages de l'utilisation de Amazon Kinesis pour le process Big Data proches du temps réel
  • Utiliser Amazon Redshift pour stocker et analyser efficacement les données
  • Comprendre et gérer les coûts et la sécurité d'une solution Big Data
  • Sécuriser une solution Big Data
  • Identifier les options pour récupérer, transférer et compresser des données
  • Comprendre Amazon Athena pour les analyses de requêtes ad-hoc
  • Utiliser le logiciel de visualisation pour représenter les données et les requêtes via Amazon QuickSight
  • Orchestrer le flux de la Big Data via AWS Data Pipeline

Public

  • Personnes en charge de la conception et de l'implémentation de solutions de Big Data, c'est-à-dire les architectes de solutions ainsi que les analystes de données souhaitant découvrir les solutions de Big Data sur AWS.

Prérequis

  • Avoir des connaissances de base sur les technologies Big Data, notamment Apache Hadoop et HDFS Pig, Hive et MapReduce.
  • Savoir utiliser les principaux services AWS et l'implémentation de cloud public.
  • Les participants doivent avoir suivi le cours Notions de base AWS ou posséder un niveau d'expérience équivalent.
  • La compréhension des concepts d'entrepôt de données, de système de base de données relationnelle et de conception de base données est recommandée.

Programme de la formation

Vue d'ensemble de la Big data

Récupérer et transférer la Big Data

Streaming Big Data et Amazon Kinesis

Solutions de stockage Big Data

Process Big Data et Analyse

Apache Hadoop et Amazon EMR

Utiliser Amazon EMR

Frameworks de programmation Hadoop

Inetrfaces Web sur Amazon EMR

Apache Spark sur Amazon EMR

Amazon Redshift et Big Data

Visualiser et Orchestrer la Big Data

Gérer les coûts de la Big Data

Sécuriser les déploiements de votre Amazon

Modèles de conception Big Data

Méthode pédagogique

Un support de cours est remis à chaque participant. La théorie est complétée par des cas pratiques ou exercices discutés avec le formateur.