Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Séminaire BigData : concepts et enjeux

Séminaire BigData : concepts et enjeux

Objectifs

  • Comprendre les concepts et les apports du BigData, les impacts sur l'organisation de l'entreprise.

Public

  • Chefs de projets,
  • Architectes,
  • Data-scientists,
  • Toute personne souhaitant comprendre les impacts du BigData sur l'entreprise au niveau du traitement des données, des architectures, de l'organisation.

Prérequis

  • Avoir une bonne culture générale sur les systèmes d'information.

Programme de la formation

Introduction

  • A l'origine du BigData : traitement de volumes importants de données non structurées, traitements optimisés de flux de données au fil de l'eau, liés aux nouvelles technologies et aux nouveaux usages.
  • Domaines concernés : recherche scientifique, médical, e-commerce, sécurité, prédictif, ...
  • Exemples : lutte contre la criminalité, fraude, santé, ressources énergétiques
  • Apports des évolutions techniques sur différents aspects : stockage, indexation/recherche, calcul.
  • Concepts clés : ETL, Extract Transform Load, CAP, 3V, 4V, données non structurées, prédictif, Machine Learning.
  • Quelques applications : Watson (IBM), Amazon Rekognition
  • Le positionnement des technologies de cloud, BigData et noSQL, de data-mining. Eléments d'architecture.
  • Gouvernance des données : importance de la qualité des données, fiabilité, durée de validité, sécurité des données
  • Aspects législatifs : sur le stockage, la conservation de données, etc ... sur les traitements, la commercialisation des données, des résultats

Stockage distribué

  • Caractéristiques NoSQL
  • Les différents modes et formats de stockage. Besoin de distribution.
  • Définition de la notion d'élasticité.
  • Principe du stockage réparti :
  • Définitions : réplication, sharding, gossip protocol, hachage,
  • Systèmes de fichiers distribués : GFS, HDFS, Ceph
  • Les bases de données : Cassandra, HBase, MongoDB, CouchBase, Riak, BigTable, ...

Calcul et restitution

  • Apport des outils de calculs statistiques
  • Langages adaptés aux statistiques, liens avec les outils BigData.
  • Outils de calcul et visualisation :
  • R, SAS, Spark, Tableau, QlikView, ...
  • Caractéristiques et points forts des différentes solutions.

Evolutions

  • Liens vers les nouveaux métiers : Hadoop scientists, Data scientists, CDO.
  • Analyse des données au service de l'entreprise
  • Rôle de la DSI dans la démarche BigData.
  • Ouverture sur l'OpenData : principe, la démarche publique, les licences.
  • Exemple : portail data.gouv.fr
  • Les offres Saas BigData comme Google BigQuery.
  • Les limites.
  • Les nouveautés annoncées.

Méthode pédagogique

Un support de cours est remis à chaque participant. La théorie est complétée par des cas pratiques ou exercices discutés avec le formateur.

Méthode d'évaluation

Le cours est agrémenté de questions et mises en situation pour maximiser l'apprentissage. A l'issue de la formation, un questionnaire de satisfaction sera à compléter en ligne.