Organisme de Formation aux technologies et métiers de L'informatique

Formation Big Data - L'essentiel

De la technologie aux usages du Big Data

Informations générales

MAG34
2 jours (14h)
1 950 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Comprendre le concept du Big Data et mesurer ses apports
  • Connaître l'écosystème du Big Data et appréhender les technologies associées
  • Savoir anticiper son intégration dans les activités informatiques de l'entité
  • l'exploiter dans le respect des règles de sécurité et de confidentialité

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Responsables de la DSI s'interrogeant sur les apports et le déploiement du Big Data Chefs de projets, Responsables de métiers et consultants souhaitant aborder les projets Toute personne impliquée dans la réflexion et l'étude du Big Data

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Connaissances sommaires en informatique

Programme de la formation

Le Big Data s'installe désormais dans le paysage des solutions de traitement des données massives. Il permet effectivement, grâce à la maîtrise des informations et des données, d'optimiser la performance opérationnelle de l'entreprise et ainsi de renforcer ses avantages concurrentiels. Si pour certains d'entre nous, le Big Data reste un concept imprécis, pour d'autres, il ouvre donc déjà la voie à de nombreuses applications. Ce séminaire apporte un éclairage sur les usages et les technologies associées au Big Data. Il répond aux questions de son exploitation au sein de l'entreprise ou sous la forme externalisée de Cloud DaaS (Data as a Service).

Exemples d'usage pertinent du Big Data

  • Usages du Big Data chez les géants de l'Internet
  • Usages du Big Data dans les entreprises traditionnelles
  • Exemples de complexité technique et organisationnelle
  • Gestion des clients : CRM : Vue 360° des clients / Multicanal
  • Sécurité informatiques : étude de logs : identification des tentatives d'attaques
  • Analyse des logs d'Internet : Web
  • Profiling d'individus
  • Causes d'échec et d'insatisfaction des projets Big Data : confusion entre la BI évoluée, le Big Data adapté aux entreprises et le Big Data dans sa conception originelle : vélocité, véracité, valeur)

Définition commune du Big Data selon les grands acteurs du marché

  • Concept et apports
  • Architecture technique de l'écosystème de la chaine des valeurs d'une solution de Big Data
  • Caractéristiques techniques des 3V de Gartner et les variantes d'usage : Véracité, Valeur, Validité)
  • Collecte et traitement des données structurées, semi-structurées et non-structurées
  • Création et Transformation des données en informations

Introduction aux architectures des solutions de calcul distribué du Big Data

  • Principe
  • Scalabilité horizontale et verticale
  • Architecture de cluster et composants économiques
  • Traitement parallèle des données
  • Enjeux de sécurité des architectures distribuées, lors de l'intégration dans le système informatique des organisations

Technologies de référence du Big Data à connaître

  • Traitement des données par les clusters : Hadoop
  • Stockage et traitement des données dans le Data Lake, le Lake House : précautions à prendre
  • Différents types de base des données NoSQL selon les usages
  • Hadoop : un modèle de traitement distribué du Big Data adopté par les grands acteurs de l'informatique : HDFS, YARN, MapReduce
  • Ecosystème de Hadoop : Pig, Flume, Zookeeper, HBase, Oozie
  • Analyse de données : 4 types d'analytique
  • Algorithmes et modèles d'IA et Machine Learning pour l'analyse avancée et automatisée

Approches de déploiement du Big Data

  • Déploiement sur site : définition des objectifs, choix des solutions d'analyse et d'intégration, présentation des informations / revue des fournisseurs de composants Big Data
  • Déploiement sur site en version distribuée
  • Déploiement dans les plates-formes Cloud Big Data
  • Précautions à prendre : métriques de qualité, système fermé
  • Difficultés techniques à anticiper
  • Validation de la pertinence d'une plate-forme

Synthèse des plates-formes Cloud public du Big Data Analytiques

  • IBM Analytics
  • Amazon Web Services
  • Google Cloud Platform
  • Microsoft Azure
  • Points communs et différents entre les plates-formes Big Data

Qualité des données

  • Données: la matière première pour construire le Big Data
  • Création des données de qualité
  • Définition et consolidation de la valeur des données
  • Enrichissement des données brutes avec l'Open Data
  • Gouvernance des données pour le maintient de la pertinence des données et Rôle primordial du MDM : Master Data Management

Sécurité des données et confidentialité du Big Data

  • Règlementation RGPD à respecter
  • Recommandation des bonnes pratiques de l'organisme international CSA : Cloud Security Alliance pour le Big Data
  • Panorama des moyens techniques de sécurité des données et d'accès au Datacenter : Cryptage, IDA et DLP
  • Recommandations de sécurité dans la manipulation des données
  • Recours aux technologies d'IA/ML et Cybersécurité pour faire face aux fonctionnalités spécifiques des plateformes de traitement Big Data

Impacts du Big Data à anticiper

  • Adaptation des bonnes pratiques actuelles à l'environnement Big Data
  • Impacts sur les compétences des équipes informatiques en place
  • Nouveaux métiers : Data Scientist, Data Steward et compétences nouvelles à acquérir
  • Rôle de la DSI et de la Direction Numérique face à la montée du Big Data
  • Progression des activités numériques de l'entreprise
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 03/12/2025