Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Enjeux et perspectives du Big Data

Enjeux et perspectives du Big Data

les tendances du big data

Objectifs

  • Identifier les enjeux, opportunités et évolutions du Big Data
  • Définir les enjeux stratégiques et organisationnels des projets Big Data en entreprise
  • Comprendre les technologies principalement utilisées selon les processus de mise en place des projets Big Data
  • Déterminer les éléments de sécurité, d’éthique et les enjeux juridiques
  • Consolider ses connaissances à travers un cas d’usage

Public

  • Managers
  • Chefs et Directeurs de projet
  • Directeurs d’études
  • Data Stewards

Prérequis

  • avoir une bonne culture générale sur les systèmes d'information et/ou les organisations.

Programme de la formation

BIG DATA : ENJEUX ET OPPORTUNITÉS / EVOLUTION DES DONNÉES

  • Le Big Data et ses 4 grands défis : volume, variété, vélocité, véracité.
  • Données massives : Web, réseaux sociaux, Open Data, capteurs, données industrielles.
  • Ouverture des données publiques : le mouvement Open Data.
  • Variété, distribution, mobilité des données sur Internet.
  • Vélocité et flux continus de données.
  • Le Edge Computing, vers une informatique de flux

LES ENJEUX POUR LES ENTREPRISES

  • Le processus de création de valeur grâce au Big Data
  • Véracité des données provenant de sources variées pour la prise de décision.
  • Analyses complexes sur Big Data, Big Analytics.
  • Production d’informations en temps réel à partir de Big Data.
  • Réactivité : traitement de flux de données en temps réel, Complex Event Processing (CEP).
  • Définir sa stratégie de déploiement : Cloud, "on-premise" ou hybride

OPPORTUNITÉS OFFERTES PAR LES PROGRÈS MATÉRIELS

  • Le stockage : Disques durs HDD vs SSD "on premise" et stockage objet ou bloc dans le Cloud.
  • L'impact de la baisse du coût de la mémoire : l’avènement du traitement de données in-memory
  • Couplage CPU/GPU pour une meilleure optimisation du calcul parallèle.
  • Les stratégies de stockage disque en réseau NAS/SAN/Isilon (stockage élastique) : Quels impacts sur les architectures de gestion de données ?
  • Les architectures massivement parallèles (MPP) vs Hadoop
  • Les appliances.

COMPRÉHENSION DES TECHNOLOGIES UTILISÉES / MOTIVATIONS

  • Le théorème CAP (Consistency, Availability, Partition tolerance) : analyse et impact.

LA PILE LOGICIELLE BIG DATA (LA "STACK HADOOP")

  • Les fondamentaux des Big Data
  • L'organisation fonctionnelle et les principaux composants : stockage, organisation, traitement, intégration, outils d’analyse.
  • La gestion de clusters.
  • Les "design pattern" d'Hadoop (architectures Lambda, Kappa, Omega, etc.), pour répondre à quels usages
  • Comparaison avec les SGBD relationnels.

LES DIFFÉRENTES MÉTHODOLOGIES ADAPTÉES AU BIG DATA

  • La gouvernance des projets Big Data
  • Qu'est-ce que la gouvernance
  • Gouvernance des données
  • Gouvernance des projets
  • Organisation et rôles
  • Les grands principes des méthodes agiles
  • Le design thinking pourquoi est-il adapté aux enjeux du Big data ?
  • Les principes de base du design thinking
  • Les méthodes de développement
  • Les impacts sur l'organisation d'une DSI (privilégier la conception collaborative)
  • Intégrer les métiers dès la phase de conception
  • Définir les différents ateliers (modeling, intercation design, prototypage)

LA SÉCURITÉ DU BIG DATA

  • Les 5 cercles de défense du Big Data
  • Protection de la donnée
  • Sécurité périmétrique
  • Gestion des authentifications
  • Gestion des autorisations
  • Sécurité du système d'exploitation

UTILISATION DE LA CRYPTOGRAPHIE

  • Comprendre les fondamentaux (cryptographie, cryptanalyse, kleptographie, etc.).
  • Les trois approches de gestion des clés de chiffrement dans une architecture Big Data.
  • Les enjeux du chiffrement homomorphe.
  • Les outils de data management de la donnée
  • Le chiffrement à la volée avec préservation de format.
  • Les bonnes pratiques en matière de chiffrement et les recommandations de l’ANSSI et de l’ENISA.

AUTRES TECHNIQUES DE PROTECTION DES DONNÉES

  • Comprendre le cycle de vie des données dans une architecture Big Data.
  • Les outils en charge de la gouvernance et du cycle de vie des données
  • La classification des données. L’importance de la classification dans les projets Big Data.
  • L’anonymisation et la pseudonymisation des données.

ÉTHIQUE ET ENJEUX JURIDIQUES / PRINCIPES GÉNÉRAUX DE CONFORMITÉ ET DE RESPONSABILITÉS

  • Responsabilités sur le plan Informatique et Libertés
  • Responsabilités sur le plan identités
  • Responsabilités sur le plan régulation
  • Responsabilités sur le plan économique
  • Responsabilités sur le plan sécurité
  • Responsabilités sur le plan patrimoine
  • Responsabilités sur le plan de l’archivage
  • Responsabilités sur le plan ressources humaines

CAS D’USAGE, RETOURS D’EXPÉRIENCES

  • BNP Paribas Fortis
  • Utilisation de la méthodologie Design Thinking pour aider l'entreprise à devenir Data Centric, c’est-à-dire en partant de zéro, comment se former, se transformer, choisir sa distribution Hadoop, l'installer, la paramétrer, prépa