Organisme de Formation aux technologies et métiers de L'informatique

Formation Bases de données NoSQL, enjeux et solutions

Informations générales

NSQ
2 jours (14h)
1 990 €HT
repas inclus

Objectifs

Après ce cours, vous serez capable de :

  • Identifier les différences des BDD SQL et des BDD NoSQL
  • Évaluer les avantages et les inconvénients inhérents aux technologies NoSQL
  • Analyser les principales solutions du monde NoSQL
  • Identifier les champs d'application des BDD NoSQL
  • Identifier les différentes architectures, les modèles de données, les implémentations techniques

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Direction informatique et fonctionnelle
  • Responsable informatique
  • Chef de projet
  • Architecte
  • Développeur

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Connaissances de base des architectures techniques et du management SI
  • Connaissances de bases de données

Programme de la formation

Les bases de données NoSQL proposent une nouvelle approche répondant à des besoins de volumétrie et de nouveaux types de données. Ce séminaire présente les raisons qui ont mené à ces bases, leurs architectures, leurs bénéfices et leurs limites ainsi que les produits existants.

Introduction au NoSQL

  • L'historique du mouvement NoSQL.
  • Les différentes approches de gestion de BDD à travers le temps : hiérarchiques, relationnelles, objets, XML, NoSQL.
  • Les grands acteurs à l'origine du mouvement NoSQL et du Big Data analytique : Google et Amazon.
  • Données structurées, semi-structurées et non-structurées : provenance, typologie...
  • Vue synoptique des différents types de moteurs NoSQL du point de vue du modèle de données.
  • Le NoSQL, le Big Data et les architectures Cloud: principes d'architecture communs et divergents.
  • Les modes de distribution : avec maître et décentralisé.
  • Le positionnement du NoSQL au sein du Big Analytics : de l'ère de la transaction à l'ère de l'interaction.
  • Réflexion collective : Pourquoi le NoSQL ? Et pourquoi son succès ? Les besoins, l'évolution des architectures, la distribution et l'élasticité, le commodity hardware, quelques scénarios d'utilisation.

Le Relationnel et le NoSQL

  • Les bases de données relationnelles : leurs forces et leurs limites.
  • Structuration forte des données (schéma explicite) versus structure souple (schéma implicite) et la modélisation Agile.
  • Des qualités ACID aux qualités BASE.
  • Théorème CAP (cohérence, disponibilité, tolérance au partitionnement).
  • Les différents niveaux de cohérence.
  • Le langage SQL, la performance des jointures. L'accès par la clé en NoSQL.
  • L'évolution vers le distribué : extensibilité verticale et horizontale.
  • Comprendre le NoSQL par le modèle de l'agrégat et de la centralité de la donnée.
  • Réflexion collective : Comment choisir ? (Le modèle de l'agrégat versus le modèle relationnel), comment gérer l'interopérabilité ?

Les mondes du NoSQL

  • Monde du NoSQL à travers ses choix techniques et différentes bases NoSQL libres (du moins structuré au plus structuré).
  • L'architecture distribuée : principes, le shared-nothing.
  • Disponibilité et cohérence différée : gossip, timestamps, vector clock, règle de majorité, arbre de Merkle.
  • Les patterns et les modèles. Comment modéliser et travailler efficacement en NoSQL.
  • Différents modèles de connexion avec le client : sur cluster décentralisé, protocoles comme Thrift ou ProtoBuf, REST...
  • Les bases orientées clé-valeur et en mémoire : Redis, Riak, Projet Voldemort, Aerospike.
  • Les bases orientées documents : Le format JSON. Couchbase Server, MongoDB, Elasticsearch.
  • Les bases orientées colonne distribuées pour le Big Data opérationnel : Hadoop, Hbase, Cassandra, Accumulo...
  • Les moteurs orientés graphes : Neo4j, OrientDB...
  • L'écosystème Hadoop : les différences avec les SGBDR, les relations avec le NoSQL.
  • Démonstration : Démonstrations techniques, du point de vue de développement, de la mise en œuvre et de l'administration, des principaux moteurs NoSQL libres.

NoSQL et Big Data

  • Big Data analytique : l'écosystème Hadoop.
  • Stockage et traitements. Les différentes formes de stockage dans HDFS : SequenceFile, Apache Parquet.
  • Différents types de traitements : MapReduce, Graphe orienté acyclique, flux, Machine Learning, de graphes distribué...
  • Les architectures Big Data : traitements batch, micro-batch, flux. Architecture Lambda, architecture Kappa.
  • Les outils intégrés : Apache Spark, Apache Flink.
  • Les outils d'analyses de données : développement pour l'analyse Big Data, les outils du Data Scientist.
  • La pérennité des outils du Big Data analytique devant l'évolution très rapide des frameworks.
  • Démonstration : Démonstrations de l'usage d'une plate-forme intégrée de Big Data analytique comme Apache Spark.

Choisir et mettre en place

  • Le type d'utilisation propice au NoSQL. À quels usages correspondent les bases NoSQL ?
  • Les choix matériels.
  • Qu'est-ce qu'un modèle de données NoSQL ?
  • Comment aborder la migration ?
  • Les impacts sur le développement client. Comment développer efficacement avec des bases NoSQL ?
  • Quels outils de supervision et comment les choisir ?
  • Quelle est la complexité administrative et la courbe d'apprentissage ?
  • Cas d'utilisation dans des entreprises existantes.
  • Et les performances ? Quelques benchmarks.
  • Qu'est-ce que NewSQL ?
  • Réflexion collective : Quel est l'intérêt de déployer des moteurs NoSQL dans le contexte de chacun et quel moteur NoSQL choisir ?
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 08/11/2023