Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Data Science - Les fondamentaux

Data Science - Les fondamentaux

Présentation des outils et méthodologies de la Data Science

La Data Science est l'application de méthodes scientifiques mathématiques et statistiques au traitement de l'information. Dans le domaine du Big Data, le volume de données exploitables à disposition ne représenterait aucun intérêt s'il n'y avait pas l'intervention de la Data Science pour réaliser les premiers traitements préparatoires qui permettront par la suite leur interprétation par diverses solutions d'Intelligence Artificielle. Toute personne en charge de l'intégration d'une solution Big Data dans son entreprise devrait commencer par aborder les notions fondamentales de Data Science (méthodes et potentiels). En participant à ce séminaire de 2 jours, les participants s'initieront à la transformation de données pour aboutir aux interprétations les plus avancées rendues possibles par le Machine Learning et le Deep Learning.

Objectifs

  • Découvrir le monde de la Data Science et les grandes problématiques associées
  • Comprendre comment modéliser un problème de Data Science
  • Découvrir l'intérêt et les apports des algorithmes
  • Disposer d'une première approche du Deep Learning

Public

  • Ingénieurs, analystes, responsables marketing
  • Toute personne intéressée par les techniques de Data Science

Prérequis

  • Connaître l'utilité du Data Mining et les problématiques du Big Data dans les approches statistiques

Programme de la formation

Introduction

  • Compétences
  • Data Science
  • Machine Learning
  • Big data
  • Deep learning
  • L'apprentissage machine

Les fondamentaux

  • Approche fonctionnelle de base
  • Les variables prédictives
  • Les variables à prédire
  • Les fonctions hypothèses
  • Les estimateurs (biais et variances)
  • Le compromis biais - variance
  • Les fonctions de perte
  • La régularisation des paramètres
  • Optimisation des paramètres

La classification

  • Régression logistique
  • Machines à vecteurs de support (SVM)
  • Arbres de décisions
  • K plus proches voisins (kNN)

Les pratiques

  • Prétraitement
  • Compressions des données
  • Réglages des modèles

L'apprentissage d'ensembles

  • Principes de l'apprentissage d'ensemble
  • Les forêts aléatoires
  • Le gradient boosting

La régression

  • Principes de la régression
  • Explorations des données régressives
  • Performance des modèles de régression

Le clustering

  • Les k-moyens (kMeans)
  • Le clustering hiérarchique
  • L'approche DBSCAN

Le Deep Learning

  • Perceptron
  • Réseaux neuronaux multicouches (MLP)
  • Réseaux neuronaux convolutifs (CNN)
  • Réseaux neuronaux récursifs (RNN)

Méthode pédagogique

Un programme théorique mais pragmatique : de nombreuses démonstrations mettent en perspectives les notions et concepts abordés. Des consultants expérimentés partagent leurs retours d'expérience avec les participants. Un panorama exhaustif des termes techniques et acronymes propres au domaine de la Data Science. Un contenu, une pédagogie et un discours adaptés à des non-initiés.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.