Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Data Science - Les fondamentaux

Data Science - Les fondamentaux

Présentation des outils et méthodologies de la Data Science

La Data Science est l’application de méthodes scientifiques mathématiques et statistiques au traitement de l’information. Dans le domaine du Big Data, le volume de données exploitables à disposition ne représenterait aucun intérêt s’il n’y avait pas l’intervention de la Data Science pour réaliser les premiers traitements préparatoires qui permettront par la suite leur interprétation par diverses solutions d’Intelligence Artificielle. Toute personne en charge de l’intégration d’une solution Big Data dans son entreprise devrait commencer par aborder les notions fondamentales de Data Science (méthodes et potentiels). En participant à ce séminaire de 2 jours, les participants s’initieront à la transformation de données pour aboutir aux interprétations les plus avancées rendues possibles par le Machine Learning et le Deep Learning.

Objectifs

  • Découvrir le monde de la Data Science et les grandes problématiques associées
  • Comprendre comment modéliser un problème de Data Science
  • Découvrir l'intérêt des algorithmes
  • Disposer d'une première approche du Deep Learning

Public

  • Ingénieurs, analystes, responsables marketing
  • Toute personne intéressée par les techniques de Data Science

Prérequis

  • Connaître l’utilité du Data Mining et les problématiques du Big Data dans les approches statistiques

Programme de la formation

Introduction

  • Compétences
  • Data Science
  • Machine Learning
  • Big data
  • Deep learning
  • L’apprentissage machine

Les fondamentaux

  • Approche fonctionnelle de base
  • Les variables prédictives
  • Les variables à prédire
  • Les fonctions hypothèses
  • Les estimateurs (biais et variances)
  • Le compromis biais - variance
  • Les fonctions de perte
  • La régularisation des paramètres
  • Optimisation des paramètres

La classification

  • Régression logistique
  • Machines à vecteurs de support (SVM)
  • Arbres de décisions
  • K plus proches voisins (kNN)

Les pratiques

  • Prétraitement
  • Compressions des données
  • Réglages des modèles

L'apprentissage d'ensembles

  • Principes de l’apprentissage d’ensemble
  • Les forêts aléatoires
  • Le gradient boosting

La régression

  • Principes de la régression
  • Explorations des données régressives
  • Performance des modèles de régression

Le clustering

  • Les k-moyens (kMeans)
  • Le clustering hiérarchique
  • L’approche DBSCAN

Le Deep Learning

  • Perceptron
  • Réseaux neuronaux multicouches (MLP)
  • Réseaux neuronaux convolutifs (CNN)
  • Réseaux neuronaux récursifs (RNN)