Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
> > > Big Data, Data Mining et Machine Learning

Big Data, Data Mining et Machine Learning

sas

Cette formation introduit les concepts du calcul analytique et du Data Mining dont la modélisation prédictive. Divers sujets sont couverts allant d’une description des environnements informatiques modernes à la mise en œuvre de la méthodologie du Data Mining. Vous bénéficierez ainsi d’une introduction aux algorithmes de Data Mining, à la segmentation, au Data Mining appliqué aux séries chronologiques et au Text Mining. Ces concepts sont illustrés au travers d’exemples concrets.

Objectifs

  • Utiliser la méthodologie du Data Mining
  • Appliquer des algorithmes de modélisation de pointe sur vos données
  • Mettre en œuvre les bonnes pratiques pour développer et maintenir des modèles analytiques.
  • Explorer comment créer de la valeur à l’aide de l’analytique
  • Evaluer les différents modèles de machine Learning.
  • Expliquer de manière simple le concept de data Mining et les méthodes de machine Learning.
  • Utiliser des données non structurées dans votre modélisation.
  • Construire des segments pour vos applications métiers.

Public

  • Analyses métiers
  • Statisticiens
  • Data Scientists
  • Managers
  • Toute personne souhaitant comprendre l'analytique et comment celui-ci peut influencer l'activité

Prérequis

  • Il est recommandé de connaître le domaine de l'analytique et d'avoir quelques notions de statistique.
  • La connaissance de SAS est un plus.

Programme de la formation

Environnement Informatique

  • Le matériel
  • Le stockage disque
  • La CPU
  • La mémoire
  • Le réseau
  • Système distribué : Bases de données et systèmes de fichiers.
  • Virtualisation

Inventaires des outils analytiques

Aperçu des Techniques de segmentation

  • Segmentation et Classification
  • Notions de distances
  • Algorithmes de classification : Méthodes des K-Means et Classification Ascendante Hiérarchique
  • Evaluation d’une classification
  • Choix du nombre de groupes
  • Description des groupes

Modélisation prédictive

  • Méthodologie de construction d’un modèle : SEMMA
  • Différents types de modèles : prédiction d’une cible binaire, multi niveaux ou continue
  • Evaluation de la puissance prédictive d’un modèle

Modèle les plus courants

  • Régression
  • Modèles linéaires généralisés
  • Réseaux de neurones
  • Arbres de décision, Arbres de régression

Autres applications

  • Modèle incrémental
  • Data Mining pour des séries chronologiques
  • Conseils systèmes
  • Analyse textuelle : restructuration des informations et classement des documents
  • Text Mining