Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Big Data > Big Data et Data Science : Analyse des données non structurées texte

Big Data et Data Science : Analyse des données non structurées texte

LES TENDANCES DU BIG DATA

Objectifs

  • L’analyse textuelle permet de traiter de grandes quantités de données textuelles non structurées (corpus de documents).
  • Les méthodes d’analyse permettent de dégager et structurer le contenu d’un corpus, les principales thématiques pour trouver des informations

Public

  • Chefs de projets statistiques,
  • Chargés d’étude,
  • Analystes

Prérequis

  • Connaissance des bases de la théorie statistique

Programme de la formation

Pourquoi l’analyse textuelle ?

  • Le poids du texte dans l’entreprise, sur internet, dans les sites sociaux
  • Les objectifs de l’analyse textuelle

Méthodologie de l’analyse textuelle

  • Nettoyage du corpus
  • Tokenisation, i.e. découpage en mots-clés ou termes
  • Algorithme d’analyse : matrice de documents-termes, clustering, détection de topic (algorithmes K-means, CAH, LDA, pLSA, …)
  • Visualisation par word cloud, ...