Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Data science : R text mining - analyse de documents

Data science : R text mining - analyse de documents

Objectifs

  • L’objectif de cette formation est de maitriser les techniques de Text mining et d’analyse de document à l’aide du logiciel R.

Public

  • Chefs de projets statistiques
  • chargés d’étude
  • analystes …

Prérequis

  • Connaissance des bases de la théorie statistique, avoir suivi la formation R niveau 1 ou avoir une utilisation avancée de R.

Programme de la formation

CHAPITRE 1 : Théorie du Text mining / analyse de documents et mise en œuvre dans R

  • Introduction : quels besoins de données non structurées, et sur les données de type texte
  • Text mining : principe du Text mining, lemmatisation, stemmatisation (algorithme de Porter), treetagger
  • Utilisation des packages tm, texstem, SnowballC, …
  • Méthodes de topic modeling : matrice document, pondération TF-IDF, modèles LSA, unigram, pLSA, LDA
  • Utilisation des packages lsa, svs, topicmodels, …
  • Introduction à l’analyse des sentiments
  • Utilisation des packages syuzhet, textir
  • Présentation des autres données de type non structurées : sons, images, vidéo sous R – utilisation des packages magick, EBImage, videoplayR,

CHAPITRE 2 : cas pratiques et best practices