Recherche avancée
Par formation
Par date
Par ville
logo HUB Formation
Organisme de Formation
aux Technologies et métiers de L'informatique
La pédagogie au service de la technologie
Accueil > Domaines > Statistiques > Analyse statistique avancée avec R

Analyse statistique avancée avec R

Réalisation d'analyses statistiques spécifiques

L’analyse statistique des données est une des compétences requises pour mettre en œuvre des projets Big Data. Selon la nature des données manipulées et le type d’analyses souhaitées, il est parfois nécessaire de recourir à des techniques d’analyses avancées. Aussi, tout Data Scientist doit-il aujourd’hui maitriser l’implémentation d’outils statistiques sous R pour réaliser des analyses non ponctuelles et inférentielles paramétriques ou de données uni ou multi-variées pour tous les domaines dans le service, l’industrie ou encore la R&D. Cette formation avancée permettra aux participants de maitriser R et ainsi d’être à même d’analyser tous types de données dans leurs projets Big Data.

Objectifs

  • Connaître les outils et méthodes d'analyses statistiques avancées en environnement R
  • Savoir programmer des analyses avec R
  • Savoir utiliser les packages de R pour mettre en oeuvre des modélisations statistiques (régression, ACP..)
  • Comprendre comment réaliser des analyses prédictives à l'aide d'équations de régression

Public

  • Ingénieurs, analystes
  • Data Analysts
  • Toute personne intéressée par l'analyse statistique avec R

Prérequis

  • Avoir suivi la formation Les fondamentaux de l'analyse statistique avec R ou connaissances équivalentes
  • Avoir une première expérience de la programmation
  • Disposer de solides connaissances théoriques en statistiques

Programme de la formation

Introduction

  • Générer et représenter des variables aléatoires
  • Puissance d’un test Z à 1 échantillon en bilatéral
  • d’un test Z en bilatéral
  • Puissance d’un test t à 1 échantillon en bilatéral

Travailler avec des échantillons

  • d’un test t à 1 échantillon en bilatéral
  • à 1 échantillon en bilatéral
  • à 2 échantillons en bilatéral

Réaliser des tests d'ajustement

  • Test d’ajustement d’Anderson-Darling (ie Agostino-Stephens)
  • Test d’ajustement de Shapiro-Wilk

Estimation et intervalles de confiance

  • Intervalle de confiance de la moyenne (test Z à un 1 échantillon)
  • Intervalle de confiance de la moyenne (test t à un 1 échantillon)

Analyses statistiques avancées

  • Test t-Student bilatéral d’un échantillon
  • Test t-Student pour données appariées
  • Test t-Student homoscédastique bilatéral d’égalité de la moyenne
  • Test t-Student hétéroscédastique bilatéral d’égalité de la moyenne (test de Welch)
  • Test de Poisson à un échantillon unilatéral/bilatéral
  • Comparaison de proportions sur une même population (test binomial exact)
  • Intervalle de confiance de la proportion
  • Comparaison de proportions sur 2 échantillons indépendants
  • Test de Fisher d’égalité des variances
  • Test de Levene d’égalité de deux variances
  • Robustesse de tests statistiques
  • Transformations de Box-Cox
  • Transformations de Johnson

Analyse de la variance et de la covariance

  • désempilé
  • sans répétitions avec ou sans interactions
  • avec répétitions avec ou sans interactions
  • Comparaisons multiples du test de Student avec correction de Bonferroni
  • de Tukey HSD
  • Test de Levene et Bartlett d’égalité des variances d’une ANOVA canonique
  • ANOVA Imbriquée/Hiérarchique complète
  • ANOVA Carré Latin
  • ANCOVA (Analyse de la Covariance)
  • MANOVA
  • paramétrique
  • Analyse factorielle exploratoire (AFE)
  • AFE avec méthode ACP sans rotation
  • AFE avec méthode ACP et rotation VariMax

Les + de cette formation

Une formation très pratique : 90% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de base
Cette formation est basée sur des exercices principalement proposés par le formateur et tirés de l'ouvrage qui sert de support pour la formation
Des consultants expérimentés partagent leur savoir-faire avec les participants.