Articles - Méthodes des Composantes Principales dans R: Guide Pratique

AFC dans R avec FactoMineR: Scripts Faciles et Cours

Cet article montre comment calculer l’analyse factorielle des correspondences (AFC) dans R en utilisant le package FactoMineR.

l’AFC est un outil d’analyse de données multivariées, dédie à l’analyse de grands tableaux de contingence formés par deux variables qualitatives. Le but est d’étudier l’association entre les catégories de la variable ligne et celles de la variable colonne.

Nous présentons aussi une série de vidéos de cours sur l’AFC. Dans les vidéos, les instructeurs commencent par expliquer la théorie et les concepts clés derrière l’AFC. Ensuite, ils fournissent des exemples pratiques et des aides à l’interprétation de l’AFC en utilisant la programmation R.

AFC dans R avec FactoMineR: Cours

Contents:

Code R: guide de demarrage rapide

  1. Installer FactoMineR:
install.packages("FactoMineR")
  1. Calculer l’AFC en utilisant le jeu de données children[dans FactoMineR]. Le jeu de données est un tableau de contingence qui résume les réponses données par différentes catégories de personnes à la question suivante: selon vous, quelles sont les raisons qui peuvent faire hésiter une femme ou un couple à avoir des enfants?
library(FactoMineR)
data("children")
res.ca <- CA(children, 
             row.sup = 15:18,  # Lignes supplémentaires
             col.sup = 6:8,    # Colonnes supplémentaires
             graph = FALSE)

Termes clés:

  • Lignes et colonnes actives, utilisées durant l’AFC.
  • Lignes et colonnes supplémentaires. Coordonnées prédites après l’AFC.
  1. Visualiser les valeurs propres. Montre le pourcentage de variances expliquées par chaque axe principal.
eig.val <- res.ca$eig
barplot(eig.val[, 2], 
        names.arg = 1:nrow(eig.val), 
        main = "Variances Explained by Dimensions (%)",
        xlab = "Principal Dimensions",
        ylab = "Percentage of variances",
        col ="steelblue")
# Add connected line segments to the plot
lines(x = 1:nrow(eig.val), eig.val[, 2], 
      type = "b", pch = 19, col = "red")

  1. Biplot des lignes et des colonnes montrant l’association entre les points lignes et colonnes.
plot(res.ca, autoLab = "yes")

  • bleu: points lignes
  • bleu foncé: lignes supplémentaires
  • rouge: points colonnes
  • rouge foncé: colonnes supplémentaires

Pour visualiser uniquement les lignes, spécifier l’argument invisible = “col”. Pour les colonnes uniquement, utilisez invisible = “row”.

  1. Accéder aux résultats de l’AFC:
# Valeurs propres
res.ca$eig
# Résultats pour les lignes
res.row <- res.ca$row
res.row$coord          # Coordonnées
res.row$contrib        # Contributions
res.row$cos2           # Qualité de représentation 
# Résultats pour les colonnes
res.col <- res.ca$col
res.col$coord          # Coordonnées
res.col$contrib        # Contributions to the PCs
res.col$cos2           # Qualité de représentation 

Théorie et concepts

Cette vidéo décrit les types de données et les notations clés de l’AFC, ainsi que les questions qui peuvent être analysées par l’analyse factorielle des correspondances.

Contenu de la vidéo (temps en minutes ):

  1. Données
  2. Modèle d’indépendance (7’03)
  3. Les nuages et leur ajustement (14’37)
  4. Pourcentages d’inertie et inertie en AFC (25’05)
  5. Représentation simultanée des lignes et des colonnes (35’50)
  6. Aides à l’interprétation (46’30)

AFC: Exemples Pratiques avec R

AFC avec FactoMineR

Analyse des correspondances sur des données textuelles

Application Factoshiny

Factoshiny permet de faire l’ACP à travers une interface graphique par clic bouton.

Interprétation automatique: FactoInvestigate

Le package R FactoInvestigate permet de générer automatiquement un rapport contenant les graphiques et l’interprétation des résultats de l’ACP. FactoInvestigate R Package: Automatic Reports and Interpretation of Principal Component Analyses