AFC dans R avec FactoMineR: Scripts Faciles et Cours
Cet article montre comment calculer l’analyse factorielle des correspondences (AFC) dans R en utilisant le package FactoMineR.
l’AFC est un outil d’analyse de données multivariées, dédie à l’analyse de grands tableaux de contingence formés par deux variables qualitatives. Le but est d’étudier l’association entre les catégories de la variable ligne et celles de la variable colonne.
Nous présentons aussi une série de vidéos de cours sur l’AFC. Dans les vidéos, les instructeurs commencent par expliquer la théorie et les concepts clés derrière l’AFC. Ensuite, ils fournissent des exemples pratiques et des aides à l’interprétation de l’AFC en utilisant la programmation R.
Contents:
Code R: guide de demarrage rapide
- Installer FactoMineR:
install.packages("FactoMineR")
- Calculer l’AFC en utilisant le jeu de données
children
[dans FactoMineR]. Le jeu de données est un tableau de contingence qui résume les réponses données par différentes catégories de personnes à la question suivante: selon vous, quelles sont les raisons qui peuvent faire hésiter une femme ou un couple à avoir des enfants?
library(FactoMineR)
data("children")
res.ca <- CA(children,
row.sup = 15:18, # Lignes supplémentaires
col.sup = 6:8, # Colonnes supplémentaires
graph = FALSE)
Termes clés:
- Lignes et colonnes actives, utilisées durant l’AFC.
- Lignes et colonnes supplémentaires. Coordonnées prédites après l’AFC.
- Visualiser les valeurs propres. Montre le pourcentage de variances expliquées par chaque axe principal.
eig.val <- res.ca$eig
barplot(eig.val[, 2],
names.arg = 1:nrow(eig.val),
main = "Variances Explained by Dimensions (%)",
xlab = "Principal Dimensions",
ylab = "Percentage of variances",
col ="steelblue")
# Add connected line segments to the plot
lines(x = 1:nrow(eig.val), eig.val[, 2],
type = "b", pch = 19, col = "red")
- Biplot des lignes et des colonnes montrant l’association entre les points lignes et colonnes.
plot(res.ca, autoLab = "yes")
bleu
: points lignesbleu foncé
: lignes supplémentairesrouge
: points colonnesrouge foncé
: colonnes supplémentaires
Pour visualiser uniquement les lignes, spécifier l’argument invisible = “col”. Pour les colonnes uniquement, utilisez invisible = “row”.
Pour des graphiques de type ggplot2: AFC - Analyse Factorielle des Correspondances avec R: L’Essentiel
- Accéder aux résultats de l’AFC:
# Valeurs propres
res.ca$eig
# Résultats pour les lignes
res.row <- res.ca$row
res.row$coord # Coordonnées
res.row$contrib # Contributions
res.row$cos2 # Qualité de représentation
# Résultats pour les colonnes
res.col <- res.ca$col
res.col$coord # Coordonnées
res.col$contrib # Contributions to the PCs
res.col$cos2 # Qualité de représentation
Théorie et concepts
Cette vidéo décrit les types de données et les notations clés de l’AFC, ainsi que les questions qui peuvent être analysées par l’analyse factorielle des correspondances.
Contenu de la vidéo (temps en minutes ):
- Données
- Modèle d’indépendance (7’03)
- Les nuages et leur ajustement (14’37)
- Pourcentages d’inertie et inertie en AFC (25’05)
- Représentation simultanée des lignes et des colonnes (35’50)
- Aides à l’interprétation (46’30)
AFC: Exemples Pratiques avec R
AFC avec FactoMineR
Analyse des correspondances sur des données textuelles
Application Factoshiny
Factoshiny permet de faire l’ACP à travers une interface graphique par clic bouton.
Interprétation automatique: FactoInvestigate
Le package R FactoInvestigate permet de générer automatiquement un rapport contenant les graphiques et l’interprétation des résultats de l’ACP. FactoInvestigate R Package: Automatic Reports and Interpretation of Principal Component Analyses