ACP
Téléchargez le jeu de données "covid".
- Conservez uniquement les lignes correspondant à la dernière date dans le fichier.
- Vérifiez que vous comprenez ce que représentent les variables.
- Certaines lignes semblent-elles ne pas correspondre à un pays ? Supprimez-les.
- Essayez de supprimer toutes les lignes comportant des valeurs manquantes. Qu'observez-vous ?
- Sélectionnez alors un nombre raisonnable/maximal de colonnes.
- Effectuez une ACP sur le jeu de données réduit aux colonnes sélectionnées, sans valeurs manquantes.
Alternative possible : utiliser le package missMDA
- Certains individus semblent-ils "extrêmes" ? (Très loin des autres sur le nuage).
Expliquez en quoi ils sont uniques, puis relancez l'analyse sans eux.
- Certaines variables paraissent-elles très corrélées ? Vérifiez numériquement,
expliquez, et, enfin, relancez l'analyse après suppression des redondances.
- Interprétez les graphes finalement obtenus. (Imaginez que vous êtes journaliste et devez écrire un article :) ).
AFC
Téléchargez le jeu de données "mushroom"
- Vérifiez que vous comprenez ce que représentent exactement les variables.
- Effectuez des AFC sur plusieurs couples de variables, et interprétez les.
- Les conclusions correspondent-elles à l'intuition ?
Suggestion de corrigé
Version Jupyter
Version HTML