ACP

Téléchargez le jeu de données "covid".

  1. Conservez uniquement les lignes correspondant à la dernière date dans le fichier.
  2. Vérifiez que vous comprenez ce que représentent les variables.
  3. Certaines lignes semblent-elles ne pas correspondre à un pays ? Supprimez-les.
  4. Essayez de supprimer toutes les lignes comportant des valeurs manquantes. Qu'observez-vous ?
  5. Sélectionnez alors un nombre raisonnable/maximal de colonnes.
  6. Effectuez une ACP sur le jeu de données réduit aux colonnes sélectionnées, sans valeurs manquantes. Alternative possible : utiliser le package missMDA
  7. Certains individus semblent-ils "extrêmes" ? (Très loin des autres sur le nuage). Expliquez en quoi ils sont uniques, puis relancez l'analyse sans eux.
  8. Certaines variables paraissent-elles très corrélées ? Vérifiez numériquement, expliquez, et, enfin, relancez l'analyse après suppression des redondances.
  9. Interprétez les graphes finalement obtenus. (Imaginez que vous êtes journaliste et devez écrire un article :) ).

AFC

Téléchargez le jeu de données "mushroom"

  1. Vérifiez que vous comprenez ce que représentent exactement les variables.
  2. Effectuez des AFC sur plusieurs couples de variables, et interprétez les.
  3. Les conclusions correspondent-elles à l'intuition ?

Suggestion de corrigé

Version Jupyter
Version HTML