Discipline(s) : Sciences et technologies, Sciences Humaines et Sociales

MI0A503T - Statistique exploratoire multidimensionnelle

Accessible en Formation à distance
Semestre Semestre 1
Crédits ECTS 6
Volume horaire total 50

Domaine(s) LMD

SCIENCES HUMAINES ET SOCIALES, SCIENCES, TECHNOLOGIES, SANTE

Langue(s) d'enseignement

Français

Responsables

Frédéric FERRATY : ferraty@univ-tlse2.fr

Pré-requis

1) Notions d'algèbre linéaire
  • espaces vectoriels normés (norme, distance euclidienne, ...)
  •  géométrie dans l'espace (produit scalaire, angles définis par 2 vecteurs, ...)
  • projections orthogonales
2) Notions de statistique descriptive :
  • statistique univariée
    • indicateurs numériques (moyenne, médiane, variance, écart-type, quantiles,...)
    • représentations graphiques (boîtes-à-moustaches, histogrammes,...)
  • statistique bivariée
    • corrélation linéaire, rapport de corrélation, khi-deux,...
    • nuage de point, régression linéaire,...

Objectifs

Cet enseignement est dédié à l’exploration statistique des tableaux contenant des individus pour lesquels on a observé différentes caractéristiques (variables).
L’objectif de ce cours est de former les étudiant.e.s aux principales techniques d’exploration de données multidimensionnelles.
On s’intéressera en particulier aux techniques de réduction de dimension qui permettent de réaliser des représentations graphiques « les moins déformantes possibles » en 2D voire 3D. Seront aussi introduites dans cet enseignement, des méthodes de classification qui ont pour objectif de construire des classes au sein des données et de discrimination qui visent à exploiter la présence de classes pour prédire l’affection de nouveaux individus.

Contenu

Analyse en Composantes Principales.
Analyse Factorielle des Correspondances.
Analyse Factorielle des Correspondances Multiples.
Introduction à la Classification (méthode des plus proches voisins, classification hiérarchique, kmeans).

Bibliographie

  • Escofier, B. et J. Pagès (2008). Analyses factorielles simples et multiples ; objectifs, méthodes et interprétation. 4e édition, Dunod, Paris.
  • Husson, F. (https://husson.github.io)
  • Husson, F., Lê S. et J. Pagès (2016). Analyse des données avec R (2e édition). Presses Universitaires de Rennes.
  • Saporta Gilbert (2011). Probabilités, analyse des données et statistique. 3ème édition, Technip, Paris.