ACP Analyse en Composantes Principales presentation

About This Presentation

Transcript and Presenter's Notes

Title: ACP Analyse en Composantes Principales

1
ACP Analyse en Composantes Principales
2
Description multidimensionnelle de données
numériques

Dans la plupart des applications, on travaille
non pas avec une seule variable, mais avec un
nombre de variable souvent élevé.
Létude séparée de chacune de ces variables
nest pas suffisante.
-gtIl faut donc analyser les données en tenant
compte de leur caractère multidimensionnel

3
Les méthodes multifactorielles d'Analyse des
Données

ACP Analyse en Composantes Principales, pour
les tableaux de variables quantitatives.
AFTD Analyse Factorielle d'un Tableau de
Distances, pour les tableaux de distances.
AFC Analyse Factorielle des Correspondances,
pour les tableaux de contingence.
ACM Analyse des Correspondances Multiples, pour
les tableaux de variables qualitatives.
STATIS Structuration des Tableaux A Trois
Indices de la Statistique
AFM Analyse Factorielle Multiple
DACP Double Analyse en Composante Principale
La liste n'est pas exhaustive.

4
Présentation générale de l'ACP

L'étude séparée de chacune de ces variables
donne quelques informations mais est insuffisante
car elle laisse de côté les liaisons entre elles,
ce qui est pourtant souvent ce que l'on veut
étudier.
C'est le rôle de la statistique
multifactorielle, que d'analyser les données dans
leur ensemble, en prenant en compte toutes les
variables.
L'Analyse en Composantes Principales est alors
une bonne méthode pour étudier les données
multidimensionnelles, lorsque toutes les
variables observées sont de type numérique, de
préférence dans les mêmes unités, et que l'on
veut voir sil y a des liens entre ces variables.

5
Le principe dACP

La mise en oeuvre mathématique de l'ACP peut être
divisée en 6 étapes principales
1. Préparer les données pour le traitement
2. Calculer la matrice des coefficients de
corrélations des variables
3. Extraire les valeurs et vecteurs propres de
cette matrice
4. Classer les vecteurs propres dans l'ordre
décroissant des valeurs propres associées
5. Calculer la matrice des composantes principales

6
Le principe dACP -

1 - Préparer les données pour le traitement
Les observations de p variables sur n individus
sont rassemblées dans uns matrice X à n lignes et
p colonnes.

7
Le principe dACP

Le problème est que si on analyse directement la
matrice X, les résultats seraient faussés par les
valeurs relatives des variables (Par exemple si
les valeurs ont été mesurées dans des unités
différentes). Préparer les données pour le
traitement consiste donc à transformer le tableau
de données pour réduire ces effets.
On peut alors travailler sur une version
centrée-réduite Xcr de la matrice X.
Pour centrer la matrice X, on soustrait à chacune
des valeurs la moyenne de sa variable.
Pour réduire la matrice centrée, on divise
chacune des valeurs par l'écart-type de sa
variable.

8
Le principe dACP

5. Matrice des composantes principales
La matrice appelée matrice des composantes
principales est celle qui contient les
coordonnées des individus dans l'espace formé par
les composantes principales.
Soit CP la matrice des composantes
principales. On a alors
CP Xrc . u

9
ACP - Avantages

Simplicité mathématique Sur le plan
mathématique, l'ACP est donc une méthode simple à
mettre en oeuvre. Les seuls véritables outils
mathématiques utilisés dans l'ACP sont le calcul
des valeurs/vecteurs propres d'une matrice, et
les changements de base.
Simplicité des résultats Grâce aux graphiques
qu'elle fournit, lACP permet d'appréhender une
grande partie de ses résultats d'un simple coup
d'oeil.
Puissance L'ACP a beau être simple. Elle offre,
en quelques opérations seulement, un résumé et
une vue complète des relations existant entre les
variables quantitatives d'une population d'étude.
Flexibilité L'ACP est une méthode très souple,
puisqu'elle s'applique sur un ensemble de données
de contenu et de taille quelconques.

10
Projet

Le but du projet - Compresser une image noire
blanche
Le programme prend en entrée une image et à la
sortie on obtiendra un certain nombre des
coefficients qui présentent les niveaux de gris
les plus importants dans l'image.

11
Projet - Réalisation

0 - Choix du format d'image
Pour la raison de la simplicité de lecture et
écriture d'une image, on choisit le format pgm
qui est représenté par un fichier texte.
Exemple une image Pgm de taille 4x4
P2
4 4
255
125 156 100 80
16 150 255 20
154 123 120 20
125 123 255 80

12
Projet - Réalisation

1 - Preparer les données pour algorithme ACP
Comme on a vu dans la partie de principe d'ACP,
ACP prend en entrée un tableau dont chaque ligne
est un individu et chaque colonne est une
variable.
Dans notre cas, le tableau aura une seule ligne
(cas on a une seule image en entrée) et les
variables seront les niveau de gris, donc il y a
256 variables qui correspondent aux 256 niveaux
de gris d'une image noire et blanche. La valeur
de chaque variable est donc le nombre de fois que
le niveau de gris apparaît dans l'image.

13
Projet - Réalisation

2. Calculer la matrice des coefficients de
corrélations des variables
3. Extraire les valeurs et vecteurs propres de
cette matrice
4. Classer les vecteurs propres dans l'ordre
décroissant des valeurs propres associées
5. Calculer la matrice des composantes principales

14
Projet - Réalisation

15
Projet - Résultats

16
Projet - Résultats

17
Projet - Résultats

18
Projet - Résultats

19
Projet - Résultats

Write a Comment

User Comments (0)

About PowerShow.com

ACP Analyse en Composantes Principales PowerPoint PPT Presentation