Lanalyse discriminante - PowerPoint PPT Presentation

1 / 47
About This Presentation
Title:

Lanalyse discriminante

Description:

Contrairement UNIANOVA, il faut ajouter un. Contraste avec un 1 par ... c'est entre ces deux extr mes, prenez pour acquis que le postulat est respect . ... – PowerPoint PPT presentation

Number of Views:240
Avg rating:3.0/5.0
Slides: 48
Provided by: genevive4
Category:

less

Transcript and Presenter's Notes

Title: Lanalyse discriminante


1
Lanalyse discriminante
  • PSY6002_Cours 12

2
Interpréter les combinaisons linéaires avec les
contrastes
MANOVA bep detp opti vital flow BY passion(1,3)
/Method unique /discrim(cor) /print
cellinfo(means) signif(efsize dimenr eigen)
homogeneity /contrast(passion)special(1 1 1 -1
0 1 0 -1 1) /partition(passion) /design
passion(1) passion(2).
N.B. Il peut y avoir autant de contrastes que de
degrés de liberté (k-1). Donc sil y a 3
groupes, deux contrastes sont possibles. Si vous
en voulez plus, vous devez rouler la MANOVA plus
quune fois. Les contrastes peuvent être
orthogonaux ou non faire la correction qui
simpose sils ne sont pas orthogonaux.
3
MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
A n a l y s i s o f V a r i a n c
e -- design 1 EFFECT ..
PASSION(1) Multivariate Tests of Significance (S
1, M 1 1/2, N 196 ) Test Name Value
Exact F Hypoth. DF Error DF Sig. of F
Pillais .11470 10.20929 5.00
394.00 .000 Hotellings .12956
10.20929 5.00 394.00 .000 Wilks
.88530 10.20929 5.00 394.00
.000 Roys .11470 Note.. F
statistics are exact. - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - -
Multivariate Effect Size TEST NAME Effect
Size (All) .115
Contraste 1 Non passionnés vs passionnés
harmonieux
4
MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - Eigenvalues and
Canonical Correlations Root No. Eigenvalue
Pct. Cum. Pct. Canon Cor. 1
.130 100.000 100.000 .339 -
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - A n a l y s i s
o f V a r i a n c e -- design 1
EFFECT .. PASSION(1) (Cont.) Correlations
between DEPENDENT and canonical variables
Canonical Variable Variable 1
bep -.719 detp .590
opti -.591 vital -.701
flow -.884
Attention, A) les contrastes 1 et 2 sont
inversés dans le output et B) les signes ne
sont pas nécessairement corrects!!!
Contraste 1 Non passionnés vs passionnés
harmonieux
5
Puisque les signes de la corrélation canonique et
des corrélations entre la variable canonique et
les variables dépendantes ne sont pas
nécessairement corrects
  • Examinez vos moyennes pour interpréter la
    direction de la relation.

Passionnés harmonieux vivent plus de bien-être
et plus de flow, etc
6
Pour rapporter la corrélation canonique et les
corrélations entre la variable canonique et les
variables dépendantes
  • Faites votre dessin en insérant les chiffres
    appropriés sans les signes.
  • Indiquer les signes représentant votre contraste
    (ceux de la commande).
  • Indiquer les signes nécessaires pour que la
    direction de leffet que vous avez observez entre
    les moyennes de chaque variable dépendante y soit
    reflètée.

Passionnés harmonieux (1) vs Non passionnés
(-1)
7
Pour rapporter la corrélation canonique et des
corrélations entre la variable canonique et les
variables dépendantes
En regardant mes moyennes, jobtiens que les
passionnés harmonieux vivent plus de bien-être,
moins de détresse, plus doptimisme, plus de
vitalité et plus de flow Ainsi,
Bien-être
.72
Détresse
-.59
Passionnés harmonieux (1) vs Non passionnés
(-1)
.34
.59
Optimisme
.70
Vitalité
.88
Flow
8
MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
A n a l y s i s o f V a r i a n c
e -- design 1 EFFECT ..
PASSION(2) Multivariate Tests of Significance (S
1, M 1 1/2, N 196 ) Test Name Value
Exact F Hypoth. DF Error DF Sig. of F
Pillais .12600 11.35987 5.00
394.00 .000 Hotellings .14416
11.35987 5.00 394.00 .000 Wilks
.87400 11.35987 5.00 394.00
.000 Roys .12600 Note.. F
statistics are exact. - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - -
Multivariate Effect Size TEST NAME Effect
Size (All) .126 - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - -
Contraste 2 Passionnés obsessifs vs passionnés
harmonieux
9
MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - Eigenvalues and
Canonical Correlations Root No. Eigenvalue
Pct. Cum. Pct. Canon Cor. 1
.144 100.000 100.000 .355 -
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - A n a l y s i s
o f V a r i a n c e -- design 1
EFFECT .. PASSION(2) (Cont.) Correlations
between DEPENDENT and canonical variables
Canonical Variable Variable 1
bep .946 detp -.729
opti .649 vital .618
flow .451 - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - -
Attention, A) les contrastes 1 et 2 sont
inversés dans le output et B) les signes ne
sont pas nécessairement corrects!!!
Contraste 2 Passionnés obsessifs vs passionnés
harmonieux
10
Type De question
Type De mesure des Variables Dépendantes
Nombre De Variables Dépendantes
Nombre De Niveaux ou de VI
Échantillons Dépendants ou indépendants
Satistiques
indépendants
?2
Deux
Une
dépendants
McNemar
Qualitatives
Analyse discriminante
Multiples
Multiples
indépendants
Test t (ind)
Deux
Différences
dépendants
Test t (dép)
Une
indépendants
ANOVA/ANCOVA
ANOVA/ANCOVA mesures répétées
Multiples
dépendants
Quantitatives
Ind dép
ANOVA/ ANCOVA (mixte)
MANOVA/ MANCOVA
Multiples
Multiples
Ind dép
Qualitatives
Deux
Une
Phi
Relations
Aucune
Analyse Factorielle
Multiples
Corrélation / Régression Simple
Une
Quantitatives
Une
Régression Multiple
Multiples
Corrélation Canonique
Aussi TF, p.29-31.
Multiples
Multiples
11
Corrélation canonique (R)
Motricité fine
Coordination
Gars (0) vs Fille (1)
?
Logique
Capacité dabstraction
Reconnaissance des émotions
Expression émotionnelle
12
La MANOVA
  • La MANOVA crée des combinaisons linéaires (des
    variables canoniques) permettant de maximiser la
    séparation des groupes.

Critère Trouver la combinaison linéaire qui
maximise la séparation entre les groupes
13
Lanalyse discriminante
  • Lanalyse discriminante crée des combinaisons
    linéaires (des variables canoniques) permettant
    de maximiser la prédiction de lappartenance aux
    différents groupes.

Critère Trouver la combinaison linéaire qui
maximise la prédiction de lappartenance aux
groupes
14
Motricité fine
Coordination
Gars (0) vs Fille (1)
Logique
Capacité dabstraction
Reconnaissance des émotions
Expression émotionnelle
15
Lanalyse discriminante
Variable canonique 1
16
Lanalyse discriminante
Variable canonique 1
17
Le lambda de Wilks (Wilks ?)
  • Le lambda de Wilks (Wilks ?) nous dit sil y a
    une combinaison linéaire de variables dépendantes
    qui permet de séparer les groupes de façon
    statistiquement significative.

18
Interpréter les combinaisons linéaires (deux
groupes)
  • Sil ny a que deux groupes

Corrélation canonique (R)
R2
.44
.19
Wilks Lambda
p
?2approximatif
.33
15.07
.01
Dimensions
Wilks Lambda
p
?2approximatif
1 à 1
.33
15.07
.01
19
Interpréter les combinaisons linéaires (deux
groupes)
Corrélations entre les variables indépendantes et
les scores obtenus par combinaisons linéaires
Variables indépendantes
Combinaison 1
Motricité fine
-.86
Coordination
-.73
Logique
.15
Capacité dabstraction
.01
Reconnaissance des émotions
.53
Expression émotionnelle
.59
Convention Les corrélations de .33 et plus sont
interprétées.
20
Les variables canoniques
  • Le nombre de paires de variables canoniques créés
    est le plus petit entre deux possibilités
  • le nombre de variables indépendantes ou
  • k-1 (degrés de liberté du traitement, groupes-1)
  • Sil y a deux groupes
  • Une seule paire de variables canoniques (k-1 1)
  • Sil y a plus que deux groupes
  • Au moins deux paires de variables canoniques
  • Avec 3 groupes, K-1 2

21
Les variables canoniques
  • Les variables canoniques obtenues sont reliées
    aux contrastes qui permettent dobtenir la
    meilleure séparation des groupes et donc la
    meilleur prédiction.
  • Quels sont ces contrastes?

22
Interpréter les combinaisons linéaires (plusieurs
groupes)
Corrélation canonique (R)
R2
.44
.19
.06
.24
23
Interpréter les combinaisons linéaires (trois
groupes)
Corrélations entre les variables indépendantes et
les variables canoniques (Canonical variables)
Variables indépendantes
Combinaison 1
Combinaison 2
.55
.16
Objectifs à court terme
.35
.23
Plan de développement à long terme
.09
.68
Encourage la coopération
.15
.78
Valorise la conciliation travail/famille
.01
.51
Soucis de la santé des employés
Convention Les corrélations de .33 et plus sont
interprétées.
24
Interpréter les combinaisons linéaires (trois
groupes)
Le score de la variable canonique au centroide
des groupes (Functions at Group Centroids)
Centroides des Groupes
Combinaison 1
Combinaison 2
.310
-.319
Organisations favorisant le bien-être
-.428
.009
Organisations favorisant la performance
.370
.125
Organisations favorisant la performance et le
bien-être
25
Lanalyse discriminante
Variable canonique 1 Performance
Bien-être performance
Performance
Bien-être
26
Le pourcentage de variance expliquée par
lappartenance au groupe
  • Cramer et Nicewander (1979 cité dans Stevens,
    1996, p. 443) recommande dutiliser la moyenne de
    toutes les corrélations canoniques au carré.
  • (.19 .12) / 2 .16

Corrélation canonique (R)
R2
.44
.19
.12
.34
27
Les postulats
  • Lanalyse exige plus de participants
  • Pour le wilks de façon approximative, le plus
    petit groupe devrait être composé de 20 personnes
    ou plus (pour environ 5 prédicteurs et moins).
  • Pour la classification environ 20 participants
    pour chaque prédicteur.
  • Si les groupes sont très inégaux, la régression
    logistique est préférable.
  • Il est recommandé de vérifier vos scores extrêmes
    univariés et multivariés séparément pour chaque
    groupe.
  • Sort cases by passion.
  • Split file by passion.

Non nécessaire pour les besoins du cours.
28
Les postulats
  • Normalité et linéarité
  • Indépendance des scores
  • Absence de multicolinéarité
  • Homogénéité de la variance et de la covariance.

29
Lhomogénéité des matrices de variance-covariance
et le Wilks
  • Si les groupes sont égaux ou relativement égaux
    (32), le test est robuste
  • Si les groupes sont inégaux et que le test M de
    Box (Fapproximatif) nest pas significatif à p lt
    0.001, alors il y a homogénéité.
  • Si les groupes sont inégaux et que le test M de
    Box (Fapproximatif) est significatif à p lt 0.001
  • Si la variance ET la covariance les plus élevées
    se retrouvent dans le plus grand groupe, le test
    est conservateur
  • Si, au contraire, la variance ET la covariance
    les plus grandes se retrouvent dans le plus petit
    groupe, le Wilks est libéral. Égalisez vos
    groupes ou ajustez votre alpha critique à p lt
    .01(Tabachnick Fidell, 2001)
  • Si cest entre ces deux extrêmes, prenez pour
    acquis que le postulat est respecté.

30
(No Transcript)
31
La classification
32
La classification
  • Le théorème de Bayes Les personnes sont classées
    dans un groupe selon deux critères
  • La distance de la personne par rapport au
    centroide de chaque groupe
  • La probabilité dappartenir au groupe

33
La classification
Variable canonique 1
34
La classification
Variable canonique 1
35
(No Transcript)
36
Les probabilités dappartenance au groupes
  • Égales pour chaque groupe.
  • Égales aux proportions observées dans chaque
    groupe de léchantillon.
  • Proportions théoriques
  • Sur une période de 12 mois, entre 4 et 5 de
    la population fera une dépression majeure (Source
    Rapport sur les maladies mentales au Canada,
    octobre 2002).
  • Si vous avez un échantillon provenant de la
    population en générale, il serait possible de
    penser que vous devriez obtenir les mêmes
    proportions de 4-5 pour les dépressifs et de
    95-96 pour les non-dépressifs.

37
La classification
Appartenance prédite
Gars
Filles
40
70
Appartenance réelle
Gars
22
22
Filles
Note 40.3 sont classifiés correctement (40
22) / 154 40.3
N 154
38
La classification
Appartenance prédite
Gars
Filles
36
64
Appartenance réelle
Gars
N 110 (71)
50
50
Filles
N 44 (29)
39
La classification
40
Comment évaluer le de classification?
  • Comparez le obtenu à celui qui serait obtenu à
    cause du hasard seulement.
  • Sil y a deux groupes égaux ½ et ½, donc 50.
  • Sil y a trois groupes égaux ?, ?, ?, donc 33.

41
Évaluez le de classification en le comparant à
celui qui serait obtenu à cause du hasard
seulement
  • Si les groupes sont inégaux, le calcul des
    probabilités totales est un peu plus compliqué
  • Les probabilités spécifiées pour chaque groupe
    sont en fait les probabilités de classement
    correct pour chaque groupe (Par exemple, .10,
    .30, .60)
  • Mais, étant donné que ce sont des probabilités,
    vous ne pouvez pas simplement en faire une
    moyenne arithmétique.
  • Vous devez utiliser la formule de la moyenne
    harmonique à lacétate suivante.

42
Évaluez le de classification en le comparant à
celui qui serait obtenu à cause du hasard
seulement
  • Vous avez besoin de la taille des groupes
    attendus (n1, n2, n3,) et la taille totale
    (Ntot).
  • La taille des groupes attendus (n1, n2, n3,)
    dépend des probabilités spécifiées.

43
Évaluez le de classification en le comparant à
celui qui serait obtenu à cause du hasard
seulement
  • Si on sattend à trois groupes égaux et quil y a
    600 participants
  • n1.3333600200
  • n2.3333600200
  • n3.3333600200
  • Ntot600

44
La classification
45
Évaluez le de classification en le comparant à
celui qui serait obtenu à cause du hasard
seulement
  • Si on sattend à trois groupes inégaux et quil y
    a 392 participants
  • n1.16339264
  • n2.385392151
  • n3.452392177
  • Ntot392

46
Lhomogénéité des matrices de variance-covariance
et la classification
  • La méthode pour classifier les participants est
    très sensible à lhétérogénéité de la variance et
    de la covariance
  • Les participants ont plus de chance dêtre
    classés dans le groupe ayant la plus grande
    variance.

47
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com