Application d

About This Presentation

Title:

Application d

Description:

... dont les r sultats ne sont pas parfaits Quelques approches Transform e en ondelettes de Gabor sur 34 points Analyse de corr lation en phase de rappel 75-85 ... – PowerPoint PPT presentation

Number of Views:52

Avg rating:3.0/5.0

Slides: 23

Provided by: Mouni2

Category:

more less

Transcript and Presenter's Notes

Title: Application d

1
Application dune mémoire associative
bidirectionnelle à fonction de sortie chaotique à
la reconnaissance dexpressions faciales
Karima Tabari1, Mounir Boukadoum1, Sylvain
Chartier2,3, Hakim Lounis1 1Université du Québec
à Montréal, 2Université du Québec en Outaouais,
3Institut Philippe-Pinel
de Montréal
2
Motivation

Les émotions de lapprenant sont un facteur
important pour un système tutoriel intelligent
Les émotions sont souvents exprimées à laide
dexpressions faciales
La reconnaissance des expressions faciales
demande habituellement des algorithmes complexes,
dont les résultats ne sont pas parfaits

3
Quelques approches

Transformée en ondelettes de Gabor sur 34 points
Analyse de corrélation en phase de rappel
75-85 de réussite

Vecteurs propres de regions choisies
Prétraitement par ACP
MLP avec 1 couche cachée
86 de réussite

4
Les mémoire associatives

Dun grand intérêt théorique pour expliquer les
capacités dassociation du cerveau humain
Un nouveau modèle corrige plusieurs limitations
des mémoires associatives classiques (e.g.
apprentissage binaire).
Architecture récurrente à fonction de sortie
chaotique

5
Topologie du modèle

Les dimensions des couches X et Y nont pas à
être égales
V nest pas la transposée de W

6
Règle dapprentissage
7
Règle dapprentissage
8
Fonction de sortie

Carte cubique dans -1,1

9
Algorithme dapprentissage
1- Sélection aléatoire dune paire (x0,
y0) 2- Calcul de xt et yt selon la nouvelle
règle de sortie. 3- Mise à jours des poids selon
la règle dapprentissage. 4- Répétition des
étapes 1 to 3 jusquà la convergence de la
matrice des poids.
10
Ensemble dapprentissage

Base de données CAFE (California Facial
Expressions)
Images photographiques des visages de 50 sujets
7 images par sujet reflétant les émotions (en
colère, dégoûté, heureux, triste, craintif,
neutre, surpris).
380x240 pixels par image, 8 bit de profondeur

11
Exemple de 5 sujets, 4 émotions
12
Méthodologie

Taille des images réduite à 95x60 pixels
Tons de gris normalisés entre -1, 1
Paramètre dapprentissage ?0.1 et ?0.00115
(région non chaotique)
Étude de performance pour des prototypes, face au
bruit gaussien, à inversion de pixels, à la
rotation et aux patrons partiellement masqués

13
Bruit gaussien (30dbW)
14
Inversion de pixels (20)
15
Rotation (20o)
16
Résultats

Convergence après 15-17 époques dapprentissage
(300-340 présentations) pour des vecteurs
dentrée de de 5700 éléments (95x60 pixels)

17
Résultats
Bruit Rappel correct ()
Nil 100
Gaussien (30 dBW) 100
Inversion de pixels (20) 100
Inversion de pixels (40) 100
Inversion de pixels (50) 60
Inversion de pixels (60) 15
Inversion de pixels (gt60) 0
Masque 1 100
Masque 2 100
Rotation (10o) 30
Rotation (20o) 35
18
Généralisation pour CAFE
19
Généralisation pour CAFE
20
Généralisation pour CAFE
21
Discussion et conclusion

Pour le bruit gaussien, et le bruit par inversion
de pixels dintensité faible à modérée (lt40), le
taux de reconnaissance est 100 .
Le réseau a pu identifier la bonne lettre à
associer malgré la suppression de la région
oculaire, une région importante pour
l'identification des émotions.
Les résultats pour lensemble complet des
émotions et un nombre plus élevé de sujets
révèlent une excellente capacité de mémoire.
La propriété précédente peut être mise à profit
pour pallier à la faible performance du réseau
pour des images tournées, qui peuvent être
apprises comme des patrons distincts.
Les résultats obtenus sont surprenants en égard à
la simplicité relative de notre architecture.