Application d - PowerPoint PPT Presentation

1 / 22
About This Presentation
Title:

Application d

Description:

... dont les r sultats ne sont pas parfaits Quelques approches Transform e en ondelettes de Gabor sur 34 points Analyse de corr lation en phase de rappel 75-85 ... – PowerPoint PPT presentation

Number of Views:52
Avg rating:3.0/5.0
Slides: 23
Provided by: Mouni2
Category:

less

Transcript and Presenter's Notes

Title: Application d


1
Application dune mémoire associative
bidirectionnelle à fonction de sortie chaotique à
la reconnaissance dexpressions faciales
Karima Tabari1, Mounir Boukadoum1, Sylvain
Chartier2,3, Hakim Lounis1 1Université du Québec
à Montréal, 2Université du Québec en Outaouais,
3Institut Philippe-Pinel
de Montréal  
2
Motivation
  • Les émotions de lapprenant sont un facteur
    important pour un système tutoriel intelligent
  • Les émotions sont souvents exprimées à laide
    dexpressions faciales
  • La reconnaissance des expressions faciales
    demande habituellement des algorithmes complexes,
    dont les résultats ne sont pas parfaits

3
Quelques approches
  • Transformée en ondelettes de Gabor sur 34 points
  • Analyse de corrélation en phase de rappel
  • 75-85 de réussite
  • Vecteurs propres de regions choisies
  • Prétraitement par ACP
  • MLP avec 1 couche cachée
  • 86 de réussite

4
Les mémoire associatives
  • Dun grand intérêt théorique pour expliquer les
    capacités dassociation du cerveau humain
  • Un nouveau modèle corrige plusieurs limitations
    des mémoires associatives classiques (e.g.
    apprentissage binaire).
  • Architecture récurrente à fonction de sortie
    chaotique

5
Topologie du modèle
  • Les dimensions des couches X et Y nont pas à
    être égales
  • V nest pas la transposée de W

6
Règle dapprentissage
7
Règle dapprentissage
8
Fonction de sortie
  • Carte cubique dans -1,1

9
Algorithme dapprentissage
1- Sélection aléatoire dune paire (x0,
y0) 2- Calcul de xt et yt selon la nouvelle
règle de sortie. 3- Mise à jours des poids selon
la règle dapprentissage. 4- Répétition des
étapes 1 to 3 jusquà la convergence de la
matrice des poids.
10
Ensemble dapprentissage
  • Base de données CAFE (California Facial
    Expressions)
  • Images photographiques des visages de 50 sujets
  • 7 images par sujet reflétant les émotions (en
    colère, dégoûté, heureux, triste, craintif,
    neutre, surpris).
  • 380x240 pixels par image, 8 bit de profondeur

11
Exemple de 5 sujets, 4 émotions
12
Méthodologie
  • Taille des images réduite à 95x60 pixels
  • Tons de gris normalisés entre -1, 1
  • Paramètre dapprentissage ?0.1 et ?0.00115
    (région non chaotique)
  • Étude de performance pour des prototypes, face au
    bruit gaussien, à inversion de pixels, à la
    rotation et aux patrons partiellement masqués

13
Bruit gaussien (30dbW)
14
Inversion de pixels (20)
15
Rotation (20o)
16
Résultats
  • Convergence après 15-17 époques dapprentissage
    (300-340 présentations) pour des vecteurs
    dentrée de de 5700 éléments (95x60 pixels)

17
Résultats
Bruit Rappel correct ()
Nil 100
Gaussien (30 dBW) 100
Inversion de pixels (20) 100
Inversion de pixels (40) 100
Inversion de pixels (50) 60
Inversion de pixels (60) 15
Inversion de pixels (gt60) 0
Masque 1 100
Masque 2 100
Rotation (10o) 30
Rotation (20o) 35
18
Généralisation pour CAFE
19
Généralisation pour CAFE
20
Généralisation pour CAFE
21
Discussion et conclusion
  • Pour le bruit gaussien, et le bruit par inversion
    de pixels dintensité faible à modérée (lt40), le
    taux de reconnaissance est 100 .
  • Le réseau a pu identifier la bonne lettre à
    associer malgré la suppression de la région
    oculaire, une région importante pour
    l'identification des émotions.
  • Les résultats pour lensemble complet des
    émotions et un nombre plus élevé de sujets
    révèlent une excellente capacité de mémoire.
  • La propriété précédente peut être mise à profit
    pour pallier à la faible performance du réseau
    pour des images tournées, qui peuvent être
    apprises comme des patrons distincts.
  • Les résultats obtenus sont surprenants en égard à
    la simplicité relative de notre architecture.

22
Peut-on faire mieux ?
Write a Comment
User Comments (0)
About PowerShow.com