Utilisation%20de%20points%20d - PowerPoint PPT Presentation

About This Presentation
Title:

Utilisation%20de%20points%20d

Description:

Laboratoire d'Informatique, Universit Fran ois-Rabelais de Tours, ... Bases artificielles, classiques et r elles. Artificielles [Monmarch 2000] Machine ... – PowerPoint PPT presentation

Number of Views:46
Avg rating:3.0/5.0
Slides: 29
Provided by: Inv490
Category:

less

Transcript and Presenter's Notes

Title: Utilisation%20de%20points%20d


1
Utilisation de points dintérêt pour la
classificationinteractive de données
  • David Da Costa Gilles Venturini
  • Laboratoire dInformatique, Université
    François-Rabelais de Tours,
  • Polytech' Tours (Département Informatique)
  • Agicom, Institut dEtudes et de Marketing, Blois

2
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

3
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

4
Problème (1)
  • Données denquête questionnaire de satisfaction
  • Attributs questions, données réponses
    individu
  • Comprendre la population
  • Expert ? Recherche dinformations et de
    connaissances
  • But classification des données numériques ou
    symboliques permettant à un utilisateur expert du
    domaine dobtenir des informations pertinentes.

5
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

6
Survol des méthodes visuelles à base de POIs (1)
  • Principe
  • positionner sur une surface, quelques icônes
    (POIs) relatifs aux attributs des données
  • afficher les icônes des données à des positions
    déterminées par leur distance entre les POIs et
    les données
  • Exemple
  • affichage de documents issus dun moteur de
    recherche (facilite la navigation)
  • POIs les mots clés
  • Données les documents

7
Survol des méthodes visuelles à base de POIs (2)
  • En 2D
  • Radial Au et al., 2000
  • SQWID McCrickard et Kehoe, 1997

8
Survol des méthodes visuelles à base de POIs (3)
  • En 2D
  • Système VIBE Korfhage, 1991
  • VIBE simplifié Morse et al., 2002
  • Radviz Hoffman et al., 1999

9
Survol des méthodes visuelles à base de POIs (4)
  • En 3D
  • Lyberworld
  • Hemmje et al., 1994
  • (sphère de pertinence)

10
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

11
Méthodologie (1)
  • n données D1, ..., Dn
  • Sim matrice de similarité entre ces données
  • Sim(i,j) similarité entre Di et Dj
  • k points dintérêts(POIs) D1, ..., Dk
  • n k données restantes
  • (XDi,YDi) coordonnées de la donnée Di

12
Méthodologie (2)
  • Calcul des coordonnées des données restantes
  • Calcul des poids wj

13
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

14
Propriétés de la visualisation
  • Représentation 2D dun espace de similarité
    (données similaires ? données proches en 2D)
  • Si Di est identiquement similaire à lensemble
    des POIs alors Di sera affichée au milieu du
    cercle.
  • Choix des POIs
  • Données Supervisées autant de POIs que de
    classes
  • Données Non Supervisées k POIs au minimum 3
  • Ordre des POIs
  • Par rapport à leur similarité
  • Aléatoirement
  • Un POI une donnée ou des connaissances/hypothèse
    s
  • Combinaison dattributs
  • Données idéales ou cible (objectifs)

15
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

16
Interaction avec la visualisation
17
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

18
Applications et Résultats Obtenus (1)
  • Illustration du linterface

19
Applications et Résultats Obtenus (2)
  • Bases artificielles, classiques et réelles
  • Artificielles Monmarché 2000
  • Machine Learning Repository (http//www.ics.uci.ed
    u/mlearn/MLRepository.html)

Nom Type Dimensions Nombre de Classes Nombre de données
Art1 artificielle 2 4 400
Art2 artificielle 2 2 1000
Art6 artificielle 2 4 400
Iris classique 4 3 150
Wine classique 12 3 178
20
Applications et Résultats Obtenus (3)
  • Initialisation et interactivité des données

21
Applications et Résultats Obtenus (4)
  • Sélection et étiquettage des données

22
Applications et Résultats Obtenus (5)
  • Performance des résultats

Classe 1 Classe 2 Classe 3
Iris 50 50 50
Iris Clustering 50 77 23
trouvé 100 100 46
erreur 0 54 0
23
Applications et Résultats Obtenus (6)
  • Classification Supervisée

Machine Learning Repository Forest CoverType
data 581 012 attributs 54 classes 7
temps 91 sec.
24
Applications et Résultats Obtenus (7)
  • Classification Supervisée

GenFile 1000000 data 1 000 000
attributs 10 classes 5 temps 49 sec.
25
Plan de lexposé
  1. Problème
  2. Survol des méthodes visuelles à base de points
    dintérêts (POI)
  3. Méthodologie
  4. Propriétés de la visualisation
  5. Interaction avec la visualisation
  6. Applications et Résultats Obtenus
  7. Conclusion
  8. Perspectives

26
Conclusion
  • Transformer un base de données (matrice de
    similarité) en une représentation visuelle 2D de
    ces similarités
  • Rapidité daffichage
  • Présentation intuitive des données
  • Apprentissage plutôt rapide des capacités
    interactives pour la classification

27
Perspectives
  • Gérer un plus grand volume de données (une donnée
    1 pixel, au-delà de 1 000 000 données ?)
  • Visualisation de connaissances
  • Visualisation dune classification floue
  • Nouvelle mesure de similarité
  • Présenter une étude comparative (classification
    interactive, critères)
  • 3D

28
Merci de votre attention
Write a Comment
User Comments (0)
About PowerShow.com