Title: Utilisation%20de%20points%20d
1Utilisation de points dintérêt pour la
classificationinteractive de données
- David Da Costa Gilles Venturini
- Laboratoire dInformatique, Université
François-Rabelais de Tours, - Polytech' Tours (Département Informatique)
- Agicom, Institut dEtudes et de Marketing, Blois
-
2Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
3Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
4Problème (1)
- Données denquête questionnaire de satisfaction
- Attributs questions, données réponses
individu - Comprendre la population
- Expert ? Recherche dinformations et de
connaissances - But classification des données numériques ou
symboliques permettant à un utilisateur expert du
domaine dobtenir des informations pertinentes.
5Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
6Survol des méthodes visuelles à base de POIs (1)
- Principe
- positionner sur une surface, quelques icônes
(POIs) relatifs aux attributs des données - afficher les icônes des données à des positions
déterminées par leur distance entre les POIs et
les données - Exemple
- affichage de documents issus dun moteur de
recherche (facilite la navigation) - POIs les mots clés
- Données les documents
7Survol des méthodes visuelles à base de POIs (2)
- En 2D
- Radial Au et al., 2000
- SQWID McCrickard et Kehoe, 1997
8Survol des méthodes visuelles à base de POIs (3)
- En 2D
- Système VIBE Korfhage, 1991
- VIBE simplifié Morse et al., 2002
- Radviz Hoffman et al., 1999
9Survol des méthodes visuelles à base de POIs (4)
- En 3D
- Lyberworld
- Hemmje et al., 1994
- (sphère de pertinence)
10Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
11Méthodologie (1)
- n données D1, ..., Dn
- Sim matrice de similarité entre ces données
- Sim(i,j) similarité entre Di et Dj
- k points dintérêts(POIs) D1, ..., Dk
- n k données restantes
- (XDi,YDi) coordonnées de la donnée Di
12Méthodologie (2)
- Calcul des coordonnées des données restantes
13Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
14Propriétés de la visualisation
- Représentation 2D dun espace de similarité
(données similaires ? données proches en 2D) - Si Di est identiquement similaire à lensemble
des POIs alors Di sera affichée au milieu du
cercle. - Choix des POIs
- Données Supervisées autant de POIs que de
classes - Données Non Supervisées k POIs au minimum 3
- Ordre des POIs
- Par rapport à leur similarité
- Aléatoirement
- Un POI une donnée ou des connaissances/hypothèse
s - Combinaison dattributs
- Données idéales ou cible (objectifs)
15Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
16Interaction avec la visualisation
17Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
18Applications et Résultats Obtenus (1)
- Illustration du linterface
19Applications et Résultats Obtenus (2)
- Bases artificielles, classiques et réelles
- Artificielles Monmarché 2000
- Machine Learning Repository (http//www.ics.uci.ed
u/mlearn/MLRepository.html)
Nom Type Dimensions Nombre de Classes Nombre de données
Art1 artificielle 2 4 400
Art2 artificielle 2 2 1000
Art6 artificielle 2 4 400
Iris classique 4 3 150
Wine classique 12 3 178
20Applications et Résultats Obtenus (3)
- Initialisation et interactivité des données
21Applications et Résultats Obtenus (4)
- Sélection et étiquettage des données
22Applications et Résultats Obtenus (5)
- Performance des résultats
Classe 1 Classe 2 Classe 3
Iris 50 50 50
Iris Clustering 50 77 23
trouvé 100 100 46
erreur 0 54 0
23Applications et Résultats Obtenus (6)
- Classification Supervisée
Machine Learning Repository Forest CoverType
data 581 012 attributs 54 classes 7
temps 91 sec.
24Applications et Résultats Obtenus (7)
- Classification Supervisée
GenFile 1000000 data 1 000 000
attributs 10 classes 5 temps 49 sec.
25Plan de lexposé
- Problème
- Survol des méthodes visuelles à base de points
dintérêts (POI) - Méthodologie
- Propriétés de la visualisation
- Interaction avec la visualisation
- Applications et Résultats Obtenus
- Conclusion
- Perspectives
26Conclusion
- Transformer un base de données (matrice de
similarité) en une représentation visuelle 2D de
ces similarités - Rapidité daffichage
- Présentation intuitive des données
- Apprentissage plutôt rapide des capacités
interactives pour la classification
27Perspectives
- Gérer un plus grand volume de données (une donnée
1 pixel, au-delà de 1 000 000 données ?) - Visualisation de connaissances
- Visualisation dune classification floue
- Nouvelle mesure de similarité
- Présenter une étude comparative (classification
interactive, critères) - 3D
28Merci de votre attention