Lanalyse factorielle pour la construction de cubes de donnes complexes PowerPoint PPT Presentation

presentation player overlay
1 / 6
About This Presentation
Transcript and Presenter's Notes

Title: Lanalyse factorielle pour la construction de cubes de donnes complexes


1
EGC 2005
Atelier Fouille de données complexes
Lanalyse factorielle pour la construction de
cubes de données complexes
R. Ben Messaoud, S. Rabaseda, O. Boussaid
Laboratoire ERIC Université de Lyon 2 5, avenue
Pierre-MendèsFrance 69676, Bron Cedex
France http//eric.univ-lyon2.fr
2
Contexte
  • Données complexes
  • ? multiformats l'information est portée par
    des données de types différents (numériques,
    symboliques, textes, images, vidéos ...)
  • multistructures les données peuvent être
    structurées, non structurées ou semi-structurées
    (BD, documents XML ...)
  • multisources les données proviennent de
    différentes origines (bases de données réparties,
    web ...)
  • multimodales un même phénomène est décrit par
    plusieurs canaux ou points de vue (données
    exprimées dans des échelles ou des langues
    différentes...)
  • multiversions les données sont évolutives
    (bases de données temporelles, recensements
    périodiques...).
  • http//bdd.univ-lyon2.fr

3
Problématique
  • Données complexes un grand nombre de
    descripteurs
  • Entreposage des données complexes des cubes
    avec un grand nombre de dimension
  • Problème de dimensionnalité importante et
    déparsité des cubes complexes
  • Problème de navigation et danalyse OLAP dans les
    cubes de données complexes
  • Nécessité de disposer de nouveau outils pour
    lassistance à la navigation et a la
    visualisation dans un cube de données complexes
  • Mise en évidence daxes danalyse et de régions
    pertinentes dans un cube

4
Proposition
  • Démarche couplage OLAP et fouille de données
  • Associer lOLAP à lanalyse factorielle pour
    projeter les faits dans de nouveau espaces de
    représentation des données

5
Proposition
  • Créer de nouvelles  dimensions factorielles 
    correspondant aux axes fournis par la méthode
    factorielle (ACM ou ACP)
  • ? Produire une meilleure visualisation qui résume
    et ajuste au mieux le nuage des faits
  • ? Fournir une assistance pour guider
    lutilisateur aux zones intéressantes du cube
    et/ou à des axes danalyse pertinents
  • ? Résoudre le problème de la grande
    dimensionnalité des cubes de données complexes

6
Points à résoudre
  • Choix des meilleurs axes factoriels
  • Pondération des faits par leurs mesures dans la
    construction des axes factoriels
  • Problème des cubes hétérogènes avec des
    dimensions qualitatives et quantitatives
  • Interprétation des nouvelles  dimensions
    factorielles 
  • Construction du r-cube à partir du d-cube
  • Indicateur de qualité pour apprécier le gain
    réalisé en terme dhomogénéité des cubes de
    données
Write a Comment
User Comments (0)
About PowerShow.com