Title: Les ontologies dans l'entreprise pour le non structur : enjeux et cas concrets
1Les ontologies dans l'entreprise pour le non
structuré enjeux et cas concrets
- Nicolas Dessaigne Doctorant
- Alain Garnier CTO
nicolas.dessaigne_at_arisem.com alain.garnier_at_arisem.
com
http//www.arisem.com
2Agenda
- Situation du non structuré
- Pourquoi les ontologies ?
- Quels standards ?
- Implémentations usages
- Un cas concret Pernod Ricard
- Conclusion
- Questions Réponses
3Situation du non structuré
- Des masses de données peu structurées
- Web / Intranet
- Fichiers
- Base Notes, Mails
- On ne maîtrise ni la production ni la diffusion
- Le besoin trouver mettre en valeur
- Exemple la RD a besoin de connaître les
visions Marketing. Oméga3 Acides Gras
Insaturés - Écueils entre le trop et le trop peu !
- GDE structurer à priori alors que les "tags" et
les catégories évoluent trop vite - Ne rien faire et avoir un système d'accès "full
text like" (pb de pertinence)
4Pourquoi les ontologies ?
- C'est en mêlant du structuré signifiant au non
structuré qu'on pourra dépasser les limites du
non structuré ? Méta-données - Il faut adopter un point de vue local signifiant
pour gérer le global en contexte ? Sémantique - Le Web Sémantique est la pierre angulaire de
rencontre entre ces deux dimensions.
5Mettre l'information sous un référentiel commun
standard
- Existant les technologies Web
- Communautés W3C, OASIS, etc.
- Standard Technologique
- Standard Industriel
- Standard Utilisateur avant tout
- Méta-données communes Web Sémantique
- Dublin Core, ebXML
- RDF, DAML OIL, OWL
- Web Sémantique
- Communautés ? Ok
- Technologies ? En cours
- Industriels ? Nous ?
- Question ouverte le Web Sémantique sera-t-il
relayé au niveau utilisateur?
6Implémentations usages
- Recherche évoluée
- Enrichissement automatique
- Extraction de concepts nommés
7Recherche évoluée
- Usage mêler structuré non structuré pour le
push et la recherche - Classement automatique par le contenu
- Recherche sémantique
- Exemple alliances avec France Telecom ?
- Orange est-un filiale de FT ? Recherche
élargie, conceptuelle et cross-lingue - Classement des sociétés du domaine ? Push
automatisé - Perspectives du Web Sémantique
- A la source, on aura linformation comme quoi
Orange est bien une filiale de FT et non le fruit - Partage public des ontologies
8Enrichissement automatique
- Usage ajouter des méta-données structurantes
aux données non structurées - Extraire des dates, des thématiques
- Reformater en RDF
- Exemple Alimenter un repository RDF avec des
données hétérogènes - Fils de Presse, Web
- Perspectives
- Généralisation dans le standard Web Sémantique
(schémas communs) - Interopérabilité
9Extraction de concepts nommés
- Usage utiliser à 100 linformation
- Extraire les instances qui ne sont pas dans
les ontologies Acteurs, Noms, Sociétés - Alimenter un SGBD génération dOntologies
- Exemple
- Identifier les nouveaux produits, acteurs
- Analyse décisionnelle extraire des
indicateurs chiffrés courbes de tendances
(e.g., évolution du nb dacteurs sur un marché) - Perspectives
- Étendre à des patterns complexes
- Intégration dans le WS comme dimension floue ?
10Un cas concret Pernod Ricard
- Pernod-Ricard
- Numéro 2 des vins spiritueux
- Des milliers de marques / de produits
- Des centaines de marchés
- Besoin trouver linformation MKT construire
une culture commune - Pour la communauté marketing
- Documents internes MAIS aussi externes
- Multilingues
- Syndiquer les référentiels
- Système qui doit mixer structuré et non structuré
(axes métiers classiques produits, marchés,
etc.)
11Implémentation back office
- Référentiel sémantique
- Concepts métiers multilingues
- Ontologies primaires création depuis leur SGBD
- Produits Marques
- Concurrents
- Marchés
- Ontologies daccès
- Référentiel de données
- Méta-données standardisées pour toutes les
sources dans un SGBD Web, Intranet, Fils de
Presse
12Usage front office
- Portail daccès pour la communauté
- Accès direct par moteur de recherche
- Accès par plan de classement (Ontologie daccès)
- Recherche 1-2-3 Marché / Produit / Géographie
- Milliers de documents référencés
- Centaines de visites / jours
13Conclusion
- Monsieur Jourdain (Molière)
- En attendant OWL (Becket)
- Problème majeur des Ontologies en entreprise
mettre en phase la stratégie avec le système
d'information - Évolution permanente des Ontologies.
- On ne peut donc que construire des "Ontologies On
Demand". - Le Web Sémantique préfigure à terme une rencontre
structuré / non-structuré - Mais quelle adoption par les utilisateurs ?
14 Ce que la poésie fait de plus sublime, c'est de
donner aux choses insensées sens et passions.
Giambattista Vico
- Le Web Sémantique donne aux choses sensées un
sens donné
15Questions Réponses