Sistemi basati su conoscenza Semantic Web - PowerPoint PPT Presentation

1 / 33
About This Presentation
Title:

Sistemi basati su conoscenza Semantic Web

Description:

Sistemi basati su conoscenza Semantic Web Prof. M.T. PAZIENZA a.a. 2006-2007 * * * Ruolo del linguaggio naturale Su quale informazione possono basarsi le macchine? – PowerPoint PPT presentation

Number of Views:97
Avg rating:3.0/5.0
Slides: 34
Provided by: MariaTere58
Category:

less

Transcript and Presenter's Notes

Title: Sistemi basati su conoscenza Semantic Web


1
Sistemi basati su conoscenzaSemantic Web
  • Prof. M.T. PAZIENZA
  • a.a. 2006-2007

2
Introduzione
  • Internet contiene enormi quantità di dati
    memorizzati in milioni di pagine che vengono
    usate per lo scambio di informazioni.
  • In maggioranza sul web vengono create pagine a
    contenuto testuale ma prive di qualunque tipo di
    annotazione semantica. A causa di ciò il processo
    di ricerca si basa ancora quasi esclusivamente su
    keywords vanificando gli obiettivi ambiziosi di
    accesso alle informazioni supportato dal web

3
Tim Berners-Lee visione (2001)
  • ... a goal of the Web was that, if the
    interaction between person and hypertext could be
    so intuitive that the machine-readable
    information space gave an accurate representation
    of the state of people's thoughts, interactions,
    and work patterns, then machine analysis could
    become a very powerful management tool, seeing
    patterns in our work and facilitating our working
    together through the typical problems which beset
    the management of large organizations.
  • T. Berners Lee (ed altri) continuano a lavorare
    per la realizzazione di un tale progetto
    ambizioso ormai universalmente noto come Semantic
    Web

4
Situazione attuale syntactic Web
Hendler Miller 02
5
Il syntactic Web è
  • ...un luogo in cui
  • i calcolatori si preocupano della presentazione
    (attività facile da fare)
  • gli uomini curano linterpretazione ed i
    collegamenti (possono fare deduzioni da
    informazion parziali, associazioni mentali,
    possono combinare tra loro informazioni diverse,
    in lingue diverse etc).
  • hypermedia, una digital library
  • Una libreria di documenti (web pages)
    interconnessi da link ipermediali
  • Un database, una piattaforma per applicazioni
  • Un comune portale, accessibile da pagine web, di
    applicazioni che presentino i propri risultati
    come pagine web.
  • Una piattaforma per multimedia
  • BBC Radio 4 anywhere in the world! Terminator 3
    trailers!
  • Uno schema unico per i nomi
  • Identificatori unici per questi documenti
  • ... e gli agenti?

6
  • Perchè le informazioni siano processabili da un
    agente cè bisogno di
  • nomi non ambigui per le risorse (URIs) che
    possono anche collegare dati ad oggetti del mondo
    reale
  • un modello di dati comune RDF
  • unitamente a modalità di accesso a quei dati sul
    Web
  • vocabolari comuni RDFS, OWL
  • logiche per il ragionamento OWL, Regole
  • The Semantic Web is an infrastructure for the
    interchange and the integration of data on the
    Web
  • che estende il web sintattico e non lo
    sostituisce

7
Resource Description Framework (RDF)
  • RDF permette di scrivere statements che siano
    machine-processable.
  • Uno statement RDF è come una frase in cui quasi
    tutte le parole sono URI (Uniform Resource
    Identifier). Ciascuno statement RDF ha tre
    componenti un soggetto, un predicato e un
    oggetto.
  • Esempio di statement RDF
  • lthttp//aaronsw.com/gt lthttp//love.example.org/ter
    ms/reallyLikesgt lthttp//www.w3.org/People/Berners-
    Lee/Weaving/gt .
  • Cosa è scritto nello statement? Il primo URI è il
    soggetto (in questo caso la pagina di Aaron
    Swartz ). Il secondo URI è il predicato e mette
    in relazione il soggetto con loggetto. (In
    questo esempio il predicato è "reallyLikes). Il
    terzo URI è loggetto. (Qui loggetto è il libro
    di Tim Berners-Lee "Weaving the Web), così
    nellesempio si dice che Aaron Swartz really
    likes "Weaving the Web."

8
Resource Description Framework (RDF)
  • RDF è un grafo.
  • Una tripla (s,p,o) soggetto-proprietà-oggetto può
    essere vista come un arco etichettato in un grafo
  • i.e., un insieme di statements RDF è un grafo
    diretto etichettato
  • oggetti e soggetti sono nodi del grafo
  • proprietà sono gli archi

9
Il Semantic Web è
  • Il Semantic Web è un web di dati, una sorta di
    enorme database globale.
  • La motivazione per la creazione di una tale
    infrastruttura è altrove, qui si può solo
    identificare larchitettura per sè.

10
Semantic web roadmap
  • La parte a sinistra, il web, mostra come una URI,
    tramite lHTTP, viene convertita nella
    rappresentazione di un documento. E poi
    convertita in XML e poi in RDF, per produrre un
    grafo RDF o, a livello logico, in una formula
    logica.
  • La parte a destra, la parte semantica, mostra
    come il grafo RDF contiene un riferimento
    allURI.

11
Il syntactic Web è
  • Un luogo dove
  • gli elaboratori gestiscono la visualizzazione dei
    documenti (compito ben definito e facilmente
    implementabile)
  • le persone realizzano i collegamenti concettuali
    e linterpretazione (compito ancora non ben
    definito e difficile da realizzare)
  • Sarebbe interessante sviluppare processi
    automatici per il punto 2

12
Aspettative per il SW
  • Porre domande complesse che implichino background
    knowledge (vorrei informazioni su chi
    insegnabasi di dati)
  • Localizzare informazioni specifiche allinterno
    di data repositories (ricerche di percorsi di
    viaggio, prezzi di prodotti di una categoria
    merceologica, risultati di esperimenti, )
  • Delegare a web agents compiti complessi
  • (mostrami un sito dove comprare un laptop
    potente, non molto costoso e soprattutto leggero)

13
Qual è il problema?Consideriamo una pagina web
14
Qual è il problema?Consideriamo unaltra pagina
web
15
Qual è il problema?Consideriamo ancora unaltra
pagina web
16
Qual è il problema?
  • Le pagine sono state visualizzate negli opportuni
    formati e colori, i link ipertestuali sono
    opportunamente visualizzati e collegati ad altri
    contenuti il tutto indipendentemente dal
    linguaggio in cui le pagine sono state scritte
  • Il contenuto (semantico) di ciascuna pagina è
    accessibile solo agli umani ma non agli
    elaboratori

17
Un esempio analisi della query
Who holds the Database course?
18
Un esempio matching della query
list_all(X). relation(E,teach), arg1(E,
person_c(X)), arg2(E,course_c(Database course))
teach
19
Linformazione vista dalla macchina
  • WWW2002
  • The eleventh international world wide web
    conference
  • Sheraton waikiki hotel
  • Honolulu, hawaii, USA
  • 7-11 may 2002
  • 1 location 5 days learn interact
  • Registered participants coming from
  • australia, canada, chile denmark, france,
    germany, ghana, hong kong, india, ireland, italy,
    japan, malta, new zealand, the netherlands,
    norway, singapore, switzerland, the united
    kingdom, the united states, vietnam, zaire
  • Register now
  • On the 7th May Honolulu will provide the backdrop
    of the eleventh international world wide web
    conference. This prestigious event
  • Speakers confirmed
  • Tim berners-lee
  • Tim is the well known inventor of the Web,
  • Ian Foster
  • Ian is the pioneer of the Grid, the next
    generation internet

20
Solutione XML markup con tag ricchi di
significato
  • ltnamegtWWW2002
  • The eleventh international world wide
    webconlt/namegt
  • ltlocationgtSheraton waikiki hotel
  • Honolulu, hawaii, USAlt/locationgt
  • ltdategt7-11 may 2002lt/dategt
  • ltslogangt1 location 5 days learn interactlt/slogangt
  • ltparticipantsgtRegistered participants coming from
  • australia, canada, chile denmark, france,
    germany, ghana, hong kong, india, ireland, italy,
    japan, malta, new zealand, the netherlands,
    norway, singapore, switzerland, the united
    kingdom, the united states, vietnam,
    zairelt/participantsgt
  • ltintroductiongtRegister now
  • On the 7th May Honolulu will provide the backdrop
    of the eleventh international world wide web
    conference. This prestigious event
  • Speakers confirmedlt/introductiongt
  • ltspeakergtTim berners-leelt/speakergt
  • ltbiogtTim is the well known inventor of the
    Web,lt/biogt

21
Ma cosa dire circa i contenuti?
  • ltconfgtWWW2002
  • The eleventh international world wide
    webconlt/confgt
  • ltplacegtSheraton waikiki hotel
  • Honolulu, hawaii, USAlt/placegt
  • ltdategt7-11 may 2002lt/dategt
  • ltslogangt1 location 5 days learn interactlt/slogangt
  • ltparticipantsgtRegistered participants coming from
  • australia, canada, chile denmark, france,
    germany, ghana, hong kong, india, ireland, italy,
    japan, malta, new zealand, the netherlands,
    norway, singapore, switzerland, the united
    kingdom, the united states, vietnam,
    zairelt/participantsgt
  • ltintroductiongtRegister now
  • On the 7th May Honolulu will provide the backdrop
    of the eleventh international world wide web
    conference. This prestigious event
  • Speakers confirmedlt/introductiongt
  • ltspeakergtTim berners-leelt/speakergt
  • ltbiogtTim is the well known inventor of the Web,

22
Cè bisogno di semantica
  • External agreement sul significato delle
    annotazioni
  • Accordo sul significato di un insieme di tag di
    annotazione
  • Problemi possibili
  • Scarsa flessibilità
  • Numero limitato di fatti che possono essere
    espressi
  • Uso di Ontologie per specificare il significato
    delle annotazioni
  • Le ontologie forniscono un vocabolario di termini
  • Nuovi termini posso essere formati combinando
    termini preesistenti Conceptual Lego
  • Il significato (semantica) di tali termini è
    formalmente specificato
  • E possibile specificare relazioni tra termini in
    ontologie diverse.

23
AKT 2003
24
Quali le difficoltà?
  • I linguaggi ontologici sono complessi
  • Le ontologie sono complesse (le persone le
    realizzano facilmente usando lintuizione
    piuttosto che la logica ma lintuizione è
    difficile da formalizzare)
  • La complessità del problema è nota sin
    dallantichità (Aristotele), ed ora torna di
    attualità perché il SW diventa significativo una
    volta definiti i problemi di rappresentazione
    della conoscenza

25
Struttura delle ontologie
  • Le ontologie in genere si basano su due
    componenti principali
  • Vengono usati nomi per indicare concetti di
    dominio
  • Elefante è un concetto i cui membri sono degli
    animali
  • Erbivoro è un concetto i cui membri sono proprio
    quegli animali che mangiano solo piante o parti
    di piante
  • Elefante adulto è un concetto i cui membri sono
    proprio quegli elefanti con età superiore a 20
    anni
  • Conoscenza di background /vincoli sul dominio
  • Gli elefanti adulti pesano almeno 2000 kg
  • Tutti gli elefanti sono o elefanti africani o
    elefanti indiani
  • Nessun individuo può essere contemporaneamente un
    erbivoro ed un carnivoro

26
Gestione delle ontologie
  • Necessità di definire tool e servizi per aiutare
    gli utenti a
  • Disegnare e mantenere ontologie di qualità,
    ovvero
  • Ricche di significato tutte le classi definite
    devono avere istanze
  • Corrette catturare le intuizioni degli esperti
  • Scarsamente ridontanti evitare sinonimi inutili
  • Ampiamente assiomatizzate descrizioni
    dettagliate
  • Memorizzare numerose istanze di classi di
    dominio, ovvero
  • Annotazioni dalle pagine web
  • Rispondere a query relative a classi ed istanze
    dellontologia, ovvero
  • Trovare classi più generali/specifiche
  • Trovare pagine/annotazioni corrispondenti ad una
    data descrizione
  • Integrare ed allineare più ontologie

27
Premise a promise
The concept of machine-understandable documents
does not imply some magical artificial
intelligence which allows machines to comprehend
human mumblings. It only indicates a machine's
ability to solve a well-defined problem by
performing well-defined operations on existing
well-defined data. Instead of asking machines to
understand people's language, it involves asking
people to make the extra effort. Tim
Berners-Lee, What the Semantic Web can
represent, 1998. http//www.w3.org/DesignIssues/
RDFnot.html
  • quindi

28
Soluzioni per il SW
  • Ladesione a linguaggi per la rappresentazione
    della conoscenza sul web, come RDF e OWL,
    dovrebbe garantire una effettiva interoperabilità
    della conoscenza distribuita tra più sorgenti
    informative autonomamente definite.
  • Il passaggio da syntactic a semantic web più che
    richiedere una maggiore intelligenza da parte dei
    sistemi di calcolo, può avvenire se si
    definiscono metodologie condivise (standard) per
    la rappresentazione della conoscenza.
  • ma

29
Modelli e Meta-modelli
  • OWL, RDF etc.. non sono modelli del
    mondo/dominio, sono modelli per la
    rappresentazione della conoscenza e, di
    conseguenza, meta-modelli per descrivere oggetti
    del mondo reale.
  • Se si afferma A is-a B, si intende
  • che tutte le istanze di A sono anche istanze di B
  • che tutte le istanze di A sono soggette alle
    restrizioni delle proprietà che sono specificate
    su B
  • Non si può affermare
  • come le istanze di A (o B) si relazionino con
    oggetti del mondo reale

30
Soluzioni per il SW
  • Per tornare alle parole di Berners-Lee, non cè
    alcuna necessità di
  • magical artificial intelligence
  • natural language understanding
  • bensì soltanto di aderire ad un livello
    ontologico
  • non necessariamente ad una sola ontologia
    generale
  • ma un insieme di ontologie di fiducia che
    vengono condivise in un dato contesto.

31
Semantica di una ontologia
  • La semantica di una ontologia viene definita
    tramite
  • linterpretazione data da coloro che usano
    lontologia stessa allinterno di un framework
    specifico (red car è una macchina rossa o un
    modellino di macchina rossa?)
  • luso che le applicazioni fanno dei concetti
    dellontologia allinterno del framework in cui
    sono coinvolte
  • Lo spazio dei nomi si comporta, sotto tutti gli
    aspetti, come referente degli oggetti allinterno
    dello stesso framework. Si ipotizza che
  • gli umani siano capaci di interpretare nella
    stessa maniera gli stessi nomi nello stesso
    spazio dei nomi, così come
  • le macchine siano capaci di usare tali dati
    consistentemente.

32
Cosa accade in caso di mancato agreement
semantico?
  • Esistono molte ontologie tra loro diverse e
    continuamente altre vengono sviluppate
    relativamente allo stesso dominio o a domini
    parzialmente sovrapposti
  • Integrare le loro informazioni è importante sia
  • a livello di schema
  • Migrazione della conoscenza ed interrogazioni
    remote
  • a livello di dati
  • Espandere la conoscenza relativa agli stessi
    oggetti
  • Tale integrazione può essere realizzata
    attraverso processi di
  • Ontology Merging (produzione di una sola risorsa
    globale da altre pre-esistenti)
  • Ontology Alignment (mappings tra due risorse
    esistenti)

SK
33
Cosa accade in caso di mancato agreement
semantico?
  • La mancanza di un qualsivoglia accordo rende
    difficile che
  • concettualizzazioni analoghe in diverse ontologie
    siano facilmente mappate una con laltra
  • questi mappings siano semanticamente
    conservativi
  • Ciò implica che i sistemi di calcolo siano
    coinvolti in attività ulteriori di processing per
    rendere la conoscenza
  • comprensibile
  • interoperabile

34
Ruolo del linguaggio naturale
  • Su quale informazione possono basarsi le
    macchine? Il linguaggio
  • Il linguaggio (naturale), alla fine, può essere
    considerato lultima risorsa sfruttabile
  • Rimane lunico modo per trasferire la semantica
    dei dati
  • Aiuta gli umani a capire come oggetti formali
    corrispondano alla loro conoscenza sul mondo
  • Può essere daiuto alle macchine nellarmonizzare
    differenti concettualizzazioni
  • Pro offre un modo ricco ed universalmente
    accettato per esprimere il significato
  • Contro è ambiguo fenomeni di synonimia ed
    omonimia
  • Limportanza del linguaggio è spesso
    sottostimata, sotto molti aspetti
  • Risultati sperimentali (e.g. nel Ontology
    Alignment)
  • Standard (nessuno standard nè per associare il
    linguaggio alla conoscenza concettuale, nè per
    rappresentare la stessa conoscenza linguistica)
  • Risorse / Infrastrutture
Write a Comment
User Comments (0)
About PowerShow.com