Title: Teoria e tecniche della catalogazione e classificazione ricerca9web
1Teoria e tecniche della catalogazione e
classificazionericerca9web
- Prof.ssa Elisa Grignani
- Università degli studi di Parma
- aa. 2005/2006
2Abbiamo visto
- Processo di recupero dellinformazione
- Rilevanza / Richiamo / Precisione
- Sistemi di recupero dellinformazione
3Richiamo / Precisione
- Livelli di richiamo / precisione determinati
dalle politiche di indicizzazione - Esaustività
- indicizzazione approfondita
- sommarizzazione
- Specificità
- genere / specie
4Struttura di un sistema IR
Search Line
Storage Line
Interest profiles Queries
Documents data
Information Storage and Retrieval System
Rules of the game Rules for subject indexing
Thesaurus (which consists of Lead-In Vocabulary
and Indexing Language
Indexing (Descriptive and Subject)
Formulating query in terms of descriptors
Storage of profiles
Storage of Documents
Store1 Profiles/ Search requests
Store2 Document representations
Comparison/ Matching
Adapted from Soergel, p. 19
Potentially Relevant Documents
5Sistemi IR struttura (da Cooper - Maron, 1985)
- linsieme delle possibili chiavi di accesso
assegnate ai documenti - linsieme delle domande formulabili dagli utenti
- linsieme degli indicatori di valore informativo
da assegnare ai documenti - una regola di recupero.
6Sistemi IR - Modelli E - vettoriale,
statistical weighting, probabilistico ...
- chiavi di accesso COME NEI MODELLI B, C, D
- domande COME NEI MODELLI D, E E POSSIBILE
FILTRARE LE DOMANDE - indicatori di valore informativo GLI INDICATORI
DI VALORE INFORMATIVO SONO TUTTI I NUMERI REALI
(il documento può avere maggiore o minore valore
informativo in funzione di una domanda) - regola di recuperoAL DOC. VIENE ATTRIBUITO UN
INDICATORE DI VALORE (che ne determina la
priorità di recupero) CALCOLATO SECONDO ALGORITMI
diversi secondo i diversi sistemi
7OGGI search the Web
- World Wide Web una ragnatela vasta come il mondo
- Il sistema più avanzato per organizzare le
informazioni presenti in Internet (Berners-Lee,
1992) - Il WWW è una convergenza di risorse
computerizzate per collegare informazioni
disperse attraverso Internet in modo da renderle
facilmente accessibili (December, 1994)
8WWW navigazione e recupero dellinformazione
- motori e metamotori di ricerca
- directories
- andare alla pagina
- http//www.lib.berkeley.edu/Help/search.html
9Directories vs. Search EnginesAn IMPORTANT
Distinction
- Directories
- Hand-selected sites
- Search over the contents of the descriptions of
the pages - Organized in advance into categories
- Search Engines
- All pages in all sites
- Search over the contents of the pages themselves
- Organized after the query by relevance rankings
or other scores
10Repertori Web
- Enciclopedie
- Wikipedia lthttp//it.wikipedia.org/wiki/Pa
gina_principalegt -
- Repertori biografici
- Saur WBIS
- lthttp//www.saur-wbi.de/gt
-
- Atlanti
-
11Molti altri repertori Web