Recuperacin de Informacin M' Andrea Rodrguez Tastets DIIC Universidad de Concepcin http:www'inf'udec - PowerPoint PPT Presentation

About This Presentation
Title:

Recuperacin de Informacin M' Andrea Rodrguez Tastets DIIC Universidad de Concepcin http:www'inf'udec

Description:

No es un proceso que cambia el conocimiento del usuario con respecto ... Exacta. Correspondencia. Recuperaci n de Informaci n. Recuperaci n de Datos. Sistema IR ... – PowerPoint PPT presentation

Number of Views:77
Avg rating:3.0/5.0
Slides: 15
Provided by: infU1
Category:

less

Transcript and Presenter's Notes

Title: Recuperacin de Informacin M' Andrea Rodrguez Tastets DIIC Universidad de Concepcin http:www'inf'udec


1
Recuperación de InformaciónM. Andrea Rodríguez
TastetsDIIC - Universidad de Concepciónhttp//ww
w.inf.udec.cl/andrea
2
Definición
  • Recuperación de información es un término
    convencionalmente usado para denotar el proceso
    por el cual un usuario es informado de la
    existencia (o no existencia) del documento que ha
    solicitado. No es un proceso que cambia el
    conocimiento del usuario con respecto a un tema
    específico, sistemas de pregunta-respuesta, ni un
    proceso de recuperación de datos.

3
Motivación
  • IR representación, almacenamiento, organización
    y acceso de ítems de información
  • Se centra en las necesidades del usuario
  • Necesidad de un usuario
  • Encuentre todos los documentos que contengan
    información de conferencias en ciencias de la
    computación y que (1) hayan ocurrido en Europa o
    EEUU (2) durante los últimos 2 años.
  • El énfasis es en la recuperación de información y
    no en los datos.

4
Datos versus Información
5
Sistema IR
  • Interpreta contenidos de ítems de información
  • Genera un ranking que refleja una relevancia
  • La noción de relevancia es muy importante

6
Motivación
  • IR inicialmente vista como una área particular
  • clasificación y categorización
  • sistemas y lenguajes
  • interfaz de usuarios y visualización
  • Aparece la Web y IR adquiere mayor relevancia
  • repositorio universal
  • bajo costo de acceso
  • no existe una editorial centralizada
  • muchos problemas relacionados con IR

7
Tareas de Usuario
  • Recuperación
  • información o datos
  • basado en própositos
  • Browsing
  • exploración

8
Conceptos Básicos
  • Vista lógica de documentos

Accents spacing
Noun groups
Manual indexing
stopwords
stemming
Docs
structure
9
The Retrieval Process
10
Proceso de Recuperación
  • Sistemas IR usan términos llamados índices para
    procesar consultas
  • Índices o palabras claves
  • una palabra clave o un conjunto de palabras
    seleccionadas
  • cualquier palabra
  • Stemming
  • connect connecting, connection, connections
  • Una estructura de indexación (índice invertidos)
    es construida para los índices escogidos.

11
Docs
índices
doc
match
Usuario
Ranking
query
12
Desafíos
  • Matching a nivel de índices es impreciso
  • Los usuarios no quedan muy satisfechos
  • Los usurios no tienen experiencia en consultas
  • Relevancia es crítica

13
Medidas de Evaluación
  • Recall R/R
  • Precision R/A

14
Medidas de Evaluación
  • Precision promedio Corresponde al promedio de la
    precisión después de cada nuevo documento
    relevante observado.
  • R-precision Es la precisión al Rth documento
    relevante recuperado.
  • Histogramas Compara dos algoritmos de
    recuperacion en base a la diferencia en los
    valores de Rth precision para un set de consultas
Write a Comment
User Comments (0)
About PowerShow.com