Anlisis de informacin basado en conceptos y su aplicacin en el apoyo a la generacin de indicadores - PowerPoint PPT Presentation

1 / 25
About This Presentation
Title:

Anlisis de informacin basado en conceptos y su aplicacin en el apoyo a la generacin de indicadores

Description:

Hoy es posible unir din micamente los datos provenientes de las bases de datos ... frequently suffer debilitating weight loss, diarrhea, and a type of cancer ... – PowerPoint PPT presentation

Number of Views:39
Avg rating:3.0/5.0
Slides: 26
Provided by: JorgeW150
Category:

less

Transcript and Presenter's Notes

Title: Anlisis de informacin basado en conceptos y su aplicacin en el apoyo a la generacin de indicadores


1
Análisis de información basado en conceptos y su
aplicación en el apoyo a la generación de
indicadores
Julio Raffo, RICYT Jraffo_at_ricyt.edu.ar Jorge
Walters Gastelu Jorge_at_octondegus.com
2
Motivación (i)
  • Hoy es posible unir dinámicamente los datos
    provenientes de las bases de datos de gestión de
    la actividad científica, con la producción
    científica propiamente tal.
  • La capacidad de almacenamiento permite disponer
    de textos completos en formato digital
  • Proyectos, publicaciones científicas, patentes
  • Las fuentes de información disponibles en
    Internet y en redes especializadas dejan
    disponible contenidos que están disponibles antes
    que los datos necesarios para la generación de
    indicadores tradicionales.
  • El desarrollo de tecnologías para el
    procesamiento de información basada en conceptos.
  • Collexis (http//www.collexis.com/)

3
Motivación (ii)
DB
Metadatos
Documento original
Análisis automático
4
La tecnología
5
Testing Collexis technologyThe Abstraction
Process
Illustration from Collexis http//www.collexis.co
m/
6
Testing Collexis technologyAbstraction Process
Simplified
7
Un documento, un vector en el espacio definido
por el tesauro
B
d2
d1
d3
A
8
El experimento
9
El modelo (i)
  • Resúmenes de Medline (un segmento) para generar
    una collexion. Para cada resumen se genera un
    vector de conceptos (fingerprint)
  • El espacio está definido por MESH (2002)
  • La definición de SIDA, según NLM, define lo que
    entendemos por este concepto y nos sirve para
    restringir el espacio de análisis (sólo un
    ejemplo!).
  • A partir de una búsqueda filtrada para un país
    específico, obtenemos el conjunto de fingerprints
    (vectores) de documentos relevantes al tema.

10
Un país representado como un vector en el espacio
definido por el tesauro, y restringido/comparado
a un área particular
B
País 2
País 1
País 3
A
11
El modelo (ii)
FingerPrintpaís Compi(fpdoci)
Ángulo entre 2 países Ángulo de un país y el
patrón Comparación de los ángulos con el patrón
B
País 2
País 1
AIDS
País 3
A
12
Un texto que define...
The most severe manifestation of infection with
the Human Immunodeficiency Virus (HIV). The
Centers for Disease Control and Prevention (CDC)
lists numerous opportunistic infections and
cancers that, in the presence of HIV infection,
constitute an AIDS diagnosis. In 1993, CDC
expanded the criteria for an AIDS diagnosis in
adults and adolescents to include CD4 T-cell
count at or below 200 cells per microliter in the
presence of HIV infection. In persons (age 5 and
older) with normally functioning immune systems,
CD4 T-cell counts usually range from 500 - 1,500
cells per microliter. Persons living with AIDS
often have infections of the lungs, brain, eyes,
and other organs, and frequently suffer
debilitating weight loss, diarrhea, and a type of
cancer called Kaposi's Sarcoma. See HIV Disease
Opportunistic Infection AIDS Wasting Syndrome
13
El fingerprint de AIDS
14
AIDS in Brazil
15
(No Transcript)
16
El fingerprint de Estados Unidos
17
(No Transcript)
18
Posibles aplicaciones
19
mapas conceptuales
20
Mesh 2002 v/s Medline 1999
Thanks to Martin Schmidt and Mario
Diwersy(http//www.syynx.de/)
21
MESH 2002 v/s MEDLINE 2001
Thanks to Martin Schmidt and Mario
Diwersy(http//www.syynx.de/)
22
Vista geográfica intesidad cercanía al tema
  • La producción del país.
  • Un tema específico.
  • Intensidades de color para representar mayor o
    menor cercanía al tema en estudio.

23
Vista geográfica (ii)
24
Ditribución de especialistas
25
A modo de conclusión y próximos pasos
  • Seguir probando el modelo
  • La tecnología es estable
  • Los contenidos existen
  • Se define un espacio que independiza del tipo de
    documento y del idioma
  • Es crucial la construcción/adopción de un
    vocabulario. Superado en el área de la salud.
  • Aplicar el modelo a contenidos válidos y con un
    volumen adecuado.
  • Estudiar la relación con indicadores
    tradicionales.
  • Aplicar el modelo a nivel institucional y en
    otras áreas.

26
Muchas gracias!
Write a Comment
User Comments (0)
About PowerShow.com