Manejo de colecciones de datos cient - PowerPoint PPT Presentation

1 / 30
About This Presentation
Title:

Manejo de colecciones de datos cient

Description:

Universidad de Los Andes, Centro Nacional de C lculo Cient fico, Parque Tecnol gico de M rida ... (Interfaz a Clearinghouse FGDC y GCMD Data Documenter) 10 ... – PowerPoint PPT presentation

Number of Views:31
Avg rating:3.0/5.0
Slides: 31
Provided by: cecal
Category:

less

Transcript and Presenter's Notes

Title: Manejo de colecciones de datos cient


1
Manejo de colecciones de datos científicos en la
Web
  • I Jornadas de Divulgación de Tecnologías de
    Información y Comunicaciones y el Desarrollo
    SostenibleDTIC-UCVCaracas Julio 2005

Rodrigo Torréns, Zulay Méndez, Magdiel Ablan,
Rigoberto Andressen
Universidad de Los Andes, Centro Nacional de
Cálculo Científico, Parque Tecnológico de Mérida
2
Introducción
  • Comentarios iniciales sobre
  • Manejo de colecciones de datos en Venezuela
  • Red de Estaciones Bio-climáticas de Mérida
  • ECO-RED Venezuela
  • Red ILTER (International Long Term Ecological
    Research Network)

3
Los datos producto de una investigación científica
  • Los datos que yo necesito, existen?
  • Dónde están?
  • Cómo los obtengo?

Uso de tecnologías de información para
  • Ubicar
  • Accesar
  • Recuperar
  • Compartir
  • datos

4
Objetivos
Para lograr el Uso secundario y a largo plazo
de colecciones de datos científicos
Se debeUbicar y recuperar informaciónGarantiz
ar permanencia de los datos en el tiempo
Herramientas organizativas y tecnológicas que
pueden hacer esto posible
5
Herramientas
Herramientas organizativas y tecnológicas que
pueden hacer esto posible
6
  • " Datos sobre los datos " .
  • "Nivel superior de la información, o
    instrucciones que describen el contenido,
    contexto, calidad, estructura, y accesibilidad
    de una colección de datos específica" (J.K.
    Michener 1997).

Metadatos como parte de los datos
Metadatos externos al recurso de información
Meta-metadatos (colecciones de metadatos)
7
  • Preguntas que se deberían poder responder usando
    metadatos
  • Qué datos describe una colección de datos
    científicos?
  • Quien produjo la colección?
  • Porqué fue creada la colección?
  • Cómo fue creada la colección?
  • Cuan confiables son los datos. Qué problemas
    persisten en la colección?
  • Cómo alguien puede obtener una copia de la
    colección?
  • Quien escribió los metadatos?

8
Ejemplos de metadatos y de comunidades que usan
metadatos
Muestra datos NBIIhttp//www.nbii.gov/
Documentación de datos geoespaciales (estándar
FGDC) http//cndg.clearinghouse.gub.uy
9
Ejemplos de metadatos y de comunidades que usan
metadatos
Documentación de datos geoespaciales (Interfaz a
Clearinghouse FGDC y GCMD Data Documenter)
10
Algunos de los estándares para metadatos
geoespaciales, biológicos y ambientales más
usados
  •  
  • FGDC-CSDGM. Content Standard for Digital
    Geospatial Metadata. Federal Geographic Data
    Committe (1994) Datos geoespaciales.
    www.fgdc.gov
  • FGDC-NBII. Perfil Biológico de FGDC. Biología y
    ciencias naturales. www.nbii.gov.
  • Global Change Master Directory Interchange Format
    DIF. (1993) Ciencias de la Tierra.
    gcmd.gsfc.nasa.gov
  • Darwin Core (DwC). Colecciones de Historia
    Natural.
  • Descriptores para Metadatos no-geoespaciales.
    NCEAS-LTER (1997) Datos ecológicos. Base del
    estándar EML. lternet.washington.edu

11
Manejo de colecciones de datos científicos.
Algunas experiencias locales
Red de Estaciones Ecológicas de Venezuela
(ECORED)
Red de Estaciones Bioclimáticas del Estado
Mérida (redbc)
12
Justificación
  • Dificultades que existen en Venezuela para ubicar
    y usar colecciones de datos bio-climáticos.
  • Interés de organizaciones, instituciones y
    personas que tienen datos históricos los cuales
    desean preservar o compartir para su uso a largo
    plazo.
  • Necesidad de implementar un sistema de
    información que permita realizar análisis y
    descubrir correlaciones entre diferentes
    conjuntos de información, que ayuden a la toma de
    decisiones e investigación científica.

13
Objetivos principales
  • Manejo, identificación, y preservación en el
    tiempo, de recursos de información relacionados
    con la biología y el clima usando estándares
    internacionales de formato y contenidos.
  • Generación de un Sistema de Información a través
    del Web que permita el facil acceso de
    investigadores, productores y organizaciones que
    necesiten la información producida por la red de
    estaciones.

14
Objetivos secundarios
  • Mantener en el tiempo las colecciones de datos y
    desarrollar mecanismos de almacenamiento,
    catalogación y distribución de la información
    generada.
  • Realizar permanentemente labores de
    identificación de nuevas fuentes de información
    que puedan incorporarse a las colecciones
    existentes.
  • Concientizar a los científicos sobre la
    importancia de la preservación de los datos
    generados en sus investigaciones.

15
Estaciones de la redbc
  • Estación INIA-Chama, Sur del Lago de Maracaibo
  • Estación Ciplat, Sur del Lago de Maracaibo
  • Estación La Hechicera, Mérida
  • Estación Mucujún, Mérida
  • Estación Santa Rosa, Mérida
  • Estación San Juan, Mérida

16
  • Centro Internacional del Plátano (CIPLAT)
  • Instituto Nacional de Investigaciones Agrícolas
    (INIA)- Chama, Sur del Lago
  • Instituto de Ciencias Ambientales y Ecológicas
    (ICAE) de la ULA
  • Instituto de Investigaciones Agropecuarlas de la
    ULA (IIAULA)

17
Funcionamiento de la redbc
Sistema de Información Bioclimático basado en el
web
  • Ubicación de características de colecciones de
    datos.
  • Utilización de tecnologías Internet-Web, que
    aceleran y facilitan grandemente el proceso de
    captura, actualización y difusión de la
    información bio-climática, permitiendo varios
    niveles de acceso y recuperación de dicha
    información.
  • Actualmente sólo se proveen datos sin procesar
    (archivos de datos provenientes de las estaciones
    meteorológicas) y sus respectivos metadatos. En
    el futuro se podrá acceder a información
    previamente procesada (gráficos, tablas, etc).
  • Libre acceso a colecciones de datos (datasets)
    producidos por miembros de la red y (en lo
    posible) por cualquier persona o institución que
    los necesite.

18
Funcionamiento de la redbc
Sistema de manejo de datos
Datos llegan por varias vías (enviados por
gerentes locales de información) -E-mail
-Web-CD-Entregas personales Gerentes
Centrales de información los procesan de ser
necesario y los publican en Internet
19
Ejemplo Colección de datos Estación Chama
Es
20
Ejemplo Colección de datos Estación Chama
Formato de metadatos
  • html
  • xml (EML Ecological Metadata Language)
  • txt
  • Presentación de datos
  • Datos originales (sin procesar)
  • Datos ordenados (Por año y por mes)

Enlace
21
Ejemplo Colección de datos Estación Chama
Metadatos xml (EML) (para intercambio con otros
sistemas y procesamiento automático)
22
Ejemplo Colección de datos Estación Chama
Interfaces Web Datos originales
23
Ejemplo Colección de datos Estación Chama
Datos originales
Datos sin procesar, tal como vienen de los
instrumentos o científicos que los capturan
24
Ejemplo Colección de datos Estación Chama
Datos ordenados
Datos con algún tipo de procesamiento
25
Ejemplo Consulta en KNB
Datos enviados a KNB
http//knb.ecoinformatics.org
26
Afiliarse a la redbc
  • Contactar por e-mail o teléfono al Proveedor de
    metadatos

Documentar los datos
Llenar Planilla de documentación de datos
proporcionada por el gerente central de
información. Se pueden configurar planillas de
diferentes tipos Web, Word, txt, etc.
27
  • Escaso conocimiento de la importancia de la
    preservación y posibilidades de uso secundario de
    los datos.
  • Poca disposición de los científicos para
    compartir los datos.
  • Poca receptividad para aportar metadatos que
    documenten las colecciones de datos.
  • Confusiones que tienen que ver con los derechos
    de propiedad y uso de los datos.
  • Información incorrecta sobre la calidad y
    cantidad de información que dicen poseer algunas
    instituciones (entorpece la investigación).
  • Bajo interés por parte de algunos gerentes de
    información local en publicar sus colecciones de
    datos (retardo en envío de datos-pérdida de
    información).
  • Algunos gerentes locales no disponen de conexión
    a internet.
  • Costos de los instrumentos de captura de datos.
  • No existe la figura de gerente local de
    información.

28
  • Usos futuros
  • Redes de manejo de conocimientos basadas en datos
    y metadatos (intención de KNB)
  • Acceso a herramientas analíticas "en-línea" para
    integrar varias herramientas como SAS, MATLAB,
    etc. con acceso a datos de red de científicos
    (LTER)
  • Herramientas para producir formas alternativas de
    metadatos que permitan a cualquier sitio
    participar fácilmente en otras bases de datos
    internacionales y Clearinghouses de datos (FGDC,
    GCMD, NBII, etc.)

29
  • Clearinghouse Federal Geographic Data Commite
    (FGDC,NBII)http//www.fgdc.gov/clearinghouse/
  • Global Change Master Directory (GCMD,
    DIF)http//gcmd.gsfc.nasa.gov
  • Long Term Ecological Research Network (LTER,
    EML)http//lternet.edu
  • Knowledge Network of Biocomplexity
  • http//knb.ecoinformatics.org
  • National Center for Ecological Analysis and
    Synthesiswww.nceas.gov

30
www.cecalc.ula.ve/redbc/
Write a Comment
User Comments (0)
About PowerShow.com