Rendre les standards de description de biopuces accessibles: - PowerPoint PPT Presentation

About This Presentation
Title:

Rendre les standards de description de biopuces accessibles:

Description:

Reporter: l ment d pos sur une feature, qui a certaines caract ristiques, ... s quences composites entre les ' reporter ' vers une entit biologique. ... – PowerPoint PPT presentation

Number of Views:26
Avg rating:3.0/5.0
Slides: 25
Provided by: pier222
Category:

less

Transcript and Presenter's Notes

Title: Rendre les standards de description de biopuces accessibles:


1
Rendre les standards de description de biopuces
accessibles
  • réalisation d'un module de conversion
    inter-standard

Pierre Marguerite DESS Bioinformatique Lille
4 mai 31 octobre 2004
EBI Microarray Informatics Team
2
Sommaire
  • LInstitut Européen de Bioinformatique
  • léquipe informatique Microarray
  • La standardisation des données de biopuces?
  • Le projet
  • Les standards de description dagencement
  • Contribution
  • Bilan

3
Services Banques de données Recherche en
bioinformatique et en biologie moleculaire Indust
rie Promouvoir des standards Formation
4
(No Transcript)
5
Services Banques de données Recherche en
bioinformatique et en biologie moleculaire Indust
rie Promouvoir des standards Formation
6
léquipe Microarray MicroArray Informatics Team
  • les résultats dexpériences de biopuces
  • Une petite équipe 26 développeurs, annotateurs,
    doctorants
  • Un projet ArrayExpress
  • Banque de données publique de données de biopuces
  • Déclinaison en toxicogénomique et nutrigénomique
  • MGED
  • Standardisation des données de biopuces

7
ArrayExpress
8
léquipe Microarray MicroArray Informatics Team
  • les expériences de biopuces
  • -gt petite équipe 26 développeurs, annotateurs
  • Un projet ArrayExpress
  • Banque de données publique de données de biopuces
  • Déclinaison en toxicogénomique et nutrigénomique
  • Le consortium MGED
  • Standardisation des données de biopuces

9
la standardisation ?
  • Hétérogénéité des applications et des techniques
  • Des éléments non pris en compte
  • gt expériences non comparables
  • Nombreux formats de données
  • Même données -gt beaucoup de manipulation
  • Différents termes -gt pour la même signification
  • Le même terme -gt des concepts différents

Recommandations MIAME
MAGE
Ontologie MGED
10
Le projet
  • Un constat de plus en plus de données à traiter
    et un manque doutils
  • Outil de conversion des fichiers de description
    dagencement

11
Outil de conversion
12
Les descriptions dagencement
  • Informations initiales avant une expérience
  • méta données (contacts, un numéro de version, )
  • Feature position sur une lame de biopuces,
    définie par ses coordonnées
  • Reporter élément déposé sur une feature, qui a
    certaines caractéristiques,
  • Composites séquences composites entre les
    reporter vers une entité biologique.
  • 2 formats
  • MAGE-ML XML
  • ADF (Array Design File) fichiers tabulaires

13
MAGE-ML (MAGE-OM)
14
MAGE-ML (suite)
15
Array Design File
adc
adr
adh
contacts
Header
Informations techniques
16
Array Design File
Reporters
adc
Features
adr
Feature /Reporter
17
Array Design File
Liens avec les reporters
Caractéristiques
Composite
18
Contribution
  • Application
  • indépendante (pas de DB)
  • Multi plateforme
  • En 2 étapes
  • Validation
  • conversion

19
Validation (une étape obligatoire)
  • Analyse syntaxique et lexicale des données
  • Définition de règles de validation
  • Utilisation de fichiers XML pour décrire les
    structures des fichiers de données (ADF)
  • Vérification des termes de la ontologie MGED
  • Vérification des banques de données approuvées
  • Rapport derreurs pour correction
    (standardisation des données)

20
Implémentation - choix techniques
  • Utilisation de MAGE-stk (perl ou Java)
  • Simplicité dinstallation
  • Multi plateforme

- Multiples formats de sortie
21
Problèmes rencontrés
  • Mémoire
  • Beaucoup de données
  • Et leur redondance
  • Flexibilité
  • Acceptation et correction déléments incorrects
  • Nouvelles versions des formats de descriptions
  • Support minimum pour futurs applications des
    biopuces

22
Une adresse http//www.ebi.ac.uk/adf
http//www.ebi.ac.uk/adf/
23
Bilan
  • Bilan pour léquipe
  • Premier outil de vérification complète des
    données de description
  • Soulager le travail des annotateurs en déplaçant
    la validation des données de description à la
    source (biologistes ou fabricants)
  • Un bilan personnel positif, mais douloureux
  • 6 mois en Angleterre
  • Gestion de projet
  • Nombreux contacts

24
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com