Conception des puces RNG ResoGen - PowerPoint PPT Presentation

1 / 25
About This Presentation
Title:

Conception des puces RNG ResoGen

Description:

au set d'oligos command en mars 2004 et pr sent actuellement sur la puce RNG humaine, La quatri me version apr s la release Refseq de juillet 2004, ... – PowerPoint PPT presentation

Number of Views:112
Avg rating:3.0/5.0

less

Transcript and Presenter's Notes

Title: Conception des puces RNG ResoGen


1
Conception des puces RNG - ResoGen
Kévin LE BRIGAND Lebrigand_at_ipmc.cnrs.fr
2
PROGRAMME
  • 10h-11h
  • Design des oligonucleotides des puces RNG
  • OligoArray2.0
  • Sélection des oligonucleotides
  • sélection du set de transcrits
  • BLAST de spécificité
  • LASSAP calcul du nombre dESTs
  • règles et critères de sélection des meilleures
    sondes
  • Caractéristiques du set doligonucleotides
  • Évolution du set doligonucleotides en fonction
    du temps
  • Comparaison Puces RNG / Puces Affymetrix,
    Agilent et Illumina
  • 15h-17h
  • MEDIANTE portail de présentation des puces RNG

3
Puces RNG ResoGenHistorique
Janvier 2003 Initiation dun projet visant à
mettre en place une collection bi-national de
longs oligonucleotides entre le RNG et le MRC
Rosalind Franklin Centre for Genomics
Research. Mai 2003 Début de lanalyse
bio-informatique visant à la mise en place du
design de ces ressources. Mars 2004 Commande
des oligonucleotides designés et selectionnés
pour être présent sur les puces RNG. Juillet
2004 Spotting des premières lames
pan-génomiques 25k humaines. Mars 2005
Spotting des premières lames pan-génomiques 25k
murines.
4
OligoArray 2.0Jean-Marie Rouillard et al.,
Nucleic Acids Research, 2003
  • OligoArray2 est un programme qui calcule des
    sondes oligonucléotidiques spécifiques, sans
    structure secondaire, pour lutilisation de puces
    ADN à large couverture.
  • Le design se fait sur 3 critères
  • température de réaction - Tm (Nearest-Neighbor
    model),
  • spécificité à une unique cible (Blast),
  • pas de structure secondaire (MFold).

x bases
5
3
Recherche des oligonucléotidiques en partant du
3 du transcrit, à chaque oligonucléotide
possible, test de la spécificité contre une base
de données Blast, test sur la structure
secondaire et sur le pourcentage en GC, en
fonction des paramètres de départs. http//berry.
engin.umich.edu/oligoarray2_1/
5
OligoArray 2.0Jean-Marie Rouillard et al.,
Nucleic Acids Research, 2003
  • Paramètres utilisés pour le design des
    oligonucléotides des puces RNG
  • taille des oligonucléotides 50 à 52 bases,
  • pourcentage en GC 40 à 60,
  • distance maximum au 3 du transcrit 1500
    bases,
  • température de réaction 84 à 94C,
  • masque de non-admission "GGGGGCCCCCTTTTTAAAA
    A",
  • 6 oligonucléotides par transcrits.

Sélection dun set non redondant de transcrits
pour lesquels on souhaite avoir des oligos. Cest
ce set qui constitue également la base BLAST
contre laquelle on effectue les calculs de
spécificités.
6
Design des oligonucleotidesConstitution du set
de transcrits non redondant
105.000 Clusters UNIGENE dont 27.500 avec mRNA,
4.410.000 séquences nb séquences nb
clusters 1 8111 2
37888 3-4 22935 5-8
11700 9-16 5509 17-32 3716
33-64 3298 65-128 3865
129-256 4360 257-512 2871
513-1024 990 1025-2048 294 2049-4096
99 4097-8192 31 8193-16384 12
16385-32768 1
Premier set de Transcrits - 20.600 séquences
BLAST(1e-40) des 20.600 contre les 105.000
séquences références des clusters UNIGENE
88.000 séquences (clusters) sans match ?
élimination des clusters nb séquences lt 5 ? reste
18.452 clusters ? élimination des clusters sans
représentant mRNA
2.979 séquences
  • BLAST (1e-40) contre les 25.400 séquences REFSEQ
  • 15.0120 séquences connues,
  • 1.979 séquences modifiées,
  • 8.380 séquences inconnues 
  • 2.000 insertions de NM inconnus
  • 1.000 remplacements par des NM
  • 1.600 insertions de XM

7
Design des oligonucleotidesUnigene Hs build 186
8
Design des oligonucleotidesChiffres clés du
design des oligos
Pour chaque transcrit, on se retrouve donc avec
plusieurs oligos différents (entre 2 et 48) au
sein desquels il faut sélectionner le meilleur
dentre eux. Pour cela mise en place dune
procédure informatique automatique de sélection
des oligos les plus optimaux suivant 3 critères
et des règles précises.
9
Sélection des oligonucleotides 1.1Spécificité
xhybrid_max
Spécificité de loligo Mediante 0.0 Refseq
0.0 Ensembl 0.0 Max 0.0
10
Sélection des oligonucleotides 1.2Spécificité
xhybrid_max
Spécificité de loligo Mediante 1.1 Refseq
1.1 Ensembl 1.1 Max 1.1
11
Sélection des oligonucleotides 1.3Spécificité
xhybrid_max
Spécificité de loligo Mediante 3.1 Refseq
3.1 Ensembl 3.1 Max 3.1
12
Sélection des oligonucleotides 1.4Spécificité
xhybrid_max
Spécificité de loligo Mediante 6.2 Refseq
6.2 Ensembl 2.1 Max 6.2
13
Sélection des oligonucleotides - 2Nombre dESTs
reconnus nb_est
Avec le logiciel LASSAP (LArge Scale Sequence
compArison Package) sur les serveurs
dInfobiogen. LASSAP est un logiciel de
comparaison de séquences nucléiques et protéiques
à grande échelle développé depuis 1994 au sein de
l'action Génome de l'INRIA. Permet, grâce à un
langage de requêtes, de lancer des comparaisons
de banque (ou sous-banque) contre banque.
Lancement de batch de comparaison de séquences
entre les séquences des oligos désignés, et
lensemble des ESTs (Expressed Sequence Tags)
soumis dans la base de référence
dbESTs. Paramètres de match de loligonucleotide
95 didentité sur la longueur totale.
14
Sélection des oligonucleotides - 3Position par
rapport au 3 du transcrit
Le processus de création des oligonucléotides
avec OligoArray2 permet de définir la distance
maximale par rapport au 3 du transcrit.
Cependant les oligonucleotides sont partagés
entre les splices variants et de ce fait on se
retrouve avec des oligos éloignés de plus de 1500
bases du 3 du transcrit. Le processus de
sélection du meilleur oligo inclus ce paramètre
car la méthode damplification utilisée dans le
protocole expérimental est limitée dans
lélongation de la séquence complémentaire. Limit
ation due à la RT-PCR pour la formation du double
brin cDNA.
1500
5
3
AAAAAAAAAAAAA
TTTTTTTT - T7
15
Règles de sélection des oligonucleotides
  • on regarde lensemble des oligonucléotides
    spécifiques dun transcrit,
  • on sélectionne les oligonucléotides les plus
    spécifiques (xhybrid_max minimum),
  • parmi eux on définit le nb_est_spe pour celui
    qui reconnaît le plus dESTs,
  • parmi les oligonucléotides spécifiques, seuls
    restent en course ceux qui matchent
  • plus de 60 de nb_est_spe,
  • on sélectionne le plus 3 parmi ceux-la,
  • on regarde si un oligonucléotide moins
    spécifique mais de type 1.x, ne matcherait
  • pas plus de 5 x nb_est_spe,
  • si il y en a plusieurs, on sélectionne le plus
    3 par rapport au transcrit.

Ordre dimportance des critères de sélection
- Spécificité, - Nombre de matchs
ESTs, - Position le plus en 3.
16
Évolution du set doligonucleotides
  • - Le premier calcul a été fait en septembre 2003,
  • - Le second après update par la version doctobre
    2003 dUnigene,
  • La troisième après update par la release de
    Refseq de Novembre 2003 correspond
  • au set doligos commandé en mars 2004 et
    présent actuellement sur la puce RNG humaine,
  • La quatrième version après la release Refseq de
    juillet 2004,
  • La cinquième version après la release Refseq de
    Novembre 2004,
  • La version actuelle du set optimal doligos
    après la release de Refseq de août 2005.

17
Caractéristiques du set doligonucleotides
  • diminution du nombre moyen dESTs due à
    lincorporation de séquences moins représentées,
  • la position par rapport au 3 du transcrit est
    importante car il sagit de notre troisième
    critère de sélection des sondes,
  • la spécificité saméliore par le fait de
    lévolution de la précision des séquençages et
    de lélimination de séquences inexactes

18
Comparaison avec dautres plates-formes
  • La comparaison avec les puces commerciales se
    base sur nos 3 critères de sélection
    specificité, nombre dESTs et position par
    rapport au 3 du transcrit.
  • Caractéristiques de ces puces
  • RNG-MRC 50 mers
  • Affymetrix 25 mers
  • Agilent 60 mers
  • Illumina 70 mers
  • Pour comparer random séquences dans les
    séquences des oligos pour avoir des résultats
    comparables.

19
Comparaison avec dautres plates-formesSpécificit
é - 25 mers
20
Comparaison avec dautres plates-formesESTs
number
Comparaison de la moyenne des matchs ESTs sur les
oligos très spécifiques de leur target car les
non specifiques cross-hybrid trop. Les puces RNG
possèdent moins de sondes qui ne matchent aucun
ESTs.
21
Comparaison avec dautres plates-formesPosition
par rapport au 3
22
Comparaison avec dautres plates-formesSynthèse
23
MEDIANTEPortail de présentation des puces RNG
  • Interface JAVA J2EE,
  • Base de données PostgreSQL,
  • - Scripts Perl de gestion de la base,
  • Présentation des puces pan-genomiques,
  • Collection dannotations des bases de données
    publiques,
  • Stockage des résultats des hybridations des
    puces,
  • Début danalyse et formatage de fichiers pour
    des logiciels danalyses externes,
  • Meta-analyse pour lévolution des puces
    pan-genomiques,
  • Export de fichiers vers GEO ( et arrayexpress).
  • En parrallèle MEDLAB, gestion de la production
    des 3 plates-formes de production des puces RNG
    (Nice, Evry et Strasbourg).

24
Schéma de la base de données Médiante
25
Portail Médiante
Write a Comment
User Comments (0)
About PowerShow.com