APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA 4 - PowerPoint PPT Presentation

1 / 30
About This Presentation
Title:

APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA 4

Description:

Title: SISTEMA INFORMATIVO OSPEDALIERO Author: Danilo Rossetti Last modified by: Rita Pizzi Created Date: 3/13/2002 9:00:00 PM Document presentation format – PowerPoint PPT presentation

Number of Views:48
Avg rating:3.0/5.0
Slides: 31
Provided by: DaniloR
Category:

less

Transcript and Presenter's Notes

Title: APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA 4


1
APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA
MEDICINA4
2

IDENTIFICAZIONE DI TUMORI POLMONARI BASATA SU
ENSEMBLE DI RETI NEURALI
  • Chiave della cura del tumore polmonare è la
    diagnosi precoce. La diagnosi automatica diventa
    quindi sempre più importante.
  • Diversi esempi di reti neurali sono stati
    sviluppati a questo scopo.
  • Descriviamo qui la Neural Ensemble-based
    Detection (NED).
  • Utilizza le immagini di agobiopsie.
  •  

3
ENSEMBLE DI RETI NEURALI
  • Hansen e Salamon (1990) hanno dimostrato le
    ottime prestazioni di ensemble di ANN, ossia di
    varie reti le cui predizioni vengono combinate.
  • Applicazione al riconoscimento di caratteri con
    20-25 di prestazioni in più rispetto ad una
    singola rete.
  • E necessario un metodo sia per generare diverse
    reti da addestrare, sia per combinare diverse
    predizioni.
  • Diversi metodi sono stati proposti, dalla
    combinazione per semplice media alluso della
    varianza e della correlazione.
  •  

4
ENSEMBLE DI RETI NEURALI
  • Ensemble di ANN sono state usate per
  • -         riconoscimento di caratteri
  • -         riconoscimento di volti
  • -         classificazione di segnali sismici
  • -         diagnosi di tumore della mammella
  • .
  •  

5
ENSEMBLE DI RETI NEURALI NED
  • NED segue il metodo di diagnosi LCDS , che si
    abbina alla lastra del torace quando ci sono dei
    dubbi.
  • Una telecamera riprende le immagini
    dellagobiopsia, poi un sistema di filtri
    migliora limmagine.
  • Tecniche colorimetriche e morfologiche estraggono
    diverse features perimetro, area, rotondità,
    componenti rossa,verde, blu, proporzioni fra i
    colori.
  • Un modulo a parte analizza le features e dà la
    diagnosi e il tipo di cellula.

6
ENSEMBLE DI RETI NEURALI NED
  •  
  • Il data set comprende 552 immagini di biopsie
    già etichettate
  • 75 tumori
  • Il set è stato diviso in 5 gruppi omogenei
  • Ogni esperimento è stato ripetuto 5 volte, con 4
    set per il training e 1 per il testing.
  • Allinizio fu usata una sola rete usando FANNC
  • FANNC è un classificatore adattivo veloce (Fast
    Adaptive NN Classifier).

7
ENSEMBLE DI RETI NEURALI - NED
  • Ai risultati dei 5 esperimenti è stata aggiunta
    la loro media.
  • Sono stati valutati
  • errore false identificazioni/numero di immagini
  • errorefn numero di falsi negativi/numero
    cellule test
  • errorefp numero di falsi positivi/numero di
    cellule test.
  •  
  • I risultati erano insoddisfacenti (accuratezza
    lt60)
  •  

8
ENSEMBLE DI RETI NEURALI NED
  • Sono stati provati due tipi di ensemble
  • 1) combinazione delle predizioni via plurality
    voting
  • Se ad es. due reti predicono NORMALE e due
    ADENOCARCINOMA, lidentificazione è data
    sbagliata.
  • Se la cellula è tumorale vengono accresciute di
    uno sia gli errori che i falsi negativi.
  • Se la cellula è normale vengono accresciuti di
    uno sia gli erroi che i falsi positivi.
  • In questo modo i risultati migliorano molto
    rispetto alla singola rete
  • Gli errori vengono dimezzati
  • Ma i falsi negativi sono ancora il 7.3

9
ENSEMBLE DI RETI NEURALI NED
  •  
  • 2) Viene fatta una variazione della proposta di
    Sharkey ( due ensemble di cui uno con un set di
    esempi con prevalenza di reperti positivi ) per
    abbassare i falsi positivi
  • Vengono addestrati 5 ensemble, ciascuno con 5
    reti ciascuna con esempi positivi nel 75 dei
    casi.
  • Poi gli output dei 5 ensemble vengono combinati
    in modalità winner-take-all.
  • In questo modo scende lerrore globale a 13.6 e
    scende lerrorefp fino a 2.9.

10
ENSEMBLE DI RETI NEURALI -NED
  • Per abbassare i falsi negativi viene proposta
    NED, architettura ensemble a due livelli.
  • Il primo livello giudica se una cellula è
    cancerosa
  • Viene utilizzata la tecnica di predizione
    combinata full voting
  • una predizione è data per valida quando tutte le
    reti individuali la convalidano.
  • Questo avviene anche fra clinici per decidere se
    un paziente è sano.
  • E utile quando ci sono solo due scelte e uno è
    molto più importante dellaltra.
  •  

11
ENSEMBLE DI RETI NEURALI
  • Per usare full voting le classi di output vengono
    ridotte a due
  • 75 cellule cancerose / 25 cellule sane.
  • Le cellule giudicate sane dal primo ensemble
    vengono passate al secondo ensemble per la
    classificazione.
  • Nel secondo si usa il plurality voting come
    descritto.
  • I risultati sono un miglioramento netto di tutti
    gli errori
  •  
  • Errore 11.6
  • Errorefn 2.7
  • Errorefp 4.5
  •  
  • Si pensa di migliorare il sistema utilizzando
    visulaizzazioni 3D.
  •  

12
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  •  
  • Lischemia del miocardio è una fornitura di
    sangue insufficiente al muscolo cardiaco.
  • Lo ECG presente in questo caso delle alterazioni
    (deviazione del segmento ST e/o dellonda T).
  • La diagnosi di ischemia via ECG rileva il battito
    ischemico e lepisodio ischemico come sequenza
    di battiti ischemici.
  • Sono stati proposti sistemi basati su regole,
    ANN, fuzzy logic, varie tecniche di analisi dei
    segnali.
  • Poiché il rumore nellECG è una presenza
    importante, le ANN possono essere lo strumento
    adeguato.

13
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  • La procedura proposta parte con un preprocessing
    dellECG eliminando rumore, interferenze
    elettriche e contaminazione elettromiografica.
  • Un algoritmo di edge detection trova il punto J
    di inizio del ciclo cardiaco.
  • A valle una rete neurale viene addestrata per
    classificare ogni battito cardiaco.
  • Si cercano intervalli di circa 30s in cui almeno
    il 75 dei battiti sono ischemici.
  • La percentuale 74 offre flessibilità nel caso di
    presenza di rumore.
  •  

14
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  • Per la classificazione dei battiti viene usata
    una rete feed-forward
  • - 4 unità di input
  • - 10 unità nascoste 1 unità di output.
  • I pattern di input durano 400ms a partire da
    ogni punto J
  • comprendono sia tratto ST che onda T.
  • Per ridurre la dimensionalità dellinput viene
    usata lanalisi delle componenti principali
  • Elimina le componenti che danno la minor
    varianza al training set.
  • Vengono utilizzate le prime 4 componenti
    principali, che contengono il 95 della varianza.

15
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  • La rete viene addestrata secondo la tecnica di
    regolarizzazione Bayesiana, che minimizza
  •  
  • E a1 S (ti oi)2 a2 S wi2
  •  
  • dove ti sono gli output desiderati, oi gli output
    durante il training, wi i pesi.
  •  I pesi vengono aggiornati secondo la legge
  •  
  • wi1 wi JT J mI-1 JT
  •  
  • dove J è lo Jacobiano, I la matrice unitaria, e
    il vettore degli errori e m un parametro scalare.

16
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  • Per costruire il dataset sono state utilizzate 11
    ore di registrazioni ECG.
  • 86.384 battito sono stati classificati come
    normali, ischemici o artefatti. Gli artefatti
    sono stati eliminati, e sono rimasti 76.989
    battiti.
  • Di questi 1936 sono stati usati per il learning e
    il resto per il testing.
  • Sono stati provati diversi strati hidden e
    diverse tecniche di apprendimento..

17
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  • Le prestazioni delle reti così ottenute sono
    state valutate usando sensibilità (se) e
    specificità (sp).
  • Sensibilità è la probabilità che un battito
    anomalo risulti positivo al test
  • Specificità è la probabilità che un battito sano
    risulti negativo al test
  • La rete con le migliori prestazioni è stata usata
    come classificatore nel secondo stadio
    dellalgoritmo, sostituendo il sistema di regole.

18
UN METODO DI RICERCA DI EPISODI ISCHEMICI BASATO
SU RETI NEURALI
  • Le migliori prestazioni risultano quelle con
    metodo Bayesiano con 10 nodi hidden.
  • Il risultato è Se90, Sp90 (backpropagation
    89 e 88)
  • contro Se70 e Sp63 del sistema di regole.
  • Le prestazioni possono essere perfezionate da
  • miglioramento della tecnica di edge detection
    per J o per T
  • miglioramento delle tecniche di filtraggio del
    rumore.
  • Svantaggio del metodo è che non fornisce alcuna
    interpretazione delloutput, utile al cardiologo.

19
DUE TECNICHE DI RULE EXTRACTION APPLICATE A
DISTURBI EPATOBILIARI 
  • Gli algoritmi di estrazione di regole da reti
    neurali danno modo di capire la classificazione
    ottenuta in output.
  • Le regole possono essere verificate da un esperto
  • Le regole possono dare nuove informazioni sui
    dati
  • Sono utili per il clinico che utilizza la rete
  • Sono utili a scopo didattico.
  •  

20
DUE TECNICHE DI RULE EXTRACTION
  • Sono stati utilizzati i due algoritmi,
    NeuroLinear e NeuroRule, che hanno in comune i
    seguenti punti
  • -      Addestrano e semplificano (pruning) reti
    con un unico strato nascosto
  • -         Raggruppano i valori di attivazione
    dello strato nascosto
  • -         Generano regole che esplicano loutput
    della rete
  • -         Generano regole che esplicano i
    raggruppamenti di attivazione in funzione degli
    input
  • -         Compongono i set di regole sopra
    esposti in un set di regole esplicative dei dati
    di input.
  •  

21
DUE TECNICHE DI RULE EXTRACTION
  • La differenza fra i due metodi sta nel fatto che
    NeurRule assume dati discreti, NeuroLinear non
    impone questa restrizione.
  • I dati vengono discretizzati suddividendoli in 3
    subrange.
  • Non si rileva diversa accuratezza nella rete ad
    input discreto
  • Ma la rete ad input continuo ha minori
    connessioni,
  • quindi ci si aspettano meno regole.

22
DUE TECNICHE DI RULE EXTRACTION
  • Le reti sono due feedforward ad uno strato
    nascosto.
  • Ci si attende che dove le connessioni non sono
    utili a classificare un pattern il loro peso sia
    basso.
  • Di fatto minimizzando un errore si effettua un
    problema di ottimizzazione non lineare.
  • A questo scopo gli autori hanno sviluppato un
    metodo ad hoc (BFGS) al posto della
    backpropagation.
  • Questo algoritmo sembra convergere più
    velocemente.

23
DUE TECNICHE DI RULE EXTRACTION
  • Si crea una matrice che è linversa dellHessiana
    della funzione di errore.
  • Si ottiene un passo di minimizzazione
    multiplicando la matrice per il negativo del
    gradiente della funzione.
  • Usando un algoritmo di ricerca lineare, si
    calcola la misura opportuna dello step
    decrescente.
  • Usando BFGS si garantisce la discesa dellerrore
    totale ad ogni iterazione.
  • Questa proprietà non è posseduta dalla
    backpropagation.
  •  

24
DUE TECNICHE DI RULE EXTRACTION
  • Una volta addestrata la rete, vengono
    identificate le connessioni ridondanti per
    rimuoverle.
  • La classificazione non viene alterata da questo
    procedimento.
  • Ogni record è costituito dal sesso del paziente
    e da 9 test biochimici (GOT, GPT, LDH,)
  • Il dataset è di 536 pazienti.
  • I pazienti, esaminati dai clinici, presentavano
    4 tipi di disturbi
  • -danno epatico da alcol (ALD)
  • -         epatoma primario (PH)
  • -         cirrosi (LC)
  • -         colelitiasi (C )

25
DUE TECNICHE DI RULE EXTRACTION
  • Il training set è stato posto a 373 records e il
    test set a 163.
  • Per il programma NeuroLinear sono state
    addestrate 30 reti, ciascuna con 11 input (10
    valori più 1 bias), 5 hidden e 4 output.
  •  
  • Per il programma NeuroRule sono state addestrate
    altre 30 reti, discretizzando linput in tre
    subrange per variabile. I nodi di input erano
    quindi 9x31129.
  •  
  • Laccurateza trovata e dell85.64 e 84.64
    rispettivamente, e non varia dopo il pruning.
  • Varia però la complessità delle reti dopo il
    pruning 75 connessioni per NeuroLinear e 165
    per NeuroRule.
  •  

26
REGOLE DI ESTRAZIONE
  • Data una rete, per ciascun record viene
    registrato quale unità di output ha lattivazione
    più alta e quale ha la seconda più alta
    attivazione.
  • Si raggruppano poi i valori di attivazione dello
    strato hidden generando regole di decisione che
    distinguono i vari output.
  •  
  • Gli input rilevanti risultano essere solo
    x1,x3,x5,x8,x9,x12.
  •  

27
REGOLE DI ESTRAZIONE
  • Si sviluppa un albero di decisione
  •  
  • H1 lt -.80
  • H3 gt0
  • prima scelta PH, seconda scelta ALD
  •  
  • H3lt0
  • H3lt-.70
  • prima scelta ALD, seconda scelta C
  • H3gt-.70
  • prima sceltaALD, seconda sceltaPH
  • H1 gt -.80
  • H3lt .20
  • ..
  •  

28
REGOLE DI ESTRAZIONE
  • Secondo passo.
  • Si riuniscono le regole riscrivendole in questa
    forma
  • H1 lt -.80.
  • H1 è connessa solo agli input x1 e x12, ossia
    paziente maschio e GGTgt60.
  • H3gt0
  • H3 è connessa a x3,x5,x8,x9,x12, ossia se il
    paziente è maschio con GGTgt60, x91 cioè
    LDHgt500.

29
REGOLE DI ESTRAZIONE
  • Si conclude che se il paziente è maschio, con
    GGTgt60, e LDH gt500, il suo disturbo è un epatoma
    (prima scelta) o un danno epatico da alcol
    (seconda scelta).
  • NeuroLinear
  • Dopo il pruning restano solo 15 connessioni, con
    4 hidden.
  • La prima unità hidden riceve input da GPT, la
    seconda e la terza da GGT, la quarta da GOT,GPT e
    LDH.
  • Il numero di regole completo è alla fine molto
    ristretto.

30
REGOLE DI ESTRAZIONE
  • Sono stati confrontati i risultati di reti
    neurofuzzy e dellanalisi discriminante.
  • I risultati di NeuroRule e NeuroLinear sono molto
    più alti (es. per ALD 87.9 e 97.0 contro 57.6
    dellanalisi discriminante e 69.7 della rete
    neurofuzzy).
  • Oltre a produrre regole, i sistemi dicono quali
    variabili sono predittive e quali no.
  • Ad esempio si è visto che i parametri importanti
    erano GOT, GPT,LDH e GGT.
Write a Comment
User Comments (0)
About PowerShow.com