Title: UNA APLICACIN DE LAS MQUINAS DE SOPORTE VECTORIAL SVM EN EL RECONOCIMIENTO DE LOS VALORES DE SEVERID
1UNA APLICACIÓN DE LAS MÁQUINAS DE SOPORTE
VECTORIAL (SVM) EN ELRECONOCIMIENTO DE LOS
VALORES DE SEVERIDAD DE HIPERPLASIA DEL
EPITELIOLAMELAR EN CACHAMA BLANCA (Piaractus
brachypomus)
Jorge Eduardo Ortiz T jeortizt_at_unal.edu.co http//
dis.unal.edu.co/profesores/jortiz Profesor
Departamento de Ingeniería de Sistemas e
Industrial Universidad Nacional De
Colombia-Bogotá Pedro René Eslava Universidad
de los Llanos
Jeison Darío Gutiérrez Diego Esteban
Cruz Universidad de los Llanos
2Contenido
- Introducción
- Descripción del problema
- Objetivos
- Justificación
- Marco Teórico
- Procesamiento y Extracción de características
- Prototipo
- Resultados
- Conclusiones
- Recomendaciones
- Bibliografía
-
3Introducción
- la solución a un problema particular de
clasificación según el nivel de severidad de la
lesión que integra procesamiento digital de
imágenes y aprendizaje de máquina mediante
máquinas de vector de soporte SVM.
4Descripción del problema
- Diagnosticar severidad de la lesión branquial
hiperplasia del epitelio lamelar (HPLE) es una
tarea que se realiza por inspección directa por
patólogos y en general médicos veterinarios,
requiere - Personal capacitado y experimentado
(costoso). - Cantidad de tiempo.
5- Este es un proceso altamente subjetivo debido a
la influencia de algunos factores intrínsecos
como son - Fatiga de la visión
- Calidad de las imágenes
- Estado de los equipos
- Se reflejan en
- Tiempo de procesamiento.
- Precisión de la clasificación
- Frecuentes diferencias de criterio entre los
especialistas
6Objetivo General
- Desarrollar un prototipo de software para evaluar
los valores de severidad de la lesión de
hiperplasia del epitelio lamelar en imágenes del
arco branquial del sistema respiratorio de la
Cachama Blanca (Piaractus brachypomus) utilizando
la técnica de clasificación máquinas de soporte
vectorial (SVM).
7Objetivos Específicos
- Identificación de los aspectos visibles de la
HPLE en branquias de Cachama blanca. - Implementación de técnicas para el procesamiento
de las imágenes digitales - Implementación de máquinas de soporte vectorial
para la clasificación del valor de severidad. - Establecer una herramienta diagnóstica de soporte
a los procesos de investigación en
histopatológica branquial en peces.
8Justificación
- En los peces, el sistema respiratorio es uno de
los más vulnerables y frecuentemente afectados,
las interacciones con el medio ambiente
desencadenan signos de enfermedad que pueden
estar relacionados con la calidad del agua. - Las principales alteraciones branquiales son
- Pérdida de Lamelas
- Hiperplasia del epitelio lamelar
- Inflamación del arco y de los filamentos.
- La Cachama es la especie de mayor explotación
comercial de la región
9- Alta frecuencia de ocurrencia de HPLE
Meta Casanare
Tomado de Iregui 2001
10Arquitectura Branquial
11Hiperplasia del epitelio lamelar
Proliferación celular en el epitelio
lamelar Respuesta a condiciones del
ambiente Busca disminuir el área de exposición al
medio
12Tabla de Bernet
Severidad es la intensidad del daño, la
agresividad con que se presenta la lesión.
13Grados de severidad
14Procesamiento digital de imágenes
- Conjunto de técnicas para el procesamiento de
datos de una imagen - para la interpretación autónoma por una máquina.
- Se reportan trabajos como
- Diagnostico de cáncer cervico-uterino asistido
por visión - por computadora Barreto 2003
- Clasificador de leucocitos mediante procesamiento
digital de imágenes Paguini y colaboradores
2000 - Análisis de muestras a nivel del epitelio vaginal
mediante procesamiento digital de imágenes Muñoz
2001 - Multiclass cancer classification by using fuzzy
svm and binary decision tree with gene selection
Mao 2005
15Heterogeneidad de las imágenes
16Segmentación
Extracción de Características
Segmentación
0
1
2
3
Vector de características
SVM
4
5
17Escala de grises
- A partir de la imagen a color se obtiene una
nueva imagen con 256 niveles de gris.
18Binarización
Se obtiene una imagen en blanco y negro,
separando el fondo y los objetos a través de
19Llenado de Huecos
Se añaden al objeto regiones excluidas por error
en el proceso de binarización, utilizando el
algoritmo de llenado a lo ancho que a partir de
un punto inicial convierte la región en un grafo
conexo.
20Obtención del filamento principal
Se evalúa el área de todas las regiones blancas
de la imagen y solo se conserva la que tenga
mayor área.
21Segmentación completa
Se compara la imagen procesada con la imagen
original generando una nueva imagen que contiene
el objeto de interés (filamento).
22Obtención del Borde
Se consigue el contorno de la región mediante las
relaciones de vecindad de cada píxel de la imagen
completamente segmentada.
23Síntesis del Procesamiento
Original
Escala de Grises
Binarización
Llenado de huecos
Detección del Filamento
Segmentación completa
24Extracción de características
Extracción de Características
Segmentación
0
1
2
3
Vector de características
SVM
4
5
25Extracción de características
- Medición de propiedades geométricas y texturales
sobre el filamento que brinden información sobre
el nivel de severidad (o grado) de la lesión. - Geométricas forma, posición, tamaño y
orientación. - Texturales suavidad, rugosidad y regularidad
26(No Transcript)
27Extracción de Características
Segmentación
0
1
2
3
Vector de características
SVM
4
5
28Selección efectiva de Características
- Capacidad discriminante
- Confiabilidad
- Ausencia de correlación
29Análisis estadístico de Características
- Análisis Normal.
- Discriminante de Fisher.
- Análisis de correlación lineal
-
30Análisis normal
- Bajo el supuesto de normalidad de los datos se
hallaron las medias y las desviaciones para cada
una de las características por clase. - Se graficó cada una de las curvas normales de las
características. - Se rescataron las que ofrecieron mayor
separabilidad
31Descriptores útiles
32Descriptores útiles
33Descriptores no útiles
34Descriptores seleccionados
35Clasificación
Extracción de Características
Segmentación
0
1
2
3
Vector de características
SVM
4
5
36Interpretación geométrica
cómo clasificar estos datos?
37Interpretación geométrica
cómo clasificar estos datos?
38Interpretación geométrica
cómo clasificar estos datos?
39Interpretación geométrica
cómo clasificar estos datos?
40Interpretación geométrica
Cualquiera puede ser buena, pero cuál es la
mejor?
41Interpretación geométrica
wxb0
Definimos el hiperplano
42Interpretación geométrica
Definimos el margen
43Interpretación geométrica
La idea es maximizar el margen.
44Interpretación geométrica
El hiperplano que tenga el mayor margen es el
mejor clasificador de los datos. Esta es la
clase más simple de SVM, la LSVM.
45Interpretación geométrica
Los vectores de soporte son los puntos que tocan
el límite del margen.
46Interpretación geométrica
Veamos los hiperplanos positivo y negativo
47Interpretación geométrica
wxb 1
wxb -1
hiperplano positivo wxb 1 hiperplano
negativo wxb -1
d
d-
margen
48Clasificación
Extracción de Características
Segmentación
0
1
2
3
Vector de características
SVM
4
5
49El Prototipo
- Metodología de Desarrollo.
- El uso del desarrollo por prototipos permitió.
- Una interacción constante con el usuario
- Hacer cambios sobre la marcha
- Alcanzar los objetivos a corto plazo
50El Prototipo
- Herramientas utilizadas
- Interfaz y PDI Qt de Trolltech
- Compilador G
- SVM Libsvm LIBSVM
- Documentación
51 52Resultados obtenidos
Extracción de Características
Segmentación
0
1
2
3
Vector de características
SVM
4
5
53Resultados obtenidos
- Luego de clasificar 75 imágenes
Separación de las observaciones
54Conjuntos de imágenes
55Resultados obtenidos
- Luego de clasificar 75 imágenes
Separación de las observaciones
56Comparación entre las clasificaciones
Experto-Máquina
Resultado clasificador
Experto
Errores de cruce interclase
57Origen de la matriz de confusión
Grado N
Grado N
58Matriz de confusión Grado uno
Resultado clasificador
Experto
59- Sensibilidad Capacidad de clasificar
correctamente una imagen que presenta un
determinado grado de la lesión - Especificidad Capacidad de rechazar
correctamente una imagen que no presente un
determinado grado de la lesión
60Similitudes interclases
61Similitudes interclases
62Diferencias intraclases
63Resultados obtenidos asumiendo como aciertos el
evento en que se clasifica un nivel por encima o
por debajo del nivel determinado por el experto.
Separación de las observaciones (corregida)
64Imágenes descartadas
- El prototipo no clasifica correctamente imágenes
con las siguientes características.
65Filamentos gruesos
- El filamento se hace más grueso sin influir en la
severidad de la lesión
66Filamentos necróticos
- Desaparece la estructura del filamento
67Lesiones Multifocales
- La severidad no es generalizada.
68Lesiones asimétricas
- Diferente grado de severidad a cada costado del
filamento.
69Conclusiones
- El nivel de desempeño de los algoritmos de
preprocesamiento, especialmente el de
segmentación para extraer el filamento branquial
está ligado a la normalización de las técnicas
para la captura de las imágenes. - La evaluación de la características empleando
el análisis normal permite obtener aquellas que
son más discriminantes para la clasificación,
teniendo como resultado las que describen en
términos geométricos y texturales al filamento
branquial. Sin embargo, estas no son suficientes
para separar los diferentes categorías de
severidad de la lesión HPLE, razón por la cual se
tienen errores de clasificación que resaltan la
similitud entre algunas de las categorías,
particularmente entre los grados 2 y 3 y los
grados 4 y 5.
70Conclusiones
- El análisis de las características extraídas
indica que la información de las categorías de la
lesión no están tan contenidas en las
características texturales sino más bien en las
características geométricas, especialmente en las
de perímetro y área. - La SVM vio afectada su capacidad predictiva por
la alta heterogeneidad de las imágenes , lo cual
se refleja en un bajo rendimiento ante patrones
nuevos, es decir, aquellos que no se utilizaron
para generar el modelo, sin embargo, la
clasificación SVM se puede considerar como
promisoria, porque con el incremento del tamaño
de muestra su comportamiento puede mejorar
significativamente, al recoger información de un
conjunto de datos mas significativo, Además,
según 5, la SVM ha demostrado un buen
comportamiento en un dominio amplio de problemas,
lo que apoya la hipótesis del tamaño de muestra
enunciado anteriormente. - El hecho de enfrentar un problema con datos
reales, supuso un reto superior, dada la
posibilidad de encontrarse con dificultades no
estimadas previamente o que no se pueden
modificar en su desarrollo, como fue el caso de
la captura de las imágenes, dado que no se
normalizó el nivel del brillo, además, se eligió
un formato de compresión con perdida, lo cual
posiblemente afecto los patrones texturales de
las imágenes evaluadas.
71Recomendaciones
- Los resultados obtenidos usando la SVM, son
viables de mejorar, pero sería necesario mejorar
el conjunto de datos, tanto en calidad como en
cantidad, para obtener rendimientos predictivos
aceptables. - Implementar un clasificador bayesiano para
obtener además de la clase un porcentajes de
confianza sobre esta respuesta. - Determinar la relevancia de las características
extraídas según criterios como análisis
estadístico del espacio de características en
clasificación múltiple y el análisis
discriminante de Fisher, o el criterio de
relevancia usando redes neuronales. - Implementar otros clasificadores basados en
redes neuronales complejas, o en lógica difusa, o
bien en una fusión de clasificadores y
experimentar con nuevas características que
aumenten el desempeño de la clasificación. - se propone reducir el numero de clases para
reducir las diferencias de criterio.
72Recomendaciones
- Adicionar opciones de configuración de los
parámetros de la SVM y de los algoritmos de
procesamiento de imágenes para los usuarios
avanzados. - Extender el prototipo a otro tipo de lesiones
branquiales como pérdida de lamelas, necrosis
epitelial, hipertrofia epitelio lamelar,
infiltración de células inflamatorias en el arco
branquial e infiltración de células inflamatorias
en el filamento, y patologías en otros órganos
como hígado, riñón, bazo y estómago. - Generar modelos de tres dimensiones para
facilitar la tarea de diagnostico del patólogo.
73Agradecimientos
- Instituto de Acuicultura de la Universidad de los
Llanos IALL
74Bibliografía
- Barreto 2003 Barreto A., Diagnóstico de cáncer
cervico-uterino asistido por visión por
computadora, Instituto Nacional de Astrofísica,
óptica y electrónica España (2003). - Paguini 2000 Paguini A. Ramonet G. Graffigna
J. Gomez D.Naranjo A., Clasificador de
leucocitos mediante procesamiento digital de
imágenes, Memorias Simposio argentino de
informática y salud SADIO (2000). - Muñoz 2001 Muñoz A.Arroyave J. Osorio G.
Prieto F. Angulo F., Análisis de muestras a
nivel del epitelio vaginal mediante procesamiento
digital de imágenes, Inteligencia computacional 1
(2001), no. 1, 5456. - Mao 2005 Mao Y. Zhou X. Pi D. Sun Y. Wong
Stephen, Multiclass cancer classification by
using fuzzy svm and binary decision tree with
gene selection, Journal of biomedicine and
biotechnology (2005), no. 2, 160 171. - Iregui 2003 Iregui C.A, Sistematización y
caracterización productiva y sanitaria de
explotaciones piscícolas de pequeños campesinos
en los departamentos del Meta, Casanare,
Cundinamarca, Huila y Tolima., Tech.
report,Universidad Nacional de Colombia-Facultad
de Medicina Veterinaria y de Zootecnia., 2003. - Replay 1996 Replay B., Pattern recognition and
neural netwoks, Cambridge U. Press,1996.
75 Preguntas ?