Clasificacion De Leucocitos Utilizando Vision Por Computadora

  • Uploaded by: Ricardo Solano
  • 0
  • 0
  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Clasificacion De Leucocitos Utilizando Vision Por Computadora as PDF for free.

More details

  • Words: 36,840
  • Pages: 174
´ UNIVERSIDAD AUTONOMA DE TLAXCALA Facultad de Ciencias B´ asicas, Ingenier´ıa y Tecnolog´ıa ´ DE ESTUDIOS DE POSGRADO DIVISION

Clasificaci´ on de Leucocitos utilizando Visi´ on por Computadora

Tesis Que para obtener el grado de:

Maestro en Ciencias en Ingenier´ıa en Computaci´ on

Presenta:

Mar´ıa del Roc´ıo Ochoa Montiel

Asesor:

M. en C. Ricardo Solano Monje

Apizaco,Tlax.

Abril del 2006

c Propiedad literaria °2006 por Mar´ıa del Roc´ıo Ochoa Montiel. U.A.T. Todos los Derechos Reservados.

Dedicatoria A mi familia.

IV

´Indice general ´ Indice general

V

´ Indice de figuras

IX

´ Indice de tablas

XVII

Prefacio

XIX

Motivaci´on personal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix Organizaci´on de la Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix Resumen

XXIII

1. Introducci´ on

1

2. Antecedentes

5

2.1. ¿C´omo identificar leucocitos empleando visi´on por computadora? . . . . . .

5

2.2. Hip´otesis

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2.3.2. Objetivos Espec´ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2.4. M´etodo de soluci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

2.5. Hardware y software utilizado . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.5.1. Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.5.2. Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

´ INDICE GENERAL

VI

3. Fundamentos

11

3.1. Conceptos biol´ogicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

3.1.1. Composici´on de la sangre humana . . . . . . . . . . . . . . . . . . .

12

3.1.2. Recuento Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

3.2. Conceptos Estad´ısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.2.1. M´etricas de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

3.2.2. An´alisis de Componentes Principales –PCA– . . . . . . . . . . . . .

25

3.3. An´alisis de im´agenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26

3.3.1. Segmentaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

3.3.2. Filtrado espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

3.4. Extracci´on de caracter´ısticas . . . . . . . . . . . . . . . . . . . . . . . . . .

30

3.5. Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

3.5.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

3.5.2. Tipos de Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . .

40

3.5.3. Entrenamiento por Retropropagaci´on

. . . . . . . . . . . . . . . . .

44

3.6. T´ecnicas de Validaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

4. Estado del Arte

53

4.1. Segmentaci´on de una imagen celular para diagn´ostico patol´ogico . . . . . .

53

4.2. Automatizaci´on del Recuento Diferencial de la sangre . . . . . . . . . . . .

56

4.3. Mejorado autom´atico de detecci´on de piel en im´agenes de color . . . . . . .

57

4.4. Identificaci´on autom´atica de objetos a´ereos usando Redes Neuronales . . . .

58

4.5. An´alisis de imagen y aprendizaje supervisado en la diferenciaci´on autom´atica de c´elulas blancas de im´agenes microsc´opicas . . . . . . . . . . . . . . . .

60

4.6. Localizaci´on y rastreo de rostros humanos con Redes Neuronales . . . . . .

62

4.7. Localizaci´on de rostros humanos en Tiempo Real . . . . . . . . . . . . . . .

65

5. Clasificaci´ on de leucocitos

69

5.1. M´etodo para el reconocimiento de c´elulas sangu´ıneas Segmentadas y No Segmentadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

´ INDICE GENERAL

VII

5.2. Etapas en la soluci´on del problema . . . . . . . . . . . . . . . . . . . . . . .

70

5.3. M´etodo de clasificaci´on de leucocitos . . . . . . . . . . . . . . . . . . . . . .

71

5.3.1. Adquisici´on y Preprocesamiento de la imagen . . . . . . . . . . . . .

72

5.3.2. Segmentaci´on en color . . . . . . . . . . . . . . . . . . . . . . . . . .

73

5.3.3. Extracci´on de caracter´ısticas . . . . . . . . . . . . . . . . . . . . . .

81

5.3.4. Entrenamiento de la red . . . . . . . . . . . . . . . . . . . . . . . . .

91

5.3.5. Reconocimiento de observaciones originales . . . . . . . . . . . . . .

94

6. Pruebas y an´ alisis de resultados

95

6.1. Pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

6.1.1. Adquisici´on y preprocesamiento de la imagen . . . . . . . . . . . . .

95

6.1.2. Segmentaci´on de la imagen . . . . . . . . . . . . . . . . . . . . . . .

98

6.1.3. Extracci´on de caracter´ısticas . . . . . . . . . . . . . . . . . . . . . . 105 6.1.4. Entrenamiento de la Red Neuronal . . . . . . . . . . . . . . . . . . . 109 6.2. An´alisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7. Conclusiones

117

7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 7.2. Trabajo a Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Referencias

121

A. Espacios de color

127

A.1. Espacio RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 A.2. Espacio TSL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 A.3. Espacio HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 A.4. Los espacios XYZ, Luv, Lab . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 A.5. Los espacios de color YIQ, YUV, YCbCr y YCC . . . . . . . . . . . . . . . 131 A.6. El espacio CMY(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 B. Galer´ıa de im´ agenes

133

VIII

´ INDICE GENERAL

C. Listado de m´ odulos que componen el m´ etodo de clasificaci´ on

141

´ Indice alfab´ etico

143

´Indice de figuras 1.1. Contadores hematol´ ogicos. . . . . . . . . . . . . . . . . . . . . . . . . .

2

2.1. Proceso de reconocimiento de c´ elulas sangu´ıneas.

. . . . . . . . . .

7

2.2. Hardware utilizado en el sistema de visi´ on. . . . . . . . . . . . . . . .

9

3.1. Componentes de una c´ elula b´ asica. . . . . . . . . . . . . . . . . . . . .

12

3.2. Componentes de la sangre humana. . . . . . . . . . . . . . . . . . . . .

13

3.3. Porcentajes normales en un Recuento Diferencial. . . . . . . . . . .

14

3.4. Tipos de leucocitos y sus caracter´ısticas. . . . . . . . . . . . . . . . .

16

3.5. Preparaci´ on de frotis sangu´ıneo.

16

. . . . . . . . . . . . . . . . . . . . .

3.6. Observaci´ on y conteo de leucocitos.

. . . . . . . . . . . . . . . . . . .

17

3.7. Tecnolog´ıa VCS. a) Preparaci´on de la muestra. b) Volumen. b) Conductividad. d) Dispersi´on. e) Pruebas simult´ aneas. . . . . . . . . . . . . . . . .

19

3.8. Contadores Hematol´ ogicos. . . . . . . . . . . . . . . . . . . . . . . . . .

20

3.9. Gr´ afica representativa de una Distribuci´ on Gaussiana . . . . . . . .

24

3.10. Proyecci´ on sobre el plano definido por las variables X1 y X2 . . . .

24

3.11. Modelo de un sistema de visi´ on. . . . . . . . . . . . . . . . . . . . . . .

27

3.12. Procedimiento para implementar el Filtro de la mediana. . . . . . .

31

3.13. Dise˜ no de un sistema de reconocimiento de patrones. . . . . . . . .

32

3.14. Caracter´ısticas morfol´ ogicas de una regi´ on. . . . . . . . . . . . . . . .

33

3.15. Momentos.

34

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

´ INDICE DE FIGURAS

X

3.16. Dos curvas de contornos sencillos y sus correspondientes firmas de distancia-´ angulo. En (a) r(θ) es constante. En (b) r(θ) = A sec(θ). . . . .

36

3.17. Regiones con n´ umero de Euler -2 y 0, respectivamente. . . . . . . .

36

3.18. Convex Hull. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

3.19. De la neurona biol´ ogica a la neurona artificial. . . . . . . . . . . . . .

38

3.20. Proceso b´ asico de una red neuronal. . . . . . . . . . . . . . . . . . . .

39

3.21. Esquema b´ asico de una neurona artificial que contiene una s´ ola entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

3.22. Funciones de transferencia de uso com´ un. . . . . . . . . . . . . . . . .

41

3.23. Clasificaci´ on de las redes neuronales. . . . . . . . . . . . . . . . . . . .

41

3.24. Modelo de red neuronal multicapa alineada hacia adelante (progresiva). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

4.1. Proceso de segmentaci´ on de im´ agenes celulares para diagn´ ostico patol´ ogico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

4.2. Imagen de un leucocito t´ıpico. La imagen segmentada se presenta en pseudocolor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

4.3. Calidad de la segmentaci´ on. a). Im´agenes originales, arriba una c´elula de linfoma de Mantle y las dos de abajo son espec´ımenes de leucemia linfoc´ıtica cr´onica. b). Contornos. c). C´elulas segmentadas. . . . . . . . . . . . . . . . .

55

4.4. Segmentaci´ on de n´ ucleos de varias categor´ıas de c´ elulas. El borde del n´ ucleo est´a marcado con blanco. . . . . . . . . . . . . . . . . . . . . . .

55

4.5. Esquema de segmentaci´ on. a). Generaci´on de subim´agenes conteniendo c´elulas solas. b). Segmentaci´ on de n´ ucleos y citoplasmas. . . . . . . . . . . .

56

4.6. Secuencia de procesamiento. a. Imagen original. b. Imagen saturada. c. Salida K-medias. d. Salida final. . . . . . . . . . . . . . . . . . . . . . . . . .

57

4.7. Esquema de la detecci´ on autom´ atica de piel en im´ agenes de color.

58

4.8. Secuencia de procesamiento. Imagen original y resultados obtenidos despu´es de aplicar la segmentaci´ on.

. . . . . . . . . . . . . . . . . . . . . . . .

58

´ INDICE DE FIGURAS

XI

4.9. Componentes del sistema de clasificaci´ on de objetos a´ ereos. Adquisici´on de caracter´ısticas y entrenamiento de la red neuronal. . . . . . . . . .

59

4.10. Aviones utilizados en el estudio. . . . . . . . . . . . . . . . . . . . . . .

59

4.11. Sistema de clasificaci´ on de c´ elulas blancas sangu´ıneas. . . . . . . . .

60

4.12. Ejemplos de im´ agenes completas utilizadas en la investigaci´ on. De izquierda a derecha: bas´ofilo, eosin´ofilo, linfocito, neutr´ofilos. . . . . . . . . 4.13. Eosin´ ofilo. Resultados de la detecci´on de bordes Canny.

. . . . . . . . . .

61 61

4.14. Ejemplos de c´ırculos ajustados manualmente. Resultados del algoritmo de detecci´on de c´ırculos. . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

4.15. Estructura del sistema de localizaci´ on y rastreo de rostros humanos. 63 4.16. Localizaci´ on de un rostro. a). Imagen original b). Im´agenes en secuencia c). Diferencia de las dos im´agenes d). Conjunto de pixeles con caracter´ısticas de movimiento e). Aplicaci´on del clasificador general de color de rostros –GFCC– f). Conjunto de pixeles con caracter´ısticas de color de piel g). Objetos con caracter´ısticas de movimiento y color de piel h). Objetos m´as grandes i). Rostro localizado. . . . . . . . . . . . . . . . . . . . . . . . . . .

64

4.17. Creaci´ on del clasificador de color de rostros. a). Primero se escoge un ´area de inter´es en la imagen b). Se crea un modelo de distribuci´on de color para el ´area seleccionada c). Se umbraliza como pixeles de piel aquellos que posean valores que se encuentren dentro de la media promedio. . . . . . . .

64

4.18. Localizaci´ on de un rostro utilizando el modelo de color de piel. . .

65

4.19. Ejemplo de localizaci´ on de un rostro usando una combinaci´ on de color, geometr´ıa, e informaci´ on de movimiento. . . . . . . . . . . . .

67

5.1. Organizaci´ on general. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

5.2. Proceso de adquisici´ on de la imagen. . . . . . . . . . . . . . . . . . . .

72

5.3. Procedimiento de instalaci´ on de la c´ amara. Izq.- Montaje de Accesorios. Der.- C´amara ajustada al microscopio. . . . . . . . . . . . . . . . . . .

74

5.4. Tipos de Leucocitos. Segmentados: neutr´ofilo y eosin´ofilo, No Segmentados: linfocito y monocito . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

74

´ INDICE DE FIGURAS

XII

5.5. C´ elula segmentada neutr´ ofila. . . . . . . . . . . . . . . . . . . . . . . .

75

5.6. Desarrollo del proceso de segmentaci´ on. . . . . . . . . . . . . . . . . .

76

5.7. Histogramas de los canales RGB de un recorte de n´ ucleo de una c´ elula segmentada.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

5.8. Diferencias entre d1 y d2 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

77

5.9. Resultados de Filtro inicial aplicado a una c´ elula segmentada. . . .

78

5.10. Umbralizaci´ on con el Modelo de Mahalanobis. a)Imagen original. b)Imagen despu´es de aplicar filtro inicial. c)Imagen despu´es de aplicar modelo de Mahalanobis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.11. Extracci´ on de caracter´ısticas.

81

. . . . . . . . . . . . . . . . . . . . . . .

82

5.12. Almacenamiento de las caracter´ısticas estructurales. . . . . . . . . .

83

5.13. M´ etodo para el c´ alculo de las caracter´ısticas radiales. . . . . . . . .

87

5.14. Almacenamiento de las caracter´ısticas radiales obtenidas aleatoriamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

5.15. Izquierda. Per´ımetro de un n´ ucleo. Centro. Puntos escogidos para formar V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0 en el escalamiento lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

5.16. A la izquierda: Regi´on nuclear de una c´elula segmentada. A la derecha: Per´ımetro de la regi´on de la izquierda. . . . . . . . . . . . . . . . . . . . . .

89

5.17. Per´ımetro de la regi´ on de inter´ es. Arriba. Representaci´ on del per´ımetro en el dominio del tiempo. Abajo. Representaci´ on del per´ımetro en el dominio de la frecuencia, considerando solo la parte de magnitud despu´es de aplicar la FFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

5.18. Almacenamiento de las caracter´ısticas obtenidas despu´ es de aplicar FFT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

6.1. Recolecci´ on de muestras sangu´ıneas. Izquierda. Elecci´on del paciente. Centro. Extracci´on de la sangre. Derecha. Preparaci´on y tinci´on del frotis. .

96

´ INDICE DE FIGURAS

XIII

6.2. Adquisici´ on de las observaciones. Izquierda: Gota de aceite sobre el frotis. Centro: Colocaci´on del frotis sobre la base del microscopio. Derecha: Campo visto a trav´es de la c´amara. . . . . . . . . . . . . . . . . . . . . . . .

97

6.3. Campos vistos al microscopio con diferentes aumentos. Izquierda: Utilizando el objetivo de 40X. Derecha: Utilizando el objetivo de 100X. . .

97

6.4. Tipos de gl´ obulos blancos. Arriba.- Segmentados: Neutr´ofilo, Eosin´ofilo, Bas´ofilo. Abajo.- No Segmentados: Linfocito y monocito. . . . . . . . . . . . 6.5. Gl´ obulos blancos digitalizados.

98

. . . . . . . . . . . . . . . . . . . . . .

98

6.6. Recorte de n´ ucleo de una c´ elula de la clase Segmentada. . . . . . .

99

6.7. Histogramas de los canales RGB de 4 tipos de recortes de n´ ucleos. La primera fila de histogramas corresponde a una c´elula Segmentada Eosin´ofila. La segunda fila de histogramas pertenece a una c´elula Segmentada Neutr´ofila. La tercera fila de histogramas es de una c´elula No Segmentada linfoc´ıtica. La cuarta fila es de una c´elula No Segmentada Monoc´ıtica . . . . 100 6.8. Resultados del filtro inicial. a).- C´elula Segmentada Eosin´ofila. b).C´elula Segmentada Neutr´ofila. c).- C´elula No Segmentada linfoc´ıtica. d).- C´elula No Segmentada Monoc´ıtica . . . . . . . . . . . . . . . . . . . 101 6.9. Resultados del filtro inicial aplicado a im´ agenes muy claras. a).C´elula No Segmentada Monoc´ıtica. b).- C´elula Segmentada Neutr´ofila. c) y d) C´elulas Segmentadas eosin´ ofila. . . . . . . . . . . . . . . . . . . . 101 6.10. Resultados del filtro inicial aplicado a im´ agenes obscuras. La c´elula que esta en la parte superior izquierda es un neutr´ofilo y las dem´as son eosin´ofilos, ambas pertenecientes a la clase segmentados. . . . . . . . . . . 102 6.11. Resultados del filtro inicial aplicado a im´ agenes de c´ elulas semidestruidas. En este caso la claridad no se considera. . . . . . . . . . . . . . 102 6.12. Resultados del filtro inicial aplicado a im´ agenes de c´ elulas con el n´ ucleo muy dividido. En este caso la claridad no se considera. . . . . . . 103 6.13. Conversi´ on del espacio de color RGB a TSL. . . . . . . . . . . . . . . 103 6.14. Uni´ on de los vectores T y S de los n Recortes de n´ ucleos. . . . . . 103

´ INDICE DE FIGURAS

XIV

6.15. Correlaci´ on entre las variables Tono y Saturaci´ on correspondientes a los vectores T y S, respectivamente. Los valores de T son normalizados.105 6.16. Resultados de la segmentaci´ on del n´ ucleo de un monocito. . . . . . 105 6.17. Matriz de caracter´ısticas estructurales. Las columnas denotadas con Si representan a las caracter´ısticas de c´ elulas Segmentadas mientras que las que se denotan con Ni indican a las caracter´ısticas de c´ elulas No Segmentadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.18. Matriz de caracter´ısticas estructurales con an´ alisis de varianza. . . 108 6.19. Matriz de caracter´ısticas radiales utilizando escalamiento con transformaci´ on lineal.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6.20. Tipos de entrenamiento y funciones de transferencia. . . . . . . . . 110 6.21. Distribuci´ on de las observaciones para la experimentaci´ on. . . . . . 110 6.22. Distribuci´ on de las observaciones por clase. . . . . . . . . . . . . . . . 111 6.23. Resultados de las configuraciones utilizando diferentes observaciones de c´ elulas Segmentadas y No Segmentadas. . . . . . . . . . . . . 112 6.24. Comportamiento de entrenamiento utilizando diferentes observaciones de c´ elulas Segmentadas y No Segmentadas con caracter´ısticas estructurales y radiales. . . . . . . . . . . . . . . . . . . . . . . . . . 113 A.1. Diagrama esquem´ atico de los 3 ejes del sistema de color Munsell.Tomado de Hall, E.L. Computer Image Processing and Recognition. Academic Press, New York. 1979 . . . . . . . . . . . . . . . . . . . . . . . . 129 B.1. Leucocitos segmentados: Eosin´ ofilos. (Contin´ ua) . . . . . . . . . . . . 134 B.2. Leucocitos segmentados: Eosin´ ofilos. (Continuaci´ on) . . . . . . . . . . 135 B.3. Leucocitos segmentados: Neutr´ ofilos. (Contin´ ua) . . . . . . . . . . . . 136 B.4. Leucocitos segmentados: Neutr´ ofilos. (Continuaci´ on) . . . . . . . . . . 137 B.5. Leucocitos no segmentados: Linfocitos. (Contin´ ua) . . . . . . . . . . . 138 B.6. Leucocitos no segmentados: Linfocitos. (Continuaci´ on) . . . . . . . . . 139 B.7. Leucocitos no segmentados: Monocitos. . . . . . . . . . . . . . . . . . 139

´ INDICE DE FIGURAS

XV

B.8. Casos especiales. En b1 y b2 se observan c´elulas bas´ofilas pertenecientes a la clase segmentados, es un tipo de c´elula que por su rareza fue exclu´ıda de las pruebas hechas en la investigaci´ on. DOSe66-n contiene abajo un neutr´ofilo peque˜ no, arriba un eosin´ofilo con el n´ ucleo parcialmente destruido y distribuido en el citoplasma. DOSe103-mono muestra arriba a la izquierda un eosin´ofilo y abajo a la derecha un monocito. En DOSl40mono3 se observa arriba a la derecha un monocito y abajo a la izquierda un linfocito. DOSn28linfo10 arriba a la derecha presenta un neutr´ofilo grande y abajo a la izquierda un linfocito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

´Indice de tablas 3.1. Caracter´ısticas que permiten describir la forma de una regi´ on. . .

35

4.1. Principales trabajos relacionados . . . . . . . . . . . . . . . . . . . . .

66

5.1. Caracter´ısticas estructurales.

83

. . . . . . . . . . . . . . . . . . . . . . .

5.2. Caracter´ısticas estructurales iniciales para el an´ alisis de varianza.

84

5.3. Resultados del an´ alisis de varianza para 17 caracter´ısticas estructurales.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

5.4. Caracter´ısticas estructurales obtenidas con el an´ alisis de varianza.

86

C.1. Principales funciones programadas . . . . . . . . . . . . . . . . . . . . 142

Prefacio Motivaci´ on personal La fuerza motivadora para la realizaci´on de este trabajo de tesis ha sido el inter´es por aplicar t´ecnicas de visi´on por computadora en el ´area del an´alisis cl´ınico, encaminado a encontrar un m´etodo que permita a la computadora realizar el proceso de visi´on como lo har´ıa el ser humano en la identificaci´ on de c´elulas sangu´ıneas. As´ı, el objetivo principal es proponer una t´ecnica que permita identificar leucocitos y clasificarlos biol´ogicamente en segmentados y no segmentados. La t´ecnica propuesta no pretende competir con las m´aquinas disponibles en el mercado que son capaces de realizar tareas similares empleando mecanismos no visuales. Tampoco es una meta de este trabajo obtener un sistema listo para ser utilizado en el ´area cl´ınica y reemplazar a los m´etodos ya existentes, debido a que el an´alisis visual consume m´as tiempo que los m´etodos f´ısico-qu´ımicos. Adem´as la automatizaci´on completa requiere de un sistema que permita la manipulaci´on del microscopio para la adquisici´on de la imagen, lo cual resulta dif´ıcil a´ un para un experto del ´area cl´ınica.

Organizaci´ on de la Tesis Este trabajo de tesis se ha dividido en 7 cap´ıtulos que progresivamente llevar´ an al lector a tener una idea clara del proceso de Clasificaci´on de C´elulas Sangu´ıneas empleando t´ecnicas de Visi´on por computadora. En el primer Cap´ıtulo, se encontrar´ a un resumen sobre la situaci´on actual en el ´area

XX

de los an´alisis cl´ınicos respecto al proceso de identificaci´ on y clasificaci´on de c´elulas sangu´ıneas, en especial de leucocitos o gl´obulos blancos. Adem´as se presenta un bosquejo general acerca de la problem´atica abordada en este trabajo y su m´etodo de soluci´on. En el Cap´ıtulo 2 se presenta la definici´on del problema, as´ı como las propuestas de soluci´on, objetivos y material utilizado en el transcurso de la investigaci´ on. El Cap´ıtulo 3 es dedicado a la explicaci´on de los antecedentes te´oricos, necesarios para el entendimiento de las secciones posteriores; incluyendo t´opicos como definiciones de elementos biol´ogicos y hematol´ogicos, t´ecnicas de preparaci´on de las muestras biol´ogicas y m´etodos de clasificaci´on de las mismas, conceptos estad´ısticos, teor´ıa de procesamiento de im´agenes, extracci´on de caracter´ısticas, redes neuronales y t´ecnicas de validaci´ on de resultados. En el Cap´ıtulo 4 se comentan algunos trabajos relacionados con el problema abordado en esta tesis, considerando principalmente aquellos que se relacionan con t´ecnicas de segmentaci´on en color. En el Cap´ıtulo 5 se describe el dise˜ no y la implementaci´ on del proceso de identificaci´ on y clasificaci´on de leucocitos Segmentados y No segmentados. En el Cap´ıtulo 6 se muestran las pruebas realizadas y se comentan los resultados obtenidos. En el Cap´ıtulo 7 estan las conclusiones y sugerencias para trabajos futuros. Esperando sea u ´til para futuros trabajos de investigaci´ on, se anexa la base de datos utilizada en formato digital, adem´as de los c´odigos fuente correspondientes a las funciones implementadas incluyendo algunos experimentos adicionales que no se reportan en este trabajo, as´ı como el c´odigo latex que produjo este documento. Mar´ıa del Roc´ıo Ochoa Montiel1 Asesor: M. en C. Ricardo Solano Monje2 . Apizaco, Tlax. Abril 2006.

1 2

Email: [email protected] Email: [email protected]

Agradecimientos A todas las personas que de manera incondicional, brindaron parte de su valioso tiempo para conocer y hacer posible la realizaci´on de este trabajo. Para empezar quiero agradecer a mi t´ıa Genobeba Montiel Corona, quien me ha apoyado mucho al hacerse cargo del cuidado de mis hijos y las labores dom´esticas para que yo pudiera dedicar el tiempo necesario para hacer posible la realizaci´on de este trabajo de tesis. Doy gracias a mi asesor por su apoyo y gu´ıa en las actividades involucradas en la realizaci´ on de este trabajo y por sus consejos para que esta tesis fuera posible. Tambi´en deseo agradecer al M. en C. Jos´e Alberto Ch´avez Arag´on3 por las sugerencias que permitieron mejorar este trabajo de tesis. Agradezco al Dr. Francisco J. Albores Velasco4 por su apoyo persistente y desinteresado en la resoluci´on de mis problemas matem´aticos. Quiero agradecer especialmente al M. en C. Ori´on Fausto Reyes Galaviz5 por la revisi´on desinteresada de mi trabajo de tesis y por su disposici´on constante en las revisiones del c´odigo correspondiente al uso de Redes Neuronales. Al Dr. Isa´ıas L´opez Morales6 , al Dr. Manuel Hern´andez Guti´errez7 y al M. en C.

3

Catedr´ atico del ´ area de Computaci´ on en la Facultad de Ingenier´ıa y Tecnolog´ıa. Email: [email protected] 4 Catedr´ atico del ´ area de Computaci´ on en la Facultad de Ingenier´ıa y Tecnolog´ıa. Email: [email protected] 5 Catedr´ atico del ´ area de Computaci´ on en la Facultad de Ingenier´ıa y Tecnolog´ıa. Email: [email protected] 6 Catedr´ atico del ´ area de Matem´ aticas Aplicadas en la Facultad de Ciencias B´ asicas. Email: [email protected] 7 Catedr´ atico del ´ area de Computaci´ on en la Facultad de Ingenier´ıa y Tecnolog´ıa.

XXII

Jos´e Erasmo P´erez V´azquez8 por su apoyo en la resoluci´on de mis dudas relacionadas con el c´odigo Latex producido de esta tesis. No menos importante es agradecer a Laboratorios Biodiagnostics por prestar sus instalaciones y equipo cl´ınico para la obtenci´on de las muestras biol´ogicas y especialmente reconocer el trabajo realizado por el Q.F.B. Gonz´alo Romero Tirso en las tareas de recolecci´on y preparaci´on de los frotis sangu´ıneos as´ı como su valioso apoyo en la identificaci´ on de las c´elulas que se utilizaron en este trabajo de tesis. Finalmente, al M. en C. Antonio Durante Murillo9 agradezco las facilidades brindadas durante el proceso administrativo y que han permitido que este trabajo concluya exitosamente. A todos mis colegas que me han hecho cr´ıticas y sugerencias, mil gracias.

8 Catedr´ atico del ´ area de Matem´ aticas Aplicadas en la Facultad de Ciencias B´ asicas. Email: [email protected] 9 Director de la Facultad de Ciencias B´ asicas, Ingenier´ıa y Tecnolog´ıa.

Resumen El prop´osito de este trabajo de tesis es utilizar visi´on por computadora para identificar y clasificar c´elulas sangu´ıneas. Estas c´elulas estan contenidas en un conjunto de im´agenes adquiridas a trav´es de un sistema de visi´on. El m´etodo propuesto esta basado en un algoritmo de segmentaci´on que fue utilizado originalmente para la segmentaci´ on de piel. Adicionalmente, se utiliz´o una red neuronal para la tarea de clasificaci´on. El algoritmo de segmentaci´on adaptado permite crear un modelo de color, y haciendo uso de este modelo se realiza el proceso de segmentaci´ on. Esto permite extraer las caracter´ısticas de la regi´on de inter´es. Hay 3 tipos de caracter´ısticas extra´ıdas: estructurales, estructurales con an´alisis de varianza y radiales. El proceso de identificaci´on esta constituido por un sistema de aprendizaje – la red neuronal –, la cual es entrenada con las caracter´ısticas mencionadas anteriormente. Los resultados se basan en el uso de una red neuronal de retropropagaci´on, utilizando ya sea caracter´ısticas estructurales, estructurales con an´alisis de varianza o radiales para la etapa de entrenamiento. El primer conjunto de datos de entrenamiento consisti´o de 13 atributos de la regi´on de inter´es. El ´ındice de reconocimiento obtenido con ´este conjunto fue de 84.54 %. El segundo conjunto de datos de entrenamiento fue formado por 8 caracter´ısticas obtenidas despu´es de realizar un an´alisis de varianza a un subconjunto de 17 caracter´ısticas estructurales. En este caso se obtiene un ´ındice de reconocimiento del 85.82 %. El tercer conjunto de datos de entrenamiento consiste de 111 caracter´ısticas radiales, que corresponden a las distancias del centro de masa de la regi´on de inter´es a su per´ımetro. Antes de usar este conjunto de datos para el entrenamiento de la red neuronal, se aplic´o la

XXIV

FFT(Transformada R´apida de Fourier –por sus siglas en ingl´es–) para eliminar variaciones en las caracter´ısticas extra´ıdas relacionadas con la rotaci´on o escala, incrementando el desempe˜ no de la fase de clasificaci´on hasta en un 99.54 %. En todos los casos, las caracter´ısticas se preprocesaron con PCA. El desempe˜ no de la fase de entrenamiento –el desempe˜ no de la red neuronal–, se evalu´ o utilizando la t´ecnica de validaci´on cruzada en 10 particiones.

Abstract The purpose of this work is to use computer vision in order to identify and clasify blood cells. These cells are extracted from a set of images which were adquired through a vision system. The proposed method is based on segmentation algorithm, that was previously used for skin segmentation. Additionally, a neural network was used for the classification task. The adapted segmentation algorithm allows to create a color model and making used of this model the segmentation process is performed. This allows to extract the characteristics of the region that concerns us. There are three types of extracted characteristics: structurals, structurals with variance analysis and radials. The identification process is accomplished by means of a learning system -the neural network- which is trained with the characteristics of the previous phase. The results are based on the use of a back-propagation neural network, using the structural, structurals with variance analysis or radial characteristics for the training phase. The first set of training data consists of 13 attributes of the segmented region of interest. The positive index obtained from this set was of 84.54 %. The second training data was made of 8 characteristics obtained from a variance analysis of a subset of 17 structurals characteristics. In this case the recognition rate obtained was 85.82 %. The third training data set consisted of 111 radial characteristics which were corresponded to the distances taken from the center of mass of the region of interest to its perimeter. Before using this data set for training the neural network. The FFT (Fourier Fast Transform) was applied in order to eliminate to variations in the extracted features

XXVI

such as rotation or scaling changes. As a result, the classification performance increased up to 99.54 %. In every case the characteristics were propocessed with PCA. The performance of the training phase –the neural network performance– were evaluated using the Ten Fold Cross Validation approach.

Cap´ıtulo 1

Introducci´ on En instituciones de salud p´ ublica y privada se realizan ex´amenes de laboratorio relacionados con el an´alisis de sangre, uno de ellos es el Recuento Diferencial que consiste en la identificaci´on, clasificaci´on y conteo de gl´obulos blancos. El objetivo principal de esta prueba es contribuir en conjunto con los resultados de otras pruebas de laboratorio, a proporcionar al m´edico datos que ayuden a dar un diagn´ostico en un paciente, adem´as de formar parte de los an´alisis preoperatorios requeridos en intervenciones quir´ urgicas. Los resultados de un Recuento Diferencial tambi´en son u ´tiles en diagn´osticos de leucemias, parasitosis, cuadros infecciosos y anemia, entre otros [Oppenheim, 1998]. De esta manera una gran cantidad de c´elulas sangu´ıneas de la serie blanca1 son clasificadas en laboratorios cl´ınicos utilizando microscopios , lo que resulta en una tarea subjetiva y detallada [Ushizima et al., 2004]. Un t´ecnico cl´ınico capacitado toma de 10 a 15 minutos para evaluar y contar 100 c´elulas para cada laminilla2 , un tiempo considerable y susceptible para que ocurra un error en el an´alisis. Debido a la importancia que este tipo de an´alisis tiene, sus aplicaciones y el volumen de muestras que es necesario revisar diariamente, algunas instituciones de salud utilizan m´aquinas capaces de realizar un cierto n´ umero y tipo de an´alisis cl´ınicos incluyendo el Recuento Diferencial, disminuyendo en parte el riesgo para el humano al tener menos contacto directo con muestras posiblemente infectadas. En la Figura 1.1, tomada de 1 2

gl´ obulos blancos o leucocitos muestra de frotis sangu´ıneo te˜ nido para recuento diferencial

´ 1 INTRODUCCION

2

Figura 1.1: Contadores hematol´ ogicos.

[Beckman Coulter, 2006] se muestran dos tipos de m´aquinas empleadas en an´alisis cl´ınicos. Sin embargo, la desventaja de realizar los an´alisis empleando m´aquinas de este tipo es que su mantenimiento es costoso, adem´as de que son productos caros que no proporcionan resultados completos y certeros en el examen llamado Recuento Diferencial debido posiblemente a que los mecanismos que emplean para hacer esta diferenciaci´on se basan en m´etodos f´ısicos y qu´ımicos, no en un an´alisis visual; hecho que ha ocasionado que a´ un se siga utilizando el m´etodo manual descrito en la secci´on 3.1.2. En busca de un m´etodo que permita realizar esta identificaci´ on empleando visi´on por computadora, surge este trabajo de tesis, el cual una vez terminado no pretende de ninguna manera sustituir a los m´etodos tradicionales para la realizaci´on del Recuento Diferencial, ya sea hecho por un experto o por una m´aquina sino encontrar una alternativa para el an´alisis visual de espec´ımenes biol´ogicos y en un futuro servir como marco de referencia para el desarrollo de una aplicaci´on que sirva de apoyo a los estudiantes del ´area cl´ınica en algunas instituciones educativas del nivel medio superior o superior. Por otra parte, la imagen completa de un leucocito es insuficiente para diferenciarlos de entre sus propios subtipos. Su clasificaci´on se realiza en principio considerando caracter´ısticas de la forma del n´ ucleo de la c´elula. El presente trabajo aborda por un lado el problema de reconocimiento de patrones en el an´alisis de im´agenes de sangre humana, y por otro el c´omo la informaci´on de color presente en su n´ ucleo puede hacer posible la extracci´on de caracter´ısticas que permitan la diferenciaci´on de leucocitos en 2 subclases: leucocitos segmentados y leucocitos no segmentados. Como parte de la soluci´on propuesta se trabaja con un grupo de 354 muestras obtenidas con una c´amara digital adaptada al ocular de un microscopio ´optico. Posteriormente se

3 utiliza un modelo propuesto por [Tomaz et al., 2003] para la segmentaci´ on de piel humana que se adapt´o para la segmentaci´ on de n´ ucleos celulares . Una vez obtenida la regi´on de inter´es se extraen caracter´ısticas que permiten clasificar a los leucocitos en dos clases: c´ elulas segmentadas y c´ elulas no segmentadas. El m´etodo usado para la clasificaci´on es una red neuronal de retropropagaci´on que recibe como entrada un vector de caracter´ısticas de cada n´ ucleo extra´ıdo durante la segmentaci´ on. Finalmente se concluye que para el espacio de color utilizado, la detecci´on eficiente –segmentaci´on adecuada– depende de la capacidad del modelo de color para estimar la distribuci´on de color del n´ ucleo celular y, lo m´as importante la discriminabilidad entre distribuciones de n´ ucleo y no n´ ucleo. Por otra parte, se comprob´o que las caracter´ısticas radiales son buenos descriptores de las formas nucleares de los leucocitos. El aporte que se puede apreciar en este trabajo, es que el uso de un espacio de color adaptado para n´ ucleos celulares y la aplicaci´on de m´etodos estad´ısticos, son u ´tiles en la segmentaci´on en color de n´ ucleos en leucocitos, permitiendo extraer caracter´ısticas que permiten definir la forma del n´ ucleo de la c´elula. De esta manera, los resultados demuestran que es factible el uso de la t´ecnica propuesta en el presente trabajo para el an´alisis de muestras biol´ogicas, en las cuales es de suma importancia la detecci´on de anormalidades morfol´ogicas y colorim´etricas, adem´as de constituir una alternativa para el an´alisis e identificaci´ on de cualquier tipo de objeto con t´ecnicas de visi´on por computadora.

Cap´ıtulo 2

Antecedentes Este cap´ıtulo refiere el problema de la segmentaci´ on de c´elulas blancas y su clasificaci´on. Se describe la hip´otesis, los objetivos y el m´etodo de soluci´on propuesta. Finalmente se hace menci´on del hardware y software utilizado durante el desarrollo de esta tesis.

2.1.

¿C´ omo identificar leucocitos empleando visi´ on por computadora?

La respuesta a esta pregunta constituye la problem´atica principal de este trabajo de tesis. La raz´on principal de intentar dar respuesta a esta pregunta es, por un lado encontrar un m´etodo que se asemeje al proceso realizado por un ser humano al tratar de identificar c´elulas blancas, y por otro proponer una alternativa para la identificaci´ on de este tipo de muestras que est´e apoyada en t´ecnicas de visi´on por computadora. El m´etodo de clasificaci´on propuesto consiste en determinar si una c´elula blanca es Segmentada o No segmentada1 considerando su color y morfolog´ıa nuclear. Se toman caracter´ısticas de color y forma debido a que un experto humano identifica y clasifica a los gl´obulos blancos vistos en un frotis, detectando estas caracter´ısticas en primera instancia. Como se comenta en la Introducci´on de esta tesis, actualmente la mayor´ıa de los la1 los t´erminos segmentada y no segmentada corresponden a una clasificaci´ on en la cual se considera la morfolog´ıa nuclear para determinar ambas clases. El tipo segmentado corresponde a un n´ ucleo fragmentado(dividido) y el no segmentado a un n´ ucleo semicircular, sin divisiones.

6

2 ANTECEDENTES

boratorios cl´ınicos en M´exico, realizan el an´alisis llamado Recuento Diferencial empleando un m´etodo manual realizado por un experto.

2.2.

Hip´ otesis

El tema principal de este trabajo esta directamente relacionado con t´ecnicas de visi´on por computadora. Y como variable principal en el proceso de identificaci´ on se utiliza el color para la segmentaci´on y la morfolog´ıa nuclear para la clasificaci´on, pues una buena caracterizaci´on del n´ ucleo es suficiente para ubicar a los gl´obulos blancos en dos grupos: segmentados y no segmentados. De esta manera, la hip´otesis se enuncia de la siguiente manera: Es posible clasificar a los gl´ obulos blancos en segmentados y no segmentados utilizando t´ecnicas de visi´ on por computadora, espec´ıficamente mediante la segmentaci´ on en color de los n´ ucleos celulares, y el uso de caracter´ısticas que describen la forma dicho n´ ucleo: caracter´ısticas estructurales, caracter´ısticas estructurales con an´ alisis de varianza o caracter´ısticas radiales.

2.3.

Objetivos

2.3.1.

Objetivo General

Desarrollar un m´etodo que permita clasificar gl´obulos blancos de sangre humana, en segmentados y no segmentados a partir de im´agenes digitalizadas obtenidas de una c´amara adaptada a un microscopio ´optico.

2.3.2.

Objetivos Espec´ıficos

Revisar el procedimiento manual actualmente utilizado para modelar la soluci´on. Analizar visualmente las c´elulas blancas para elegir las caracter´ısticas utilizadas en su clasificaci´on. Sustentar los resultados dentro de varias alternativas factibles.

2.4 M´etodo de soluci´ on

7

Figura 2.1: Proceso de reconocimiento de c´ elulas sangu´ıneas.

En cap´ıtulos posteriores se describir´an los procedimientos detallados para la demostraci´on de la hip´otesis formulada y el logro de los objetivos propuestos.

2.4.

M´ etodo de soluci´ on

En la Figura 2.1 se muestra el modelo que compone el proceso de reconocimiento de c´elulas sangu´ıneas. Como se observa, se comienza por adquirir las muestras biol´ogicas que se utilizan durante el proceso de investigaci´ on. El siguiente paso es digitalizar las im´agenes de leucocitos para iniciar el proceso de an´alisis de la imagen, que consiste en segmentar a la regi´on de inter´es. En este caso, la regi´on de inter´es corresponde al n´ ucleo de la c´elula, dado que la forma que lo caracteriza es lo que hace la diferencia entre las dos clases de leucocitos que se deben reconocer. Estas clases son: 1. Leucocitos segmentados: Poseen un n´ ucleo de forma irregular, presentan de 2 a 3 l´obulos. En ocasiones el n´ ucleo no se distingue bien debido a los gr´anulos2 presentes en el citoplasma como en el caso de los bas´ofilos. 2. Leucocitos no segmentados: Poseen un n´ ucleo de forma redondeada, ovoide y compacta. En la mayor´ıa de los casos no hay protuberancias3 . 2 3

part´ıculas peque˜ nas que se encuentran suspendidas en el citoplasma de la c´elula. extensiones de la c´elula ocasionadas por el rompimiento de la membrana que la rodea.

8

2 ANTECEDENTES

En el proceso de an´alisis de la imagen se propone un modelo de color que permita realizar una segmentaci´on autom´atica de los n´ ucleos celulares, para delimitarlos de la mejor manera posible y extraer caracter´ısticas que mejor describan su forma. Al conclu´ır la etapa de an´alisis de la imagen se extraen caracter´ısticas de la regi´on de inter´es. Las caracter´ısticas que describen a la regi´on se agrupan en 3 clases:

1. Descriptores estructurales

2. Descriptores estructurales con an´alisis de varianza

3. Descriptores de Fourier

Los descriptores estructurales considerados en este trabajo corresponden a atributos de la regi´on que son medibles y que adem´as, proporcionan informaci´on u ´til sobre la composici´on de la regi´on [Pajares and de la Cruz, 2002]. Algunas de ellas son el ´area, el per´ımetro, el centro de masa, el n´ umero de huecos, la longitud de eje mayor y menor respectivamente. Los descriptores estructurales con an´ alisis de varianza est´ an formados por un conjunto de caracter´ısticas estructurales que resultan de hacer un an´alisis de varianzas, en el cual se eligen aquellas caracter´ısticas cuya varianza entre ambas clases de c´elulas sea significativa. Los descriptores de Fourier son representaciones gr´aficas de la forma de la regi´on, que se calculan utilizando la t´ecnica de [Abdallah et al., 1995]. Como resultado de la extracci´on de caracter´ısticas se obtiene un vector de caracter´ısticas estructurales, un vector de caracter´ısticas estructurales con an´alisis de varianza y un vector de caracter´ısticas radiales (descriptores de Fourier) para cada imagen. Con cada conjunto de caracter´ısticas se entrena una red neuronal de retroprogapaci´on, que es el clasificador elegido para evaluar a las caracter´ısticas seleccionadas, dado que en el trabajo reportado por [Katz, 2000], se observa un buen desempe˜ no cuando se trabaja con datos similares a los que integran a los vectores de caracter´ısticas utilizados en esta tesis.

2.5 Hardware y software utilizado

9

Figura 2.2: Hardware utilizado en el sistema de visi´ on.

2.5.

Hardware y software utilizado

Los elementos que fueron utilizados en el desarrollo de este trabajo se mencionan a continuaci´on.

2.5.1.

Hardware

El hardware utilizado para el sistema de visi´on se muestra en la Figura 2.2. Las im´agenes fueron tomadas de [Mot, 2004]. La implementaci´on fue realizada en una computadora con un procesador INTEL Centrino 1.5Ghz y 512MB.

2.5.2.

Software

El software utilizado en este trabajo consiste en: Sistema operativo: Windows XP Home Edition versi´ on 2002 Service Pack 2. Software de la c´ amara: Motic Images 2000 versi´ on 1.2 [Mot, 2004].

10 Software de programaci´ on: Matlab 6.0.0.88.

2 ANTECEDENTES

Cap´ıtulo 3

Fundamentos En este cap´ıtulo se describen los conceptos b´asicos, necesarios para la plena comprensi´on del resto del trabajo de tesis. Se definen conceptos relacionados con citolog´ıa, hematolog´ıa, procesamiento de im´agenes, estad´ıstica, redes neuronales, y t´ecnicas de validaci´ on de resultados.

3.1.

Conceptos biol´ ogicos

Para tener una descripci´on m´as amplia respecto a los elementos biol´ogicos que constituyen el objeto de estudio en este trabajo de tesis, se describe la anatom´ıa y fisiolog´ıa de la c´elula. Una c´elula es la unidad anat´omica y fisiol´ogica que compone a un ser vivo y est´a formada fundamentalmente por una membrana, un citoplasma y un n´ ucleo. La membrana es la parte que cubre a la c´elula y que visualmente representa su silueta marcando los l´ımites entre ella y su entorno. El citoplasma es la parte que se encuentra despu´es de la membrana en el cual estan suspendidos los ´organos internos de la c´elula, su consistencia puede ser l´ıquida o viscosa. Dentro del citoplasma se encuentra el n´ ucleo, que regularmente esta situado en la parte central de la c´elula y es el encargado de controlar la actividad celular. En la Figura 3.1, tomada de [S´anchez, 2006] se muestra un ejemplo se˜ nalando algunas de sus partes.

12

3 FUNDAMENTOS

Figura 3.1: Componentes de una c´ elula b´ asica.

En ocasiones la c´elula es incolora, dificultando su an´alisis visual a trav´es de un microscopio. Al conocerse su composici´on qu´ımica es posible determinar qu´e tipo de colorantes usar (´acidos o b´asicos) para te˜ nirlas y poder visualizarlas distinguiendo mejor sus partes. Debido a que en el n´ ucleo se encuentra la informaci´on gen´etica de la c´elula y como consecuencia los ´acidos nucl´eicos ADN1 y RDN2 [Wikipedia Foundation, 2006], su composici´on generalmente es ´acida, en cambio el citoplasma tiende a ser qu´ımicamente m´as b´asico3 . As´ı, los n´ ucleos de los leucocitos generalmente se ti˜ nen de morado en respuesta a los colorantes utilizados para te˜ nirlos.

3.1.1.

Composici´ on de la sangre humana

La sangre humana es un compuesto formado por 2 elementos fundamentales, el plasma y el paquete globular. El plasma es la parte l´ıquida de la sangre, mientras que el paquete globular lo forman un conjunto de c´elulas que se encuentran suspendidas en ´el, como los gl´obulos rojos (eritrocitos), gl´obulos blancos (leucocitos) y las trombocitos (plaquetas). Cada uno de ellos tiene su funci´on particular [Woodliff and Herrmann, 1993]. El color de la sangre esta determinado por la hemoglobina presente en los eritroci1

a ´cido desoxirribonucl´eico, constituye el materal gen´etico de los organismos. a ´cido ribonucl´eico, sirve como una plantilla para la traducci´ on de genes. 3 se refiere a que posee un PH alcalino. 2

3.1 Conceptos biol´ ogicos

13

Figura 3.2: Componentes de la sangre humana.

tos, cuya funci´on principal es transportar el ox´ıgeno a todo el cuerpo. Las plaquetas se encargan de los procesos de coagulaci´on, en tanto que los leucocitos constituyen el mecanismo de defensa desempe˜ n´andose como anticuerpos4 . En la Figura 3.2 se muestra un esquema de la clasificaci´on completa de las c´elulas que se encuentran en la sangre humana [Cormack, 1997].

Leucocitos Etimol´ogicamente los leucocitos deben su nombre a las palabras leuco (blanco) y cito (c´elula). En personas saludables, el n´ umero de leucocitos var´ıa entre 5000 y 10, 000, en condiciones patol´ogicas pueden estar aumentados (leucocitosis) o disminuidos (leucopenia). En la Figura 3.3 se muestran los subtipos de leucocitos y los porcentajes normalmente encontrados en un Recuento Diferencial seg´ un [Oppenheim, 1998]. Los neutr´ofilos, monocitos y eosin´ofilos poseen propiedades fagocitarias5 que constituyen un mecanismo de defensa antibacteriana y una contribuci´ on para la eliminaci´on de desechos. Los linfocitos son productores de anticuerpos, mientras que los bas´ofilos poseen 4

son un tipo de prote´ınas producidas por el sistema inmune en respuesta a la presencia de sustancias extra˜ nas potencialmente da˜ ninas que pueda ser una amenaza para el organismo: como qu´ımicos, part´ıculas de virus, esporas (cuerpos microsc´ opicos unicelulares o pluricelulares que por divisi´ on propia dan nacimiento a nuevos organismos en vegetales cript´ ogamos, hongos y algunas especies protozoarias.) o toxinas (prote´ınas o lipopolisac´ aridos que causan da˜ nos concretos a un hu´esped) de las bacterias [Webner, 2006]. 5 propiedad de una c´elula para atraer part´ıculas y destruirlas o digerirlas.

14

3 FUNDAMENTOS

Figura 3.3: Porcentajes normales en un Recuento Diferencial.

3.1 Conceptos biol´ ogicos

15

gr´anulos de heparina e histamina6 . En las infecciones, cuadros t´oxicos y hemorragias se produce una respuesta leucocitaria en la sangre, de acuerdo con la intensidad del est´ımulo y la capacidad de reacci´on del individuo. Las primeras c´elulas que aumentan en n´ umero ante un cuadro infeccioso son los neutr´ ofilos, mientras los monocitos y linfocitos aumentan en etapas posteriores. En ejercicios muy forzados o embarazo puede haber una moderada leucocitosis7 fisiol´ogica, no relacionada con procesos patol´ogicos. En la Figura 3.4, tomada de [Freggiaro and Espejo, 2006] se muestran im´agenes de los tipos de leucocitos m´as comunes.

3.1.2.

Recuento Diferencial

M´ etodo manual El Recuento Diferencial consiste en examinar la morfolog´ıa de gl´obulos blancos, as´ı como su tama˜ no y n´ umero [Oppenheim, 1998]. El m´etodo para la preparaci´on de la muestra empleada para hacer un Recuento Diferencial es el siguiente: Preparaci´ on del frotis sangu´ıneo. Se coloca una gota de sangre fresca sobre un portaobjetos y se extiende con ayuda de otro portaobjetos para formar una capa delgada que se deja secar, como se observa en la Figura 3.5. Tinci´ on. Se realiza con colorantes ´acidos (eosina-rojo) y b´asicos (azul de metileno). Los Leucocitos (gl´obulos blancos) se ti˜ nen de color azul, pues reaccionan qu´ımicamente con el azul de metileno tomando dicha coloraci´on. Los Eritrocitos (gl´obulos rojos) se ti˜ nen de color rojo, ya que reaccionan qu´ımicamente con la eosina pint´ andose de rojo. Los gl´obulos blancos con gr´anulos que toman ambos colorantes se denominan neutr´ ofilos. Las c´elulas con gr´anulos que toman color azul se llaman bas´ ofilos. Los leucocitos que poseen gr´anulos que se ti˜ nen con eosina (rojo) se denominan eosin´ ofilos. Una vez te˜ nidos los leucocitos, se identifican por sus caracter´ısticas y grado de desarrollo. 6 7

mediadores qu´ımicos que modulan los procesos de la inflamaci´ on. aumento en el n´ umero de leucocitos.

16

3 FUNDAMENTOS

Tipo de célula

NEUTRÓFILO

Imagen de un Atlas de Hematología(aumento:400 veces)

Características

1. Neutrófilo en banda 2. Neutrófilo segmentado 3. Eritrocito 4. Neutrófilo en segmentación De acuerdo a la forma de su núcleo se les puede clasificar en neutrófilos en banda o cayados y en neutrófilos segmentados. Presentan núcleos divididos en 3 a 5 lóbulos. Núcleo en forma de anteojo y gránulos gruesos en el citoplasma.

EOSINÓFILO

Posee un núcleo en forma de lóbulos difícil de distinguir a causa de los gránulos gruesos y obscuros del citoplasma. BASÓFILO

Núcleo redondo y grande. El borde del citoplasma celular es ligeramente azulado y bien definido. LINFOCITO

Células fagocíticas con gran capacidad bactericida. Por la fagocitosis aumentan de tamaño. MONOCITO

Figura 3.4: Tipos de leucocitos y sus caracter´ısticas.

Figura 3.5: Preparaci´ on de frotis sangu´ıneo.

3.1 Conceptos biol´ ogicos

17

Figura 3.6: Observaci´ on y conteo de leucocitos.

Reporte. Se cuentan en una muestra vista al microscopio ´optico alrededor de 100 c´elulas para expresar los resultados a manera de porcentaje. En el lado izquierdo de la figura 3.6 se muestra un aparato similar a una m´aquina de escribir que utiliza el qu´ımico para realizar el conteo mientras observa al microscopio. Los colorantes utilizados en el m´etodo de tinci´on descrito anteriormente se utilizan en la mayor´ıa de los laboratorios cl´ınicos en M´exico y son los que se utilizaron en este trabajo de tesis. De acuerdo a las im´agenes consultadas en diversas fuentes se puede notar que la coloraci´on que adquieren los leucocitos es muy similiar al ser te˜ nidos para Recuento Diferencial, lo cual significa que es posible utilizar distintos colorantes para la tinci´on de los frotis sin afectar de forma considerable la coloraci´on que com´ unmente adquieren para ser diferenciados.

M´ etodo autom´ atico No existe un m´etodo u ´nico para contar c´elulas, lo cual implica que hay en el mercado varios modelos de contadores hematol´ogicos y cada uno de ellos realiza su funci´on de una forma espec´ıfica; sin embargo, los par´ametros que miden y los resultados de sus mediciones son muy similares. Como ejemplo para este estudio, se han escogido los contadores Beckman Coulter8 por su sencillez y uso extendido; sin querer decir con ello que sean los mejores o los u ´nicos modelos existente para este prop´osito9 . Un contador hematol´ogico debe contar, como m´ınimo, la serie blanca (gl´obulos blancos) y la serie roja (gl´obulos rojos). Es decir, el total de leucocitos y el total de eritrocitos, sin 8 9

empresa l´ıder en el comercio de equipo de laboratorio y contadores hematol´ ogicos. En los laboratorios de SESA en Tlaxcala se utilizan el sistema K-1000 [Ses, 1999].

18

3 FUNDAMENTOS

hacer distinci´on entre las poblaciones de c´elulas que componen a cada una de las series. A esto se le llama CBC –Complete Blood Count–. Aparte de esta cuenta, un contador hematol´ogico tambi´en debe proporcionarnos la cuenta de toda la serie blanca; es decir, diferenciaci´on entre los componentes de la poblaci´on blanca. Esto es lo que se llama el White Blood Differential (Modo Diff, Recuento Diferencial). La tecnolog´ıa VCS (Volumen, Conductividad y dispersi´on) es el mecanismo por el cual los analizadores de hematolog´ıa COULTER realizan la diferenciaci´on de leucocitos en 5 tipos: Neutr´ofilos, Linfocitos, Monocitos, Eosin´ofilos y Bas´ofilos [Gal´enica, 2005].

Principios del m´ etodo: La muestra de sangre es mezclada con el reactivo Erythrolyse (contenido en el reactivo Scatter Pack), lo cual produce una r´apida lisis10 de los eritrocitos y reduce los restos celulares sin alterar los leucocitos. Posterior a esta reacci´on se agrega el reactivo StabiLyse, el cual act´ ua como preservante11 de los leucocitos a fin de que resistan en su estado casi nativo las mediciones subsecuentes –Volumen, Conductividad y Dispersi´on–. Una vez tratada la muestra es dirigida a una celda de flujo en la cual por el dise˜ no hidrodin´amico, los leucocitos se alinean y pasan formados uno a uno y en donde se realizan las siguientes mediciones: El volumen celular se obtiene mediante la impedancia de baja frecuencia que presenta al paso de la corriente continua. La conductividad al aplicar radiofrecuencia12 , que da informaci´on sobre la densidad celular. La dispersi´ on al hacer incidir sobre la c´elula una luz l´aser, lo que proporciona informaci´on sobre estructura y forma de la c´elula. De esta manera son realizadas las 3 determinaciones de manera simult´ anea. Las lecturas de estas 3 se˜ nales an´alogas son enviadas al analizador para su amplificaci´on y proceso, luego el 10

rompimiento o destrucci´ on de las c´elulas. sustancia que act´ ua como conservador o protector de los leucocitos. 12 porci´ on del espectro electromagn´etico que se obtiene al aplicar corriente alterna a una antena [Wikipedia Foundation, 2006]. 11

3.2 Conceptos Estad´ısticos

19

Figura 3.7: Tecnolog´ıa VCS. a) Preparaci´on de la muestra. b) Volumen. b) Conductividad. d) Dispersi´on. e) Pruebas simult´aneas.

sistema genera 3 gr´aficos. DF1: Volumen vs. Dispersi´on, DF2: Volumen vs. Conductividad y DF3: Volumen vs. Conductividad, en ´esta u ´ltima se extraen las se˜ nales de Neutr´ofilos y Eosin´ofilos. En la Figura 3.7 tomada de [Gal´enica, 2005], se muestra el procedimiento antes descrito. El sistema caracteriza cada c´elula que pasa hasta completar un conteo de 8,132 c´elulas o part´ıculas que sobrepasen un cierto volumen o bien hasta que transcurran 20 segundos, cualquiera de las 2 situaciones que ocurra primero [Beckman Coulter, 2006]. En la Figura 3.8 se muestran algunos modelos de contadores hematol´ogicos comerciales [Beckman Coulter, 2006].

3.2.

Conceptos Estad´ısticos

Uno de los principales objetivos del an´alisis de im´agenes por computadora consiste en dotar a la m´aquina de la capacidad de reconocimiento similar a la de los seres humanos; para esto es necesario definir un patr´on, es decir, una descripci´on estructural o cuantitativa

20

3 FUNDAMENTOS

Figura 3.8: Contadores Hematol´ ogicos.

de un objeto o de alguna otra entidad de inter´es en una imagen. Las representaciones de patrones utilizadas con m´as frecuencia son vectores para descripciones cuantitativas, y cadenas o ´arboles para descripciones estructurales [Hair et al., 2001]. Dado que el m´etodo de soluci´on a la problem´atica planteada en esta investigaci´ on se relaciona con el an´alisis estad´ıstico de la informaci´on objeto de este estudio, resulta imperativo definir algunos conceptos b´asicos. Definici´ on 1 (Individuos o elementos) Personas u objetos que contienen cierta informaci´ on que se desea estudiar [Hair et al., 2001]. Definici´ on 2 (Poblaci´ on) Conjunto de individuos o elementos que cumplen ciertas propiedades comunes [Hair et al., 2001]. Definici´ on 3 (Muestra) Subconjunto representativo de una poblaci´ on [Hair et al., 2001]. Definici´ on 4 (Caracter´ıstica) Propiedad, rasgo o cualidad de los elementos de la poblaci´ on. Las caracter´ısticas pueden ser cualitativas y cuantitativas [Hair et al., 2001]. Definici´ on 5 (Varianza) Mide cu´ anto var´ıa una variable X respecto a un valor esperado. Si µ ≡ E[X], la varianza se define como: var(X) = E[(X − µ)2 ] = E[X 2 ] − µ2 La varianza se denota por σ 2 [Alpaydm, 2004].

(3.1)

21

3.2 Conceptos Estad´ısticos

Definici´ on 6 (Desviaci´ on estandar) Se denota por σ. La desviaci´ on estandar tiene la misma unidad que X [Alpaydm, 2004]. Se define como:

σ=

p

var(X)

(3.2)

Definici´ on 7 (Covarianza) Indica la relaci´ on entre dos variables aleatorias. Si la ocurrencia de X hace m´ as probable la ocurrencia de Y , la covarianza es positiva; es negativa si las ocurrencias de X hacen menos probable las ocurrencias de Y y es 0 si no hay dependencia [Alpaydm, 2004].

cov(X, Y ) = E[(X − µX )(Y − µY )] = E[XY ] − µX µY

(3.3)

Algunas de sus propiedades son:

cov(X, Y ) = cov(Y, X)

(3.4)

cov(X, X) = var(X)

(3.5)

Definici´ on 8 (Media o valor esperado) Es el valor promedio de X en un amplio n´ umero de experimentos. Se denota por E[X] o µ [Alpaydm, 2004].

Considerando una observaci´on s, un vector caracter´ıstico x y una clase wi , se definen los siguientes conceptos: Funci´ on de masa de probabilidad discreta, FMP: P (wi ) X

P (wi ) = 1

(3.6)

i

Funci´ on de densidad de probabilidad continua, FDP: p(x) Z p(x)dx = 1

(3.7)

22

3 FUNDAMENTOS

Valor esperado: E(x)

Z E(x) =

xp(x)dx

(3.8)

Entre las funciones de densidad de probabilidad –FDP–, la funci´on de densidad normal o gaussiana es la m´as utilizada debido a las propiedades que presenta y es u ´til en situaciones, en las cuales un conjunto de patrones de una determinada clase toman valores en un rango cont´ınuo y alrededor de un patr´ on promedio, es decir, considera que los patrones de clases diferentes tienen ciertos valores, pero los valores de una clase son lo m´ as parecidos posible. Algunas propiedades de la Distribuci´on Normal son: Par´ ametros que especifican la distribuci´ on. La funci´on de densidad normal queda completamente especificada por pocos par´ametros. En el caso unidimensional: la media y la varianza. En el caso multidimensional, el vector medio y la matriz de covarianza. Incorrelaci´ on e independencia. Dado un conjunto de patrones que siguen una distribuci´on normal, si las variables asociadas est´an incorrelacionadas, entonces son independientes. Justificaci´ on f´ısica. La suposici´on de normalidad es una aproximaci´ on razonable para la mayor parte de los datos tomados de la Naturaleza. Lo cual es cierto, en particular, para variables aleatorias que son suma de otras variables y el teorema central del l´ımite13 puede aplicarse [Cortijo, 2001]. Cuando se analiza la distribuci´on de m´as de una variable, se denomina distribuci´ on normal multidimensional, y se expresa como:

p(x) =

1 d 2

(2π) |

P

|

1 2

e

−1 (x−µ)t Σ−1 (x−µ) 2

∼ N (µ,

X

)

(3.9)

donde, 13 el teorema dice que cuando se tiene un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribuci´ on (cualquiera que ´este sea), la suma de todas ellas se distribuye seg´ un una distribuci´ on normal [Garc´ıa and Sierra, 2001].

23

3.2 Conceptos Estad´ısticos

d =, n´ umero de dimensiones. x = {x1 , ..., xd }, vector de entrada. µ = E(x) = {µ1 , ..., µd }, vector de medias. P P = E((x − µ)(x − µ)t ), matriz de covarianza con elementos σij ,inverso −1 , y determiP nante | | σij = σji = E((xi − µi )(xj − µj )) = E(xi xj ) − µi µj Algunas propiedades de las distribuciones gaussianas multidimensionales son: Si las dimensiones ith y jth son estad´ısticamente o linealmente independientes, entonces E(xi xj ) = E(xi )E(xj )

y

σij = 0

(3.10)

Si todas las dimensiones son estad´ısticamente o linealmente independientes, entonces P σij = 0, ∀i 6= j, y la matriz de covarianza posee elementos diferentes de cero en la diagonal. Si la densidad subyacente es gaussiana y

P

es una matriz diagonal, entonces las

dimensiones son estad´ısticamente independientes, y

p(x) =

d Y

p(xi )

,

p(xi ) ∼ N (µi , σii )

y

σii = σi2

(3.11)

i=1

3.2.1.

M´ etricas de similitud

Distancia de Mahalanobis Si un conjunto de patrones siguen una distribuci´on normal, tienden a representarse formando un u ´nico agrupamiento de manera que el centro de este agrupamiento est´a determinado por el vector medio, y la forma por la matriz de covarianza. En la Figura 3.9 se muestra la funci´on de densidad de probabilidad para una clase cuyos patrones siguen una distribuci´on normal. De la ecuaci´on 3.9 se deduce que los puntos para los cuales el valor de la densidad de probabilidad constante est´an situados en hiperelipsoides cuya forma cuadr´atica

24

3 FUNDAMENTOS

Figura 3.9: Gr´ afica representativa de una Distribuci´ on Gaussiana

Figura 3.10: Proyecci´ on sobre el plano definido por las variables X1 y X2

(x − µ)T

P−1

(x − µ) es constante. El valor de esta expresi´on es la Distancia de Maha-

lanobis de x a µ. En el caso bidimensional, estas elipses pueden verse claramente en la Figura 3.10, donde los contornos de igual densidad de probabilidad son hiperelipsoides con una distancia de Mahalanobis a µ constante [Cortijo, 2001]. Las direcciones de los ejes principales de estos P hiperelipsoides est´an determinadas por los autovectores14 de y sus longitudes por los autovalores15 correspondientes. La utilidad de la Distancia de Mahalanobis como medida de similitud radica en que es una forma de determinar la similitud entre dos variables aleatorias multidimensionales, se diferencia con la distancia eucl´ıdea en que considera la correlaci´on entre las variables 14

tambi´en llamados eigenvectores, son vectores no nulos que al ser transformados por un operador dan lugar a un m´ ultiplo escalar de s´ı mismos λ, con lo que no cambian su direcci´ on [Wikipedia Foundation, 2006]. 15 tambi´en llamados eigenvalores, son los escalares λ obtenidos por un eigenvector [Wikipedia Foundation, 2006].

3.2 Conceptos Estad´ısticos

25

aleatorias. Algunas propiedades importantes que cumple la distancia de Mahalanobis para ser una distancia son [Hair et al., 2001]: Semipositividad. La distancia entre dos puntos de las mismas coordenadas es cero, y si tienen coordenadas distintas es positiva, pero nunca negativa. Simetricidad. La distancia entre los puntos a y b es la misma que entre los puntos b y a. Desigualdad triangular. d(a, b) ≤ d(a, c)∀a, b, c²X

3.2.2.

An´ alisis de Componentes Principales –PCA–

Tambi´en conocido en algunas ´areas como transformada discreta de Karhunen-Lo´eve o transformada de Hotelling. Es un m´etodo no supervisado que no utiliza la informaci´on de salida, cuyo criterio m´as importante es la varianza [Alpaydm, 2004]. Esta t´ecnica estad´ıstica transforma linealmente un conjunto de variables en un conjunto sustancialmente peque˜ no de variables no correlacionadas, que representan la mayor cantidad de informaci´on del conjunto de datos original, es decir reduce la dimensi´on de un conjunto de n variables a un conjunto m variables, que estan ´altamente correlacionadas. Un conjunto mucho m´as peque˜ no de variables no correlacionadas es mucho m´as f´acil de entender o procesar en an´alisis posteriores –por ejemplo con m´etricas– que el conjunto grande –original– de variables correlacionadas [Solano, 2002]. PCA se fundamenta en el hallazgo de factores –componentes principales– que sucesivamente demuestren la mayor parte de la varianza total. La t´ecnica consisten en: 1. Detectar vectores no correlacionados, llamados componentes principales. 2. Ordenar los componentes principales considerando primero a aquellos con desviaci´on m´as alta, dejando al final los que poseen las desviaciones m´as bajas. 3. Eliminar a los componentes principales que contribuyen menos en la variaci´ on en el conjunto de datos.

26

3 FUNDAMENTOS

De esta manera, el primer factor o componente es el que contiene una mayor parte de la varianza, el segundo es el que tiene la mayor parte de la varianza restante y as´ı sucesivamente. Reducir el conjunto de datos facilita el proceso del clasificador, ahorra tiempo de procesamiento y reduce la demanda en los recursos de c´omputo [Reyes, 2005]. De acuerdo al trabajo realizado por Alejandro Guzm´an en [Guzm´an, 2002], el uso de PCA como m´etodo para segmentar im´agenes tiene algunas ventajas como las siguientes: Una mejor representaci´on del espacio de representaci´ on de color, simplificando la clasificaci´on. Una posible reducci´on de dimensiones f´ısicas del espacio de representaci´ on de color (3D, 2D ´o 1D). Sintetizar informaci´on u ´til sobre la imagen y crear nuevos par´ametros para el an´alisis de la imagen. Respecto a otras t´ecnicas, PCA es m´as simple de implementar. Considerando las ventajas de ´esta t´ecnica es posible la implementaci´ on de una segmentaci´ on semi-autom´atica debido a su transformaci´on lineal, ya que manipula la informaci´on sin distorsionarla [Guzm´an, 2002].

3.3.

An´ alisis de im´ agenes

Las funciones necesarias en un sistema de visi´on son [Awcock and R., 1996]: Una escena bajo condiciones controladas. Captura de una imagen. An´alisis de la imagen. Reconocimiento de ciertos objetos dentro de ella.

3.3 An´ alisis de im´ agenes

27

Figura 3.11: Modelo de un sistema de visi´ on.

En la Figura 3.11, tomada de [Awcock and R., 1996] se muestra un modelo gen´erico de los elementos que componen un sistema de visi´on. La adquisici´on de la imagen se refiere al proceso de trasladar los est´ımulos luminosos recibidos por fotosensores de una c´amara para su almacenamiento digital dentro de la memoria de una computadora. La etapa de preprocesamiento dentro del an´alisis de im´agenes involucra al conjunto de t´ecnicas que permiten adquirir una imagen y manipularla para la obtenci´on de mejores resultados en las etapas posteriores. Dentro de las t´ecnicas utilizadas en el preprocesamiento se encuentra la eliminaci´on de ruido, que consiste en aplicar un filtro que quita elementos no deseados en la imagen. El filtro se construye analizando las propiedades de cada elemento que forma a la regi´on de inter´es en la imagen [Awcock and R., 1996]. En la parte del an´alisis de im´agenes se trabaja con los datos obtenidos en la etapa de preprocesamiento, es decir con im´agenes que no tienen ruido o lo tienen en peque˜ nas cantidades. De esta manera comienza el an´alisis aplicando t´ecnicas de segmentaci´ on que var´ıan de acuerdo al objetivo del problema, en ocasiones interesa identificar texturas y en otras, formas, color o combinaciones de ´estas. Por lo tanto, antes de elegir una t´ecnica para segmentar, es necesario identificar las caracter´ısticas de los elementos que interesan en la imagen.

28

3 FUNDAMENTOS

3.3.1.

Segmentaci´ on

La segmentaci´on consiste en dividir una imagen en regiones o partes que la constituyen, y se basa en tres propiedades [de la Escalera, 2001]: Similitud. Cada uno de los pixeles de un elemento tiene valores parecidos para alguna propiedad. Discontinuidad. Los objetos destacan del entorno y tienen por lo tanto bordes definidos. Conectividad. Los pixeles pertenecientes al mismo objeto son contiguos (estan agrupados). Las t´ecnicas que se utilizan para lograr la segmentaci´ on se basan en la b´ usqueda de partes uniformes en la imagen, o bien de partes en las que se produce alg´ un cambio. As´ı, una vez detectados los puntos que presentan ´estas discontinuidades o bordes se debe encontrar un camino entre el pixel P1 y el pixel Pn , lo que permite definir un camino como una secuencia de puntos P2 , P3 , ..., Pn − 1, donde el pixel Pi+1 es vecino del pixel Pi . Una regi´ on es un camino entre cualquier pareja de sus puntos, y todos los pixeles del camino pertenecen a la regi´on. De esta manera, como producto de la segmentaci´ on se tiene un conjunto de regiones: Ri Son las regiones que no tocan los bordes de la imagen. R Es el conjunto uni´on de todas las regiones Ri . Rc Es el conjunto complemento de R. Esto permite definir: Fondo. Puntos que pertenecen a Rc y son contiguos a los bordes de la imagen Agujeros. Puntos que pertenecen a Rc y no son contiguos a los bordes de la imagen. Al segmentar generalmente se obtienen los datos de pixel en bruto que forman parte de una regi´on o de su contorno y el siguiente paso es decidir si los datos de inter´es pertenecen

3.3 An´ alisis de im´ agenes

29

al contorno, a la regi´on o a ambos. No obstante, el ´exito en el uso de cualquier t´ecnica empleada en la etapa de segmentaci´ on de im´agenes de muestras biol´ogicas siempre se ver´a afectada por factores como la calidad en la preparaci´on de dicha muestra, de la cual se tomar´a la imagen a analizar. Otro factor importante a considerar en la segmentaci´ on, es el conjunto de condiciones requeridas para la adquisici´on de la imagen, incluyendo cambios en la iluminaci´on y niveles de acercamiento para la captura de la imagen, entre otros. En las im´agenes a color, un pixel est´a constitu´ıdo a partir de la combinaci´ on de al menos 3 componentes (RGB). Existen diferentes formas de representaci´ on espacial para un mismo color [Guzm´an, 2002]. Realizar un estudio como el que se describe en [Guzm´an, 1997] permite elegir el espacio de color m´as apropiado para llevar a cabo la segmentaci´ on basada en color. Existen muchas t´ecnicas de segmentaci´ on [Pal and Pal, 1993] y respecto a la segmentaci´on en color se pueden distinguir dos grandes grupos:

Aquellas que trabajan directamente sobre el espacio imagen. Este conjunto de t´ecnicas se puede dividir en dos grandes sub-grupos que engloban la mayor parte de t´ecnicas utilizadas hasta antes del desarrollo de las herramientas propias a la inteligencia artificial; la segmentaci´on por crecimiento de regiones y la detecci´ on de contornos. La primera utiliza un criterio de homogeneidad como par´ametro para eliminar la regi´on. Mientras que la segmentaci´ on por detecci´on de contornos busca fuertes variaciones de alg´ un par´ametro dentro de la imagen utilizando operadores diferenciales16 . En [Flores, 2001] se muestra un ejemplo de segmentaci´ on por regiones.

Aquellas que trabajan sobre el espacio de representaci´ on de color. Se fundamentan en la teor´ıa de an´alisis de datos para hacer la clasificaci´on. Entre las t´ecnicas u ´tiles para hacer ´este an´alisis se encuentra el an´alisis de componentes principales –PCA–. En la secci´on 3.2.2 se describieron algunas ventajas de esta t´ecnica para la segmentaci´ on. 16

operadores relacionados con el c´ alculo de derivadas e integrales.

30

3 FUNDAMENTOS

3.3.2.

Filtrado espacial

El filtrado espacial, tambi´en llamado suavizaci´ on consiste en el uso de m´ascaras espaciales para el procesamiento de las im´agenes, y las m´ascaras se denominan filtros espaciales. Los filtros suavizantes se utilizan para hacer que la imagen aparezca algo borrosa y para reducir el ruido favoreciendo la eliminaci´on de peque˜ nos detalles de una imagen antes de la extracci´on de un objeto (grande) y/o permitiendo el relleno de peque˜ nos espacios entre l´ıneas o curvas [Gonz´alez and Woods, 1996]. A continuaci´ on se describe el filtro de la mediana, dado que se hace uso de ´este durante la u ´ltima etapa de la segmentaci´ on descrita en la secci´on 6.1.2.

Filtro de la mediana Consiste en reemplazar el nivel de gris por la mediana de los niveles de gris en un entorno de este pixel. Es un m´etodo efectivo cuando la caracter´ıstica que se desea preservar es la agudeza de los bordes. La mediana m de un conjunto de valores es tal que la mitad de los valores del conjunto quedan por debajo de m y la otra mitad por encima. Por ejemplo, para realizar el filtrado por la mediana en el entorno de un pixel, primero se deben extraer los valores del pixel y de su entorno, determinar la mediana y asignar ´este valor al pixel. En la Figura 3.12 se muestra este procedimiento. Los tres pasos mostrados en dicha figura se repiten mientras se realiza un recorrido por toda la imagen. La funci´on del filtrado es introducir puntos con intensidades distintas que sean m´as parecidos a sus vecinos, eliminando los estrechos picos de intensidad que aparecen aislados en el ´area cubierta por la m´ascara de filtrado.

3.4.

Extracci´ on de caracter´ısticas

El objetivo principal de un extractor de caracter´ısticas es describir un objeto para su reconocimiento por medidas cuyos valores son muy similares para objetos de la misma

3.4 Extracci´ on de caracter´ısticas

31

Figura 3.12: Procedimiento para implementar el Filtro de la mediana.

clase, y muy diferentes para objetos de diferentes clases. Existen caracter´ısticas que son invariantes a transformaciones irrelevantes de la entrada, por ejemplo caracter´ısticas que describen propiedades como figura, color y textura son invariantes a rotaci´on, traslaci´on y escala [Duda, 2001]. Un gran n´ umero de transformaciones complejas surgen en torno al reconocimiento de patrones y la mayor´ıa son de dominio espec´ıfico. En algunos casos, variaciones en la iluminaci´on o efectos indeseados de sombras se deben tomar en cuenta como en la segmentaci´ on, donde la tarea de extraer caracter´ısticas constituye un problema y es dependiente del dominio, que es la clasificaci´on propia que requiere del conocimiento de dicho dominio. Sin embargo, algunas t´ecnicas de clasificaci´on de patrones tales como agrupamiento y aprendizaje no supervisado, m´etodos estoc´asticos17 , redes neuronales multicapa, funciones discriminantes lineales y t´ecnicas no param´etricas, tambi´en se pueden utilizar en el dise˜ no de un extractor de caracter´ısticas y en la selecci´on de las mismas. El dise˜ no de un sistema de reconocimiento de patrones requiere generalmente la repetici´on de un conjunto de actividades como la colecci´on de datos, la selecci´on de caracter´ısticas, la selecci´on del modelo, el entrenamiento del clasificador18 y la evaluaci´ on. En la Figura 3.13, tomada de [Duda, 2001] se muestra el ciclo de ´este dise˜ no, en principio se colectan los datos para entrenar y probar el sistema. Las caracter´ısticas de los datos 17

relativos a la teor´ıa estad´ıstica de los procesos cuya evoluci´ on en el tiempo es aleatoria. Un clasificador es una funci´ on que mapea una instancia no etiquetada a una etiqueta utilizando estructuras de datos internas [Kohavi, 1995]. 18

32

3 FUNDAMENTOS

Figura 3.13: Dise˜ no de un sistema de reconocimiento de patrones.

afectan a la elecci´on de caracter´ısticas discriminantes apropiadas y la elecci´on de modelos para las categor´ıas distintas. El proceso de entrenamiento utiliza algunos o todos los datos para determinar los par´ametros del sistema, finalmente los resultados de la evaluaci´ on se pueden repetir varias veces en el proceso para obtener resultados satisfactorios. El proceso de extracci´on de caracter´ısticas para identificar un objeto en una escena consiste en obtener informaci´on que permita describirlo. Las caracter´ısticas de una imagen generalmente estan formadas por vectores que contienen informaci´on espec´ıfica de dicha imagen. Estas caracter´ısticas pueden estar representadas por l´ımites –propiedades externas– o por informaci´on alusiva a su representaci´ on estructural –propiedades internas–. En la mayor´ıa de los casos, las caracter´ısticas m´as importantes estan relacionadas con la forma de las regiones de inter´es en la imagen, y para describirla son u ´tiles las propiedades geom´etricas y los momentos [de la Escalera, 2001]. Las propiedades geom´etricas se relacio-

33

3.4 Extracci´ on de caracter´ısticas

Figura 3.14: Caracter´ısticas morfol´ ogicas de una regi´ on.

nan con medidas de la regi´on de inter´es, mientras que los momentos permiten obtener propiedades de un objeto en t´erminos de su ´area, posici´on y orientaci´ on [Awcock and R., 1996], tales como la excentricidad, orientaci´ on y centro de masa. Las caracter´ısticas morfol´ogicas deben ser invariantes a traslaci´on, rotaci´on y escala. En la Figura 3.14 se muestran algunas caracter´ısticas u ´tiles para describir la forma de una regi´on. Para describir un momento se considera la imagen de la Figura 3.15, donde la parte izquierda representa un segmento de borde y la derecha muestra el segmento representado como una funci´on 1-D g(r) de una variable arbitraria r. Tratando la amplitud de g como una variable aleatoria v y formando un histograma de amplitud p(vi ), i = 1, 2, ..., k, siendo k el n´ umero de incrementos de amplitud discretos. Entonces el momento n-´esimo de v respecto de su media es [Gonz´alez and Woods, 1996]:

µn (v) =

k X i=1

donde,

(vi − m)n p(vi )

(3.1)

34

3 FUNDAMENTOS

Figura 3.15: Momentos.

m=

k X

vi p(vi )

(3.2)

i=1

La cantidad m es el valor medio de v y µ2 su varianza19 . Generalmente s´olo se requieren los primeros momentos para diferenciar formas claramente distintas. Otra alternativa consiste en normalizar g(r) para que el ´area bajo ella sea la unidad y tratarla como un histograma. En este caso, r es la variable aleatoria y los momentos son, L X µn (v) = (ri − m)n g(ri )

(3.3)

i=1

donde,

m=

L X

ri g(ri )

(3.4)

i=1

En esta notaci´on, L es el n´ umero de puntos en el borde y µn (r) est´a relacionado directamente con la forma de g(r). Por ejemplo, el segundo momento µ2 (r) mide la dispersi´on de los puntos de la curva con relaci´on al valor medio de r, y el tercer momento µ3 (r) mide su simetr´ıa con relaci´on a la media. En la tabla 3.1 se describen algunas caracter´ısticas u ´tiles para la descripci´on de la forma de la regi´on. El centro de masa en un tratamiento de sistemas de masas puntuales es 19

El sub´ındice 2 de µ, indica que se trata del segundo momento.

35

3.4 Extracci´ on de caracter´ısticas

´ DESCRIPCION

PROPIEDAD

´ Area Longitud de eje menor Longitud de eje mayor Caja circunscrita (Bounding Box ) Envoltura convexa (Convex Hull )

N´ umero de pixeles que contiene la imagen Longitud (en pixeles) del eje menor de la elipse que tiene los mismos segundos momentos que la regi´on Longitud (en pixeles) del eje mayor de la elipse que tiene los mismos segundos momentos que la regi´on Rect´angulo m´as peque˜ no que puede contener la regi´on Pol´ıgono ner

la

convexo regi´on.

En

m´as la

peque˜ no Figura

que 3.18,

puede

conte-

modificada

de

[Goodrich and Tamassia, 2003] se presenta un ejemplo. N´ umero de componentes conexas de la regi´on menos n´ umero

N´ umero de Euler

de huecos en dicha regi´on. En la Figura 3.17 se muestra un

Di´ametro equivalente

ejemplo. Di´ametro del c´ırculo con la misma ´area que la regi´on. p D = 4Area/π Proporci´on de pixeles en el convex hull que tambi´en estan

Solidez

en la regi´on. ´ ´ S = Area/ Area de Convex Hull Proporci´on de los pixeles en el bounding box que tambi´en

Rectangularidad (extent)

est´an en la regi´on. ´ ´ R = Area/ Area de Bounding Box Gr´afica que representa la distancia del centro de masa de la

Signatura (firma)

regi´on a los puntos de su borde. En la Figura 3.16, tomada

Per´ımetro

de Gonz´alez, De Fu y Lee [1987] se observa un ejemplo. Longitud (en pixeles) del contorno de una regi´on. Cuadratura del bounding box.

Elongaci´on o raz´on de aspecto Excentricidad Orientaci´on Centro de masa (centroide, centro de gravedad)

S = base Bounding Box/altura de Bounding Box Excentricidad de la elipse que tiene los mismos segundos momentos que la regi´on, es la relaci´on entre el foco de la elipse y su longitud de eje mayor. ´ Angulo (en grados) entre el eje X y el eje mayor de la elipse que tiene los mismos segundos momentos que la regi´on Es el punto geom´etrico donde la resultante de las fuerzas gravitatorias ejercidas por todos los cuerpos del sistema se anula. Se obtiene con P P x ¯ = i xi /A, y¯ = i yi /A donde,

A

es

el

´area

de

la

[Pajares and de la Cruz, 2002]. Tabla 3.1: Caracter´ısticas que permiten describir la forma de una regi´ on.

regi´on

36

3 FUNDAMENTOS

Figura 3.16: Dos curvas de contornos sencillos y sus correspondientes firmas de distancia-´ angulo. En (a) r(θ) es constante. En (b) r(θ) = A sec(θ).

Figura 3.17: Regiones con n´ umero de Euler -2 y 0, respectivamente.

el punto donde se supone concentrada toda la masa del sistema. El centroide, el centro de gravedad y el centro de masa pueden, bajo ciertas circunstancias, coincidir entre s´ı. En estos casos se suele utilizar los t´erminos de manera intercambiable, aunque designan conceptos diferentes. El centroide es un concepto puramente geom´etrico mientras que los otros dos t´erminos (centro de gravedad y centro de masa) se relacionan con las propiedades f´ısicas de un cuerpo. Para que el centroide coincida con el centro de masa, el objeto debe tener densidad uniforme, o la distribuci´on de materia a trav´es del objeto debe tener ciertas propiedades, tales como simetr´ıa. Para que un centroide coincida con el centro de gravedad, el centroide debe coincidir con el centro de masa y el objeto debe estar bajo la influencia de un campo gravitatorio uniforme [Wikipedia Foundation, 2006].

37

3.5 Redes Neuronales

Figura 3.18: Convex Hull.

3.5.

Redes Neuronales

A continuaci´on se definir´an algunos conceptos utilizados a lo largo de esta secci´on. Definici´ on 9 (Dato) Es un vector formado por valores que representan caracter´ısticas o atributos de un objeto cualquiera. Definici´ on 10 (Clase) Conjunto de datos que poseen atributos o caracter´ısticas similares. Definici´ on 11 (Patr´ on) Descripci´ on estructural o cuantitativa de un objeto o de alguna otra entidad de inter´es en una imagen. Definici´ on 12 (Conjunto de entrenamiento –Patr´ on de entrenamiento–) Patrones usados por un clasificador (de pertenencia conocida o no a una clase) para estimar par´ ametros de aprendizaje. Definici´ on 13 (Conjunto de validaci´ on –Patr´ on de prueba–) Patrones usados por un clasificador (de pertenencia conocida a una clase) para probar el entrenamiento realizado por un clasificador. Definici´ on 14 (Entrenamiento –Aprendizaje–) Proceso de usar un conjunto de entrenamiento para obtener funciones de decisi´ on.

38

3 FUNDAMENTOS

Figura 3.19: De la neurona biol´ ogica a la neurona artificial.

´ Definici´ on 15 (Epoca) Un paso completo sobre todos los patrones en el entrenamiento. [Alpaydm, 2004].

3.5.1.

Introducci´ on

Una red neuronal artificial proporciona un m´etodo robusto para aproximar funciones que utilicen valores reales, discretos y funciones valuadas en un vector. El aprendizaje con redes neuronales artificiales es aplicable a problemas tales como procesamiento de im´agenes y sonido, control y optimizaci´on, predicci´on, entre otros [Acosta et al., ]. El modelo de una neurona artificial es una imitaci´on del proceso fisiol´ogico de una neurona biol´ogica. En la figura 3.19 [Acosta et al., ] se muestra un esquema comparativo de las neuronas biol´ogicas y las artificiales. De la observaci´on detallada de este proceso biol´ogico se observan los siguientes an´alogos con el sistema artificial: 1. Las entradas Xi . 2. Los pesos Wi . 3. θ, la funci´on de umbral que la neurona debe sobrepasar para activarse. Una neurona artificial es un elemento de c´alculo no lineal y elemental que se organiza como red [Gonz´alez and Woods, 1996]. Las se˜ nales de entrada a una neurona artificial X1 , X2 , ..., Xn son variables continuas en lugar de pulsos discretos, como se presenta en una neurona biol´ogica. Cada se˜ nal de entrada pasa a trav´es de una ganancia o peso, llamado peso sin´ aptico (fortaleza) de la conexi´on cuya funci´on es an´aloga a la de la funci´on sin´aptica de la

39

3.5 Redes Neuronales

Figura 3.20: Proceso b´ asico de una red neuronal.

neurona biol´ogica. Los pesos pueden ser positivos –excitatorios–, o negativos –inhibitorios–, el nodo sumatorio acumula todas las se˜ nales de entradas multiplicadas por los pesos y las pasa a la salida a trav´es de una funci´ on de transferencia –funci´ on umbral–. La entrada neta a cada unidad puede escribirse de la siguiente manera.

netai =

n X

− →− → Wi Xi = X Y

(3.1)

i=1

La secuencia de este proceso se muestra en la figura 3.20 [Acosta et al., ]. Una vez que se ha calculado la activaci´on del nodo, el valor de salida equivale a:

xi = fi (netai )

(3.2)

Donde fi representa la funci´on de activaci´ on para esa unidad, que corresponde a la funci´on escogida para transformar la entrada netai en el valor de salida xi , y que depende de las caracter´ısticas espec´ıficas de la red. Dentro de una red neuronal, las neuronas se encuentran agrupadas por capas, donde una capa es una colecci´on de neuronas que de acuerdo a su ubicaci´on recibe los siguientes nombres: Capa de entrada: Recibe las se˜ nales de la entrada de la red. Capas ocultas: Son capas que no tienen contacto con el medio exterior, sus elementos pueden tener diferentes conexiones y son ´estas las que determinan las diferentes

40

3 FUNDAMENTOS

Figura 3.21: Esquema b´ asico de una neurona artificial que contiene una s´ ola entrada.

topolog´ıas de la red. Capa de salida: Recibe la informaci´on de la capa oculta y transmite la respuesta al medio externo. En la figura 3.21 se muestra una neurona de una entrada [Acosta et al., ]. De esta manera, la topolog´ıa de una red se define por su organizaci´on o arquitectura interna, constitu´ıda por capas. Cada capa puede tener diferente n´ umero de neuronas, e incluso distinta funci´on de transferencia. Una funci´ on de transferencia es una funci´on lineal o no lineal de la salida neta de la red que determina la salida total de la red neuronal. En la Figura 3.22, tomada de [Acosta et al., ] se muestran las funciones de transferencia utilizadas frecuentemente con redes neuronales.

3.5.2.

Tipos de Redes Neuronales

En general las redes neuronales se pueden clasificar de diversas maneras, seg´ un su topolog´ıa, forma de aprendizaje (supervisado o no supervisado), tipos de funciones de activaci´on, valores de entrada (binarios o continuos). En la figura 3.23 se muestra un esquema de esta clasificaci´on [Acosta et al., ]. Sin embargo, de acuerdo al trabajo de [Flores, 2001] resulta v´alido considerar que la red ART2 tambi´en puede recibir entradas continuas. Las Redes neuronales multicapa alimentadas hacia adelante se utilizan con frecuencia para los problemas de reconocimiento de patrones multiclase, con independencia de que las clases sean o no separables, y utilizando arquitecturas que constan de niveles de

3.5 Redes Neuronales

Figura 3.22: Funciones de transferencia de uso com´ un.

Figura 3.23: Clasificaci´ on de las redes neuronales.

41

42

3 FUNDAMENTOS

perceptrones20 . En la Figura 3.24 tomada de [Gonz´alez and Woods, 1996], se muestra la arquitectura de este modelo de red neuronal. La imagen ampliada muestra la estructura b´asica de cada neurona de la red. El desplazamiento θ se trata como si fuese otro peso. El n´ umero de neuronas de la primera capa A, es NA , genaralmente NA = n, donde n es la dimensi´on de los patrones vectoriales que se dan como entrada. El n´ umero de neuronas en la capa de salida Q se representa por NQ y es igual a M , es decir el n´ umero de clases que la red es capaz de reconocer. La red reconoce a un patr´on vectorial x como perteneciente a una clase wm si la m-´esima salida de la red est´a activada, mientras que las restantes salidas estan desactivadas. Para desarrollar la regla de entrenamiento por retropropagaci´on es preciso que se pueda calcular la diferencial de las funciones por todos los caminos de la red, as´ı que la siguiente funci´on sigmoide de activaci´on es diferenciable:

hj (Ij ) =

1 1 + exp[−(Ij + θj )/θ0 ]

(3.3)

donde Ij , j = 1, 2, ..., Nj representan la entrada del elemento de activaci´ on de cada nodo de la capa J de la red, θj es un desplazamiento, y θ0 controla la forma de la funci´on sigmoide. Esta arquitectura consta de numerosas capas de neuronas esructuralmente id´enticas y dispuestas de modo que la salida de cada neurona de una determinada capa alimenta las entradas de todas las neuronas de la siguiente capa. La entrada de un nodo de cualquier capa es la suma ponderada de las salidas de la capa anterior. Suponiendo que la capa K es la que precede a la capa J, la entrada del elemento de activaci´ on de cada nodo de la capa J, representada por Ij es: Ij =

Nk X

wjk Ok

(3.4)

k=1

para j = 1, 2, ..., Nj , donde Nj es el n´ umero de nodos de la capa J, NK es el n´ umero de nodos de la capa K y wjk son los pesos que modifican las salidas Ok de los nodos de la 20

un perceptr´ on es una m´ aquina de aprendizaje que al entrenarse utilizando conjuntos de entrenamiento linealmente separables, ´estos convergen a una soluci´ on en un n´ umero finito de iteraciones. Sus soluciones toman la forma de coeficientes de hiperplanos capaces de separar correctamente las clases representadas por los patrones del conjunto de entrenamiento [Gonz´ alez and Woods, 1996].

3.5 Redes Neuronales

Figura 3.24: Modelo de red neuronal multicapa alineada hacia adelante (progresiva).

43

44

3 FUNDAMENTOS

capa K antes de alimentar los nodos de la capa J. Las salidas de la capa K son:

Ok = hk (Ik )

(3.5)

para k = 1, 2, ..., Nk . En la ecuaci´on 3.4 se tiene que Ij , para j = 1, 2, ..., Nj representa la entrada del elemento de activaci´on del j-´esimo nodo de la capa J, con lo que I1 representa la entrada del elemento de activaci´on del primer (el m´as alto) nodo de la capa J, I2 representa la entrada del elemento de activaci´on del segundo nodo de la capa J, y as´ı sucesivamente. Cada nodo de la capa J tiene Nk entradas y cada una se puede ponderar de forma distinta, las Nk entradas del primer nodo de la capa J estan ponderadas por los coeficientes w1k , k = 1, 2, ..., Nk , y as´ı sucesivamente. Se requieren en total NJ xNk coeficientes para especificar la ponderaci´on de los pesos de las salidas de la capa K cuando alimentan a la capa J. Tambi´en se requieren NJ coeficientes de desplazamiento θj para especificar completamente los nodos de la capa J. Cuando se sustituye la 3.4 en 3.3 se obtiene la funci´on de activaci´ on:

hj (Ij ) =

1 PNk 1 + exp[−( k=1 wjk Ok + θj )]/θ0

(3.6)

El principal problema del entrenamiento de una red multicapa consiste en ajustar los pesos de las capas ocultas, ya que la salida deseada es desconodida.

3.5.3.

Entrenamiento por Retropropagaci´ on

En el entrenamiento por retropropagaci´ on despu´es de haber aplicado un patr´on a la red como est´ımulo, ´este se propaga desde la primera capa a trav´es de las capas superiores de la red, hasta generar una salida. La se˜ nal de salida se compara con la salida deseada y se calcula una se˜ nal de error para cada una de las salidas. Las salidas de error se propagan hacia atr´as, partiendo de la capa de salida, hacia todas las neuronas de la capa oculta que contribuyen directamente a la salida, pero las neuronas de la capa oculta s´olo reciben una fracci´on de la se˜ nal total del error, bas´andose aproximadamente en la contribuci´on relativa que haya aportado cada neurona a la salida

45

3.5 Redes Neuronales

original. Este proceso se repite capa por capa, hasta que todas las neuronas de la red hayan recibido una se˜ nal de error que describa su contribuci´ on relativa al error total. Bas´andose en la se˜ nal de error percibida, se actualizan los pesos de conexi´on de cada neurona, para hacer que la red converja hacia un estado que permita clasificar correctamente todos los patrones de entrenamiento. De esta manera, a medida que se entrena la red, las neuronas de las capas intermedias se organizan a s´ı mismas de modo que aprenden a reconocer distintas caracter´ısticas del espacio total de entrada. De acuerdo a la Figura 3.24, en la primera fase del m´etodo de retropropagaci´on se introduce un vector de entrenamiento y se permite la propagaci´on del mismo por la red, para calcular la salida Oj de cada nodo. Las salidas Oq de los nodos de la capa de salida se comparan con las salidas deseadas rq con lo que se obtienen los t´erminos de error δq . La segunda fase consiste en volver hacia atr´as por la red, pasando a cada nodo la se˜ nal de error apropiada y realizando las correspondientes modificaciones de los pesos. Este proceso se aplica tambi´en a los pesos correctores θj . M´as adelante se describe con detalle, el entrenamiento por retropropagaci´on [Gonz´alez and Woods, 1996]. Situados en la capa de salida, el error medio cuadr´ atico entre las respuestas deseadas rq y las reales Oq de los nodos de la capa de salida Q, es: NQ

EQ =

1X (rq − Qq )2 2

(3.7)

q=1

donde,NQ es el n´ umero de nodos de la capa de salida Q, y el 1/2 se usa por conveniencia en la notaci´on para el uso posterior de derivadas. Para permitir el ajuste de los pesos de cada una de las capas de modo que minimice el valor de una funci´on de error cuya forma sea la mostrada en la ecuaci´on 3.7, se comienza ajustando los pesos de forma proporcional a la derivada parcial del error con respecto a los pesos. ∆wqp = −α

∂EQ ∂wqp

(3.8)

donde la capa P precede a la capa Q y α es un factor de correci´on positivo. El error EQ es una funci´on de las salidas Oq , que a su vez dependen de las entradas Iq

46

3 FUNDAMENTOS

de acuerdo a la imagen ampliada que se encuentra en la parte superior de la Figura 3.24. Utilizando la regla de la cadena21 se eval´ ua la derivada parcial de EQ : ∂EQ ∂EQ ∂Iq = ∂wqp ∂Iq ∂wqp De la ecuaci´on 3.4:

Np ∂Iq ∂ X = wqp Op = Op ∂wqp ∂wpq

(3.9)

(3.10)

p=1

Sustituyendo las ecuaciones 3.9 y 3.10 en la ecuaci´on 3.8, se obtiene

∆wqp = −α

∂EQ Op ∆wqp = −αδq Op ∂Iq

(3.11)

donde, δq = −

∂EQ ∂Iq

(3.12)

Para poder calcular ∂EQ /∂Iq se utiliza la regla de la cadena y se puede expresar como la variaci´on de EQ con respecto a Oq , multiplicada por la variaci´ on de Oq con respecto a Iq . Es decir, δq = −

∂EQ ∂Oq ∂EQ =− ∂Iq ∂Oq ∂Iq

(3.13)

De la ecuaci´on 3.7: ∂EQ = −(rq − Oq ) ∂Oq

(3.14)

∂Oq ∂ = hq (Iq ) = h0q (Iq ) ∂Iq ∂Iq

(3.15)

y de la ecuaci´on 3.5:

Sustituyendo las ecuaciones 3.14 y 3.15 en 3.13, se obtiene ∂q = (rq − Oq )h0q (Iq )

(3.16)

que es proporcional a la magnitud del error (rq − Oq ). Sustituyendo las ecuaciones 3.12, dy La regla de la cadena dice que Si y = f (u), u = g(x), y las derivadas du y du existen ambas, entonces dx dy dy du la funci´ on compuesta definida por y = f (g(x)) tiene una derivada dada por dx = du [Swokowski, 1989]. dx 21

47

3.5 Redes Neuronales

3.14 en la ecuaci´on 3.11 se obtiene: ∆wqp = α(rq − Oq )h0q (Iq )Op = αδq Op

(3.17)

Cuando se introduce cualquier patr´on de entrenamiento en la entrada de la red es posible saber cu´al es la salida de cada nodo rq . As´ı se puede saber c´omo se deben ajustar los pesos que modifican los enlaces entre la u ´ltima y pen´ ultima capa de la red. De esta manera concluye la primera fase del m´etodo de retropropagaci´on. Para analizar la segunda fase se comienza a analizar lo que sucede en la capa P . Al realizar el procedimiento antes visto, se tiene: ∆wpj = α(rp − Op )h0p (Ip )Oj = αδp Oj

(3.18)

δp = (rp − Op )h0p (Ip )

(3.19)

donde el error es:

En las ecuaciones anteriores 3.18 y 3.19 s´olo se desconoce rp , el cual carece de importancia en una capa interna, dado que no se sabe cu´al ser´ıa la respuesta de un nodo interno respecto a la pertenencia del patr´on a una clase. S´olo se puede especificar la respuesta en las salidas de la red, donde se realiza la clasificaci´on definitiva del patr´on. Por lo tanto, se debe encontrar una forma de definir δp en t´erminos de cantidades conocidas o que se puedan observar en la red. Considerando la ecuaci´on 3.13, se observa que es posible escribir el t´ermino correspondiente al error de la capa P como:

δp = −

∂EP ∂Op ∂EP =− ∂Ip ∂Op ∂Ip

De acuerdo a la ecuaci´on 3.15 el t´ermino

∂Op ∂Ip

(3.20)

es:

∂Op ∂ = hp (Ip ) = h0p (Ip ) ∂Ip ∂hp

(3.21)

48

3 FUNDAMENTOS

que resulta conocido cuando se ha especificado hp , ya que es posible observar Ip . El t´ermino rq proviene de la derivada

∂EP ∂Op

, as´ı que se debe encontrar una expresi´on que no contenga

rp . Utilizando la regla de la cadena, se puede escribir la derivada como: NQ NQ NQ NQ NP X X X X ∂EP ∂EP ∂Iq ∂EP ∂ X ∂EP =− = (− ) Wqp OP = (− )wqp = δq wqp ∂Op ∂Iq ∂Op ∂Iq ∂Op ∂Iq q=1

q=1

p=1

q=1

q=1

(3.22) donde, la u ´ltima expresi´on se obtiene de 3.12. Al sustituir las ecuaciones 3.21 y 3.22 en la ecuaci´on 3.20 se obtiene la expresi´on requerida δp :

δp =

h0p (Ip )

NQ X

δq wqp

(3.23)

q=1

Con esta expresi´on, se puede calcular el factor δp , ya que todos sus t´erminos se conocen. Las ecuaciones 3.18 y 3.23 establecen la regla de entrenamiento para la capa P . Despu´es de calcular el t´ermino del error y los pesos de la capa P , se pueden usar estos resultados para calcular el error y los pesos de la capa inmediatamente anterior a la capa P , es decir se propaga hacia atr´as el error de la red a partir del error de la capa de salida. De esta forma al generalizar el procedimiento anterior se tiene que, para cualquier par de capas K y J, siendo la capa K la que precede a la capa J, se deben calcular los pesos wi,j que modifican los pesos entre ambas capas, utilizando ∆wi,j = αδj Ok

(3.24)

Si la capa J es la capa de salida, δj es: δj = (rj − Oj )h0j (Ij )

(3.25)

Si la capa J es una capa interna y P es la siguiente capa (por la derecha), entonces δj esta dado por δj =

h0j (Ij )

NP X p=1

δp wjp

(3.26)

49

3.5 Redes Neuronales

para j = 1, 2, ..., Nj . Al utilizar la funci´on de activaci´on de la ecuaci´on 3.6 con θ0 = 1, se obtiene h0j (Ij ) = Oj (1 − Oj )

(3.27)

en este caso las ecuaciones 3.25 y 3.26 se expresan de la siguiente forma para la capa de salida: δj = (rj − Oj )Oj (1 − Oj )

(3.28)

y para las capas internas: δj = Oj (1 − Oj )

NP X

δP wjp

(3.29)

p=1

En ambas ecuaciones j = 1, 2, ..., Nj . Un m´etodo para minimizar la funci´on de error medio es el Gradiente Escalado Conjugado que puede entrenar cualquier red neuronal cuyos pesos, entradas y funciones de transferencia posean funciones que puedan ser derivadas. La Retropropagaci´on es usada para calcular derivadas de desempe˜ no con respecto a los pesos y bias22 de las funciones. El Gradiente Escalado Conjugado se basa en direcciones conjugadas y no realiza b´ usquedas en l´ınea en cada iteraci´on [MathWorks, 2000], el procedimiento detallado de ´este m´etodo se puede encontrar en [Mitchell, 1997]. Las condiciones de paro para este tipo de entrenamiento son: El n´ umero m´aximo de ´epocas (repeticiones) sea alcanzado. La m´axima cantidad de tiempo ha sido excedida. El desempe˜ no ha sido minimizado a la meta. El gradiente de desempe˜ no cae por debajo del m´ınimo.. El desempe˜ no de la validaci´ on ha superado el n´ umero m´aximo de fallas de validaci´ on desde la u ´ltima vez que ocurri´o el u ´ltimo fallo (Cuando se usa validaci´ on). 22 Es un sesgo del error, dado por δbθ (d) = E[d(X) − θ], donde d(X) es un estimador de θ, y θ es un par´ ametro a evaluar [Alpaydm, 2004]. Seg´ un [Kohavi, 1995] el bias de un m´etodo para estimar un par´ ametro θ est´ a definido como el valor esperado menos el valor estimado.

50

3 FUNDAMENTOS

Es importante recalcar que no existe una t´ecnica para determinar el n´ umero de capas ocultas, ni el n´ umero de neuronas que debe contener cada una de ellas para un problema espec´ıfico, esta elecci´on es determinada por la experiencia del dise˜ nador quien debe cumplir con las limitaciones computacionales. Adem´as durante el proceso de entrenamiento, la red Retropropagaci´on tiende a desarrollar relaciones internas entre neuronas con el fin de organizar los datos de entrenamiento en clases [Gonz´alez and Woods, 1996].

3.6.

T´ ecnicas de Validaci´ on

Existen diversos m´etodos para medir la precisi´on en los resultados obtenidos por un clasificador. Uno de estos es la t´ecnica de Ten Fold Cross Validation –TFCV–. Esta t´ecnica se realiza siguiendo 4 etapas: 1. Dividir el conjunto de datos en 10 partes iguales. 2. Tomar 9 partes para entrenar y una para probar. 3. Rotar los datos de tal manera que las partes elegidas para entrenar y para probar no sean siempre las mismas. 4. Calcular la taza de error global, que es igual al promedio de las tazas de error obtenidas en cada partici´on. Una vez conclu´ıdas las 4 etapas de TFCV, se tiene un valor muy aproximado al ´ındice de reconocimiento real de la t´ecnica usada para la clasificaci´on [Moore, 2001]. Por otra parte, los estudios realizados por [Kohavi, 1995] indican que la t´ecnica Tenfold stratified cross validation es buena para la selecci´on de un modelo clasificador. Si se desea hacer m´as eficiente el entrenamiento de una red neuronal es posible aplicar algunas t´ecnicas de pre y post procesamiento a los datos de entrada de la red. Algunas t´ecnicas u ´tiles son: La normalizaci´on que se realiza al dividir todos los datos de entrada entre el valor del dato mayor.

3.6 T´ecnicas de Validaci´ on

51

Normalizar la media y la desviaci´on estandar de los datos de entrenamiento, es decir hacer que estos tengan una media=0 y desviaci´on est´andar=1. El uso de An´alisis de componentes principales.

Cap´ıtulo 4

Estado del Arte Como se ha comentado en cap´ıtulos anteriores, el objetivo principal de este trabajo de tesis es clasificar a leucocitos en segmentados y no segmentados utilizando como criterio principal la forma de su n´ ucleo, as´ı que en b´ usqueda de un m´etodo de segmentaci´ on que permita separar al n´ ucleo lo mejor posible para lograr una buena extracci´on de caracter´ısticas, se han encontrado algunos trabajos relacionados con esta problem´atica. A continuaci´on se comentan algunos de ellos.

4.1.

Segmentaci´ on de una imagen celular para diagn´ ostico patol´ ogico

Este trabajo fue desarrollado por Dorin Comaniciu y Peter Meer [Comaniciu, 2001], en el que se presenta un algoritmo de segmentaci´ on celular que detecta clusters en el espacio de color Luv1 y delinea sus bordes al utilizar el procedimiento de movimiento del promedio del gradiente ascendente2 . La segmentaci´ on se deriva al mapear los vectores de color de la imagen y ubicarlas en un espacio espec´ıfico. En la Figura 4.1 se muestra un bosquejo general de la problem´atica abordada en este trabajo. Las muestras utilizadas son leucocitos digitalizados, cuyos colores son caracterizados 1

Modelo de color propuesto por la CIE que se deriva del espacio XYZ. Para m´ as informaci´ on sobre este m´etodo consultar: D. Comaniciu, P. Meer, Distribution free descomposition of multivariate data, Pattern analysis and applications, Vol.2 No. 1, pp. 22-30, 1999. 2

54

4 ESTADO DEL ARTE

Figura 4.1: Proceso de segmentaci´ on de im´ agenes celulares para diagn´ ostico patol´ ogico.

Figura 4.2: Imagen de un leucocito t´ıpico. La imagen segmentada se presenta en pseudocolor.

por pocos elementos, clusters no gaussianos cuyas figuras son aisladas a partir de la imagen que esta siendo procesada. M´etodos no param´etricos tales como el an´alisis basado en la moda, son particularmente convenientes para la segmentaci´ on de este tipo de datos debido a que no definen las formas de los clusters. Algunos resultados de la segmentaci´ on producida en este trabajo se muestran en las Figuras 4.2, 4.3 y 4.4, tomadas de [Comaniciu, 2001]. En el trabajo de Dorin Comaniciu y Peter Meer, el uso de m´etodos probabil´ısticos para realizar la segmentaci´on se tom´o como elemento importante en el proceso de elecci´on de una t´ecnica que permitiera conseguir buenos resultados en la segmentaci´ on efectuada en este trabajo de tesis. Adem´as de la posibilidad de trabajar con un espacio de color distinto al RGB, que permitiera anular los efectos indeseados causados por los cambios de iluminaci´on durante la digitalizaci´on de las muestras.

4.1 Segmentaci´ on de una imagen celular para diagn´ ostico patol´ ogico

Figura 4.3: Calidad de la segmentaci´ on. a). Im´agenes originales, arriba una c´elula de linfoma de Mantle y las dos de abajo son espec´ımenes de leucemia linfoc´ıtica cr´onica. b). Contornos. c). C´elulas segmentadas.

Figura 4.4: Segmentaci´ on de n´ ucleos de varias categor´ıas de c´ elulas. El borde del n´ ucleo est´a marcado con blanco.

55

56

4 ESTADO DEL ARTE

Figura 4.5: Esquema de segmentaci´ on. a). Generaci´on de subim´agenes conteniendo c´elulas solas. b). Segmentaci´on de n´ ucleos y citoplasmas.

4.2.

Automatizaci´ on del Recuento Diferencial de la sangre

Neelam Sinha y A. G. Ramakrishnan [Sinha, 2002] utilizan una t´ecnica para la automatizaci´on del Recuento Diferencial de la sangre. La t´ecnica recibe como entrada im´agenes en color de gl´obulos blancos obtenidos de sangre perif´erica y determina el n´ umero de c´elulas pertenecientes a cada clase. Este proceso incluye la segmentaci´ on, extracci´on de caracter´ısticas y clasificaci´on. La Figura 4.5 se muestra el esquema de segmentaci´ on propuesto [Sinha, 2002]. La segmentaci´on se realiza en dos pasos sobre el equivalente HSV de la imagen, utilizando una agrupaci´on K-Means seguida por el algoritmo EM3 . Las caracter´ısticas extra´ıdas del citoplasma y n´ ucleo segmentado, son elegidas por su aspecto visual, color y textura. Se probaron varios clasificadores con diferentes combinaciones de caracter´ısticas. Para entrenar a los clasificadores, se utiliz´o una base de datos de 50 ejemplares, 10 de cada clase. Los datos de prueba, disjuntos del conjunto de entrenamiento, consisten de 34 elementos. Se obtiene una clasificaci´on del 97 % al utilizar redes neuronales. En la Figura 4.6, tomada de [Sinha, 2002] se muestra la secuencia de procesamiento de un ejemplar. Neelam Sinha y A. G. Ramakrishnan al utilizar m´etodos estad´ısticos para la segmentaci´on y hacer uso del espacio de color HSV proporcionan m´as evidencias acerca de que 3

–expectation-maximization –, este algoritmo primero calcula las probabilidades bayesianas posteriores de los datos y obtiene los estimadores de par´ ametros actuales (paso E), y luego actualiza dichos par´ ametros utilizando la media generalizada con teoremas erg´ odicos (paso M). Estos pasos se realizan alternadamente hasta converger [Hen and Hwang, 2002].

4.3 Mejorado autom´ atico de detecci´ on de piel en im´ agenes de color

57

Figura 4.6: Secuencia de procesamiento. a. Imagen original. b. Imagen saturada. c. Salida K-medias. d. Salida final.

la segmentaci´on de c´elulas sangu´ıneas es buena cuando se hace un estudio probabil´ıstico de la distribuci´on del color sobre un espacio de color que maneja de forma separada la informaci´on de la croma y la de iluminaci´on. Adicionalmente se comenta que el conjunto de entrenamiento se forma con igual n´ umero de elementos de cada clase, lo que tambi´en se consider´o en este trabajo de tesis al elegir la cantidad de elementos que constituyen el conjunto de entrenamiento.

4.3.

Mejorado autom´ atico de detecci´ on de piel en im´ agenes de color

En este trabajo Filipe Tomaz, Tiago Candeias y Hamid Shahbazkia [Tomaz et al., 2003] muestran una t´ecnica de detecci´on autom´atica de piel. Las im´agenes obtenidas se escalan y se utiliza el espacio de color TSL debido a que los efectos ocasionados por el brillo y los cambios de iluminaci´on se reducen, de ´esta manera la distribuci´on de color de la piel se puede representar con un modelo Gaussiano. Tambi´en se hace uso de un filtro inicial obtenido experimentalmente para eliminar pixeles que por sus caracter´ısticas en el modelo RGB, no pueden pertenecer a la piel. Como medida de similitud, se utiliza la Distancia de Mahalanobis para obtener un um-

58

4 ESTADO DEL ARTE

Figura 4.7: Esquema de la detecci´ on autom´ atica de piel en im´ agenes de color.

Figura 4.8: Secuencia de procesamiento. Imagen original y resultados obtenidos despu´es de aplicar la segmentaci´on.

bral que permite segmentar a los elementos piel, de los no piel. De esta manera, analizando y agrupando los elementos resultantes de este discriminador, se obtienen buenos resultados y se eliminan las ´areas peque˜ nas que no son piel y que estan presentes en una escena com´ unmente compleja. En el estudio se incluyen personas asi´aticas, cauc´asicas, africanas o descendientes de ´estas. El m´etodo no es restricto a orientaci´ on, tama˜ no o agrupaci´on de los elementos de inter´es. En la Figura 4.7 se muestra el esquema b´asico de segmentaci´ on propuesto en este trabajo, mientras que los resultados al aplicar dicha t´ecnica se muestran en la Figura 4.8, tomada de [Tomaz et al., 2003] en la cual se observa un fondo complejo con diferentes colores de rostros de piel. Los pasos utilizados en la segmentaci´ on efectuada por Filipe Tomaz, Tiago Candeias y Hamid Shahbazkia constituyeron una buena alternativa para utilizar esta t´ecnica en el presente trabajo de tesis. Adem´as de confirmar, la utilidad de los m´etodos estad´ısticos para el an´alisis del color en im´agenes digitales.

4.4.

Identificaci´ on autom´ atica de objetos a´ ereos usando Redes Neuronales

Mahmoud A. Abdallah, Tayib I.Samu y William A. Grissom [Abdallah et al., 1995] en este trabajo describen el desarrollo de un sistema autom´atico de identificaci´ on de objetos

4.4 Identificaci´ on autom´ atica de objetos a´ereos usando Redes Neuronales

59

Figura 4.9: Componentes del sistema de clasificaci´ on de objetos a´ ereos. Adquisici´on de caracter´ısticas y entrenamiento de la red neuronal.

Figura 4.10: Aviones utilizados en el estudio.

a´ereos. En la Figura 4.9 se se˜ nalan las fases que componen a este sistema de clasificaci´on. Las caracter´ısticas extra´ıdas son representaciones gr´aficas de las siluetas de los 5 tipos de objetos a clasificar, que son obtenidas con t´ecnicas de procesamiento de im´agenes y algunas propiedades de la transformada de Fouriers (FFT), las 5 formas de objetos que se identifican se muestran en la Figura 4.10, las im´agenes fueron tomadas de [Abdallah et al., 1995]. La FFT elimina variaciones en las caracter´ısticas extra´ıdas tales como rotaci´on o escala. El entrenamiento de la red utilizada para clasificar utiliza el paradigma de Cuantizaci´ on del Vector de Aprendizaje. La clasificaci´on de los objetos es buena no importando su rotaci´on, escala o traslaci´on, obteniendo un ´ındice de reconocimiento del 95 %. El m´etodo utilizado por Mahmoud A. Abdallah, Tayib I.Samu y William A. Grissom para extraer caracter´ısticas de la forma de objetos distintos, se consider´o en este trabajo de tesis puesto que los objetos que se deben reconocer se encuentran en diferentes tama˜ nos y posiciones. Con estas consideraciones, se extrajeron las caracter´ısticas que mejor describen a la formas nucleares de los leucocitos, que son objeto de estudio en este trabajo de investigaci´on. Por otra parte tambi´en se comenta en [Abdallah et al., 1995], que el uso de las redes neuronales resulta u ´til cuando se trabaja con caracter´ısticas similares a las extra´ıdas en el trabajo antes descrito.

60

4 ESTADO DEL ARTE

Figura 4.11: Sistema de clasificaci´ on de c´ elulas blancas sangu´ıneas.

4.5.

An´ alisis de imagen y aprendizaje supervisado en la diferenciaci´ on autom´ atica de c´ elulas blancas de im´ agenes microsc´ opicas

En este trabajo R. J. Katz [Katz, 2000] desarrolla un m´etodo de m´ ultiples pasos (segmentaci´on, extracci´on de caracter´ısticas, uso de un clasificador) para diferenciar autom´aticamente im´agenes de c´elulas blancas. En la Figura 4.11 se muestran los pasos que componen el desarrollo de este sistema. Primero se obtiene una imagen que contiene un n´ ucleo celular que destaca en la escena, la Figura 4.12 tomada de [Katz, 2000] muestra algunos ejemplares utilizados en su estudio. La segmentaci´on de la imagen en regiones de c´elula y no c´elula utiliza la detecci´on de bordes Canny (ver Figura 4.13 [Katz, 2000]) seguida por un algoritmo de identificaci´ on de un c´ırculo, en la Figura 4.14 se encuentran algunos ejemplos con resultados que muestran los c´ırculos obtenidos por Katz. El procedimiento para la detecci´on de c´ırculos no es completamente autom´atico debido a que con el algoritmo no se obtienen buenos resultados y la selecci´on de la c´elula se realiza manualmente.

4.5 An´ alisis de imagen y aprendizaje supervisado en la diferenciaci´ on autom´ atica de c´elulas blancas de im´ agenes microsc´ opicas

61

Figura 4.12: Ejemplos de im´ agenes completas utilizadas en la investigaci´ on. De izquierda a derecha: bas´ofilo, eosin´ofilo, linfocito, neutr´ofilos.

Figura 4.13: Eosin´ ofilo. Resultados de la detecci´on de bordes Canny.

La extracci´on de las caracter´ısticas considera criterios como el color de la c´elula, tama˜ no e informaci´on morfol´ogica nuclear. Con estos criterios se obtienen 25 caracter´ısticas correspondientes a 206 im´agenes de diferentes tipos, considerando diferente cantidad de cada clase de c´elula. Finalmente se eval´ ua a un conjunto de clasificadores4 con la herramienta WEKA5 utilizando como referencia al clasificador ZeroR para compararlo con otros clasificadores. La mejor clasificaci´on se obtiene con una red neuronal entrenada con el algoritmo de retropropagaci´on alcanzando un ´ındice de error del 1.95 %. El desempe˜ no de los clasificadores generalmente es mejor en las clases que contienen mayor n´ umero de instancias. El estudio realizado por Katz concluye que la red neuronal de retropropagaci´on resulta ser la mejor elecci´on como m´etodo para clasificar c´elulas sangu´ıneas, y esto fue lo que confirm´o el uso de redes neuronales en ´esta tesis, adem´as se descart´o la posibilidad de formar un conjunto de entrenamiento con diferente n´ umero de instancias para cada clase, pues como lo dice Katz en su estudio, ´esto provoca un mayor ´ındice de reconocimiento sobre la clase predominante. 4

OneR, ID3, C4.5, J4.8, IBk k vecinos m´ as cercanos, Bayes simple y redes neuronales [Katz, 2000]. Ambiente para an´ alisis de conocimiento que trabaja en plataforma Java y permite entrenar a un grupo de clasificadores con un conjunto de datos comunes introducidos en un archivo [Katz, 2000]. 5

62

4 ESTADO DEL ARTE

Figura 4.14: Ejemplos de c´ırculos ajustados manualmente. Resultados del algoritmo de detecci´on de c´ırculos.

4.6.

Localizaci´ on y rastreo de rostros humanos con Redes Neuronales

H. Martin Hunke [Hunke, 1994] propone un localizador de rostros conexionista que utiliza el algoritmo de entrenamiento de retropropagaci´on capaz de manipular la orientaci´ on de la c´amara y el tama˜ no de la imagen para almacenar el rostro de alguna persona localizada cada vez que aparece ´esta en una secuencia de im´agenes. El sistema opera en tiempo real y se puede adaptar r´apidamente a diferentes condiciones de iluminaci´on, diferentes c´amaras y rostros haci´endolo robusto respecto a variaciones ambientales. En la Figura 4.15 se muestra la organizaci´on del sistema [Hunke, 1994]. Como se puede observar se recibe como entrada una imagen, de la cual se obtienen caracter´ısticas de color y movimiento que por un lado se combinan para darse como entrada a una red neuronal, y por otro se toman como un objeto que se da como entrada a una c´amara virtual que contin´ ua con el proceso de rastreo. Los resultados del sistema se observan en la Figura 4.16 [Hunke, 1994]. La t´ecnica de segmentaci´on utilizada consiste en hacer un mapeo del espacio RGB al

4.6 Localizaci´ on y rastreo de rostros humanos con Redes Neuronales

63

Figura 4.15: Estructura del sistema de localizaci´ on y rastreo de rostros humanos.

espacio RG considerando que el color caracter´ıstico de la piel contiene escasa o nula informaci´on de B. En la Figura 4.17 tomada de [Hunke, 1994], se describe el procedimiento. El ´ındice de reconocimiento obtenido por la red es de 95.2 % cuando se entrena con una combinaci´on de caracter´ısticas de color y de movimiento, mientras que al entrenar con solo caracter´ısticas de movimiento el ´ındice de reconocimiento es de un 68 %. La aportaci´on que se toma del trabajo de H. Martin Hunke se relaciona con la posibilidad de eliminar informaci´on de alg´ un canal cuando se trabaja en un espacio de color espec´ıfico. El an´alisis de color realizado por Hunke durante la segmentaci´ on es motivado por el hecho de que la informaci´on del canal que no se considera en el an´alisis, no es importante. Por otro lado, el uso de la red neuronal de retropropagaci´on utilizada en el trabajo de Hunke confirma que ´esta t´ecnica de clasificaci´on da buenos resultados.

64

4 ESTADO DEL ARTE

Figura 4.16: Localizaci´ on de un rostro. a). Imagen original b). Im´agenes en secuencia c). Diferencia de las dos im´agenes d). Conjunto de pixeles con caracter´ısticas de movimiento e). Aplicaci´on del clasificador general de color de rostros –GFCC– f). Conjunto de pixeles con caracter´ısticas de color de piel g). Objetos con caracter´ısticas de movimiento y color de piel h). Objetos m´as grandes i). Rostro localizado.

Figura 4.17: Creaci´ on del clasificador de color de rostros. a). Primero se escoge un ´area de inter´es en la imagen b). Se crea un modelo de distribuci´on de color para el ´area seleccionada c). Se umbraliza como pixeles de piel aquellos que posean valores que se encuentren dentro de la media promedio.

4.7 Localizaci´ on de rostros humanos en Tiempo Real

65

Figura 4.18: Localizaci´ on de un rostro utilizando el modelo de color de piel.

4.7.

Localizaci´ on de rostros humanos en Tiempo Real

El trabajo de Jie Yang y Alex Waibel [Yang and Waibel, 1995] incluye un modelo estoc´astico6 para caracterizar los colores de la piel en rostros humanos, similar al utilizado por [Hunke, 1994]. Los resultados de la segmentaci´ on realizada por [Yang and Waibel, 1995] se muestran en la Figura 4.18. La informaci´on que proporciona el modelo es suficiente para detectar un rostro humano en varias poses y vistas. Adem´as puede ser adaptado en tiempo real para diferentes personas y condiciones de iluminaci´on mientras la persona se mueve. Para la detecci´on de los rostros se utilizan tres tipos de modelos, uno para modelar el color de la piel, otro para estimar el movimiento de la imagen y predecir la b´ usqueda en la ventana, y un tercer modelo para la c´amara, que se ocupa de predecir y compensar los movimientos de ´esta. El control de la c´amara utiliza un modelo basado en control predictivo con un servidor basado en socket. La Figura 4.19 presenta un ejemplo del funcionamiento completo del sistema propuesto por [Yang and Waibel, 1995]. El uso de m´etodos probabil´ısticos como apoyo para la segmentaci´ on similar al utilizado por Hunke y la posibilidad de combinar caracter´ısticas para lograr una mejor clasificaci´on o toma de decisiones se tom´o del trabajo de Jie Yang y Alex Waibel, pues finalmente se demuestra que al tener una descripci´on m´as completa de los objetos o situaciones que son motivo de estudio, es posible obtener buenos ´ındices de clasificaci´on o reconocimiento. En la tabla 4.1 se resumen las ideas principales que se consideraron y dieron forma a este trabajo de tesis. Por otro lado, es importante referir algunos trabajos que tambi´en fueron u ´tiles en el 6 Que esta determinado por el azar. Las leyes de causa-efecto no explican c´ omo act´ ua el sistema de manera determinista, sino en funci´ on de probabilidades [Wikipedia Foundation, 2006].

66

4 ESTADO DEL ARTE

AUTOR

DATOS

Dorin Comaniciu y Peter Meer

Segmentaci´on de imagen celular para diagn´ostico patol´ogico

Im´agenes de c´elulas sangu´ıneas

linfomas malignos, leucemia linfoc´ıtica cr´onica

movimiento de la media

Neelam Sinha y A. G. Ramakrishnan

Automatizaci´on de recuento diferencial de la sangre

Im´agenes de c´elulas sangu´ıneas

linfocitos, monocitos, neutr´ofilos, b´asofilos, eosin´ofilos

bayes, redes neuronales. Reconocimiento: 97 %

Filipe Tomaz, Tiago Candeias y Hamid Shahbazkia

Detecci´on autom´atica de piel en im´agenes en color

Im´agenes de escenas que contienen piel humana

piel humana de raza asi´atica, caus´asica, africana o descendiente de ´estas

distancia de Mahalanobis y filtro de mediana

Mahmoud A. Abdallah, Tayib I. Samu y William A. Grissom

Identificaci´on autom´atica de objetos a´ereos usando redes neuronales

Im´agenes de escenas que contienen alg´ un tipo de objeto a´ereo

Tipo de objeto a´ereo de un total de 5

FFT, red neuronal tipo LVQ. Reconocimiento: 95 %

R. J. Katz

An´alisis de imagen y aprendizaje supervisado en la diferenciaci´on autom´atica de c´elulas blancas de im´agenes microsc´opicas

Im´agenes de c´elulas blancas de la sangre

Tipo c´elula: neutr´ofilo, bas´ofilo, eosin´ofilo, linfocito, monocito

Filtro de canny, bayes, zero, ID3, C4.5, redes neuronales. Reconocimiento: 95.2 %

H. Martin Hunke

Localizaci´on y rastreo de rostros humanos con redes neuronales

Im´agenes de contienen piel humana

piel humana

Redes neuronales. Reconocimiento: 95.2 %

Jie Yang y Alex Waibel

Localizaci´on de rostros humanos en tiempo real

Im´agenes que contienen piel humana

piel humana

Modelo estoc´astico

leucocitos segmentados, leucocitos no segmentados

Segmentaci´on en color con modelo de Mahalanobis y red neuronal de retropropagaci´on. Reconocimiento: 99.54 %

Mar´ıa del Roc´ıo Ochoa Montiel

Clasificaci´on de leucocitos utilizando visi´on por computadora

Im´agenes de frotis sangu´ıneo

CLASES

´ TECNICA

NOMBRE

Tabla 4.1: Principales trabajos relacionados

4.7 Localizaci´ on de rostros humanos en Tiempo Real

67

Figura 4.19: Ejemplo de localizaci´ on de un rostro usando una combinaci´ on de color, geometr´ıa, e informaci´ on de movimiento.

desarrollo de este trabajo de tesis. Entre ellos se encuentra la investigaci´ on de J. C. Terrillon [Terrillon et al., 1998], quien utiliza un modelo de color de piel basado en la m´etrica de Mahalanobis y realiza un an´alisis de forma basado en momentos invariantes para detectar autom´aticamente rostros humanos en im´agenes de escenas naturales bidimensionales. Para distinguir los rostros de otros distractores se utiliza una red neuronal multicapa entrenada con el algoritmo de retropropagaci´on, la cual recibe como vector entrada a los momentos invariantes que se obtienen de la regi´on segmentada como piel. Sus resultados demuestran la eficiencia de la combinaci´on de la segmentaci´ on en color y los momentos invariantes usados en la detecci´on de rostros que se encuentran en diferentes poses y rodeados de fondos complejos. J. C. Terrillon y Shigeru Akamatsu en [Terrillon and Akamatsu, 2000], presentan un an´alisis de diferentes espacios de crominancia para la segmentaci´ on en color de rostros humanos en escenas complejas, donde se concluye que el espacio de crominancia TSL es el espacio que modela mejor el color de la piel humana. Un m´etodo propuesto por [P´erez and Hague, 2002] para un sistema de razonamiento basado en l´ogica difusa es capaz de elegir din´amicamente el mejor umbral para binarizar una imagen en niveles de gris. Los resultados se prueban sobre un amplio conjunto de secuencias en tiempo real de im´agenes de un campo de coliflores, donde uno de los objetivos es apoyar a un experto en la toma de decisiones, tales como el roc´ıo de fertilizante, agua o

68

4 ESTADO DEL ARTE

pesticida. Adem´as el sistema responde satisfactoriamente ante cambios en la iluminaci´on. En el trabajo de Daniela Mayumi y colaboradores [Ushizima et al., 2004] se presenta un an´alisis de textura para el reconocimiento de leucocitos, donde la informaci´on textural se utiliza para el c´alculo de probabilidades que se utilizan como m´etrica para caracterizar la organizaci´on espacial de los niveles de gris. Los resultados experimentales muestran que los par´ametros de textura son patrones espec´ıficos de leucocitos, u ´tiles en la diferenciaci´on de leucocitos normales y leucocitos de leucemia linfoc´ıtica cr´onica, evidenciando aspectos de inter´es para el hemat´ologo tales como la cromatina7 nuclear y citopl´asmica. Guzm´an de Le´on [Guzm´an, 2002], en un an´alisis de im´agenes colposc´opicas busca detectar im´agenes elementales de una manera autom´atica o semiautom´atica, de tal forma que no sea necesario que el ginec´ologo colposcopista trace a mano esas regiones. El detectar esas im´agenes elementales permite eliminar subjetividades como localizaci´on, tama˜ no, distancia, color y forma. Adem´as resulta u ´til encontrar un par´ametro que permita reconocer una patolog´ıa dada. El an´alisis de im´agenes se hace con una t´ecnica de segmentaci´ on que trabaja sobre el espacio de representaci´ on de color, utilizando PCA para hacer una transformaci´on lineal que permite modelar un espacio de color exclusivo para im´agenes colsposc´opicas. Finalmente Iv´on Arroyo y Agust´ın Schapira [Schapira and Arroyo, 1994] en su contador de c´elulas utilizan una t´ecnica que permite realizar la identificaci´ on y conteo c´elular de 2 maneras. La primera consiste en seleccionar los objetos de inter´es a partir de los umbrales de color m´ınimo y m´aximo que se desean en las c´elulas. La segunda forma de realizar la identificaci´on y conteo, se relaciona con las medidas reales que se requieren para aislar a las c´elulas que cumplan con los par´ametros dados por el usuario, las medidas se dan en mil´ımetros que posteriormente se convierten a una longitud en pixeles. En este caso, el sistema tambi´en permite seleccionar con el mouse una c´elula de inter´es para buscar a otras c´elulas que cumplan con dichas caracter´ısticas de tama˜ no y color. El an´alisis de la imagen se realiza con diversas operaciones con matrices.

7 Sustancia compleja constituida por ´ acidos nucleicos y prote´ınas, que se encuentra en el n´ ucleo de las c´elulas y se ti˜ ne por los colorantes b´ asicos de anilina.

Cap´ıtulo 5

Clasificaci´ on de leucocitos Dentro de la primera secci´on de este cap´ıtulo se plantea la problem´atica de esta tesis, mientras que en la segunda secci´on se describen los m´odulos que componen la metodolog´ıa de soluci´on. Los detalles de la implementaci´ on de cada m´odulo que constituye al m´etodo de soluci´on propuesto se mencionan en la secci´on 5.3.

5.1.

M´ etodo para el reconocimiento de c´ elulas sangu´ıneas Segmentadas y No Segmentadas

Las funciones involucradas en la soluci´on a la problem´atica planteada en esta tesis se basan en aplicar un procedimiento a una imagen que contiene una c´elula de inter´es, el cual consiste en: Extraer la regi´on de inter´es, es decir la regi´on que constituye al n´ ucleo celular dado que su forma determina la clase a la que pertenece la c´elula. Obtener caracter´ısticas de la regi´on etiquetada como n´ ucleo. Entrenar a una red neuronal con las caracter´ısticas adquiridas previamente. La implementaci´on de la soluci´on propuesta en esta tesis se realiz´o en Matlab debido a las caracter´ısticas de uso f´acil, buen desempe˜ no en el c´alculo de operaciones matem´ati-

´ DE LEUCOCITOS 5 CLASIFICACION

70

cas, manejo de funciones para el procesamiento de im´agenes y entrenamiento de redes neuronales.

5.2.

Etapas en la soluci´ on del problema

La soluci´on al problema planteado en esta tesis se compone de 5 etapas principales: Adquisici´on y preprocesamiento de la imagen. Segmentaci´on en color. Extracci´on de caracter´ısticas. Entrenamiento de la red. Reconocimiento de observaciones originales. En la Figura 5.1 se muestra la organizaci´on general del m´etodo propuesto para clasificar leucocitos. Los bloques a) y b) que aparecen con l´ıneas punteadas representan dos casos que se realizan en distintas ocasiones. Esto significa que se consideran tres m´etodos para la clasificaci´on de leucocitos y en cada uno s´olo cambia el m´odulo de selecci´on de caracter´ısticas. En el m´odulo de adquisici´on y preprocesamiento de la imagen se obtiene una imagen digitalizada de un campo visto en un microscopio ´optico en el que se encuentra al menos una c´elula de inter´es. En la secci´on 5.3.1 se presenta una descripci´on completa de esta etapa. En el m´odulo de segmentaci´ on se utiliza el modelo propuesto por Filipe Tomaz en [Tomaz et al., 2003], que se ha adecuado para obtener la regi´on de inter´es. El procedimiento detallado se muestra en la secci´on 6.1.2. El m´odulo de extracci´on de caracter´ısticas consta de tres procedimientos disjuntos, que permiten obtener 3 conjuntos de caracter´ısticas, uno por cada procedimiento. En la secci´on 5.3.3 de este cap´ıtulo se muestra una descripci´on completa de dichos m´etodos. En el m´odulo de Entrenamento de la red neuronal, se entrena a una red neuronal con el algoritmo de retropropagaci´on con los vectores de caracter´ısticas que se obtienen con

5.3 M´etodo de clasificaci´ on de leucocitos

71

Figura 5.1: Organizaci´ on general.

el m´etodo descrito en la secci´on 5.3.3. En la secci´on 5.3.4 se describe con m´as detalle el proceso de ´este entrenamiento. En el m´odulo de Reconocimiento de las im´agenes originales, se prueba a las redes neuronales entrenadas, validando los resultados de cada entrenamiento con la t´ecnica de Validaci´on cruzada en 10 particiones. En la secci´on 5.3.5 de este cap´ıtulo se discuten los pormenores de este m´odulo.

5.3.

M´ etodo de clasificaci´ on de leucocitos

Como se ha visto en secciones anteriores, las acciones que se realizan en cada etapa pueden ser probadas de manera independiente. Considerando las descripciones de los bloques que componen la soluci´on del problema, se describe cada etapa de este proceso en las secciones siguientes.

´ DE LEUCOCITOS 5 CLASIFICACION

72

Figura 5.2: Proceso de adquisici´ on de la imagen.

5.3.1.

Adquisici´ on y Preprocesamiento de la imagen

La preparaci´on y tinci´on de las observaciones biol´ogicas utilizadas en este trabajo de tesis se realiz´o por un experto cl´ınico empleando el m´etodo Tinci´on de Giemsa y Azul de metileno descrito en la secci´on 3.1.2, el cual permite diferenciar a los componentes celulares por el tinte que adquieren con dichos colorantes. En la Figura 5.2 se muestra un bosquejo general de las actividades involucradas en el proceso de adquisici´on y digitalizaci´on de la imagen. El microscopio ´optico que se utiliz´o para las observaciones tiene 3 objetivos que poseen diferentes grados de aumento 10x, 40x y 100x, estos n´ umeros corresponden a la escala en la que se observan los objetos a trav´es del ocular. Para distinguir adecuadamente las im´agenes digitalizadas se utiliz´o el objetivo de 100X, colocando una gota de aceite de inmersi´on1 1

La funci´ on del aceite de inmersi´ on es restringir el movimiento de la muestra, adem´ as de evitar el rozamiento entre el cubre objetos y el objetivo, generalmente se utiliza cuando se observa con el objetivo 100x. Otra funci´ on del aceite de inmersi´ on es evitar que la luz se desv´ıe; lo que se pretende es que la luz

5.3 M´etodo de clasificaci´ on de leucocitos

73

entre el portaobjetos que contiene el frotis sangu´ıneo y la lente del objetivo. La c´amara utilizada para digitalizar las im´agenes es una Moticam 350 dise˜ nada especialmente para microscopios ´opticos, algunas de sus caracter´ısticas son: Resoluci´on: 659 ∗ 494 pixeles Rango de color: 24 bits ´o 16.7 millones de colores Sistema operativo: Windows 98/2000/M e Formato de datos soportado: BMP, JPG, MIG El procedimiento para adaptar la c´amara al microscopio consiste en desmontar el lente m´as exterior del ocular del microscopio y colocar la c´amara ensamblada con los accesorios adecuados en lugar de ´este, sujet´andola con tornillos de presi´on. En la Figura 5.3 se muestra este procedimiento. Para enfocar la imagen se mueven manualmente las perillas de los micr´ometros del microscopio hasta tener una visi´on clara de la imagen en el monitor. No obstante, existen variaciones en la iluminaci´on que no se logran controlar. Al observar las muestras biol´ogicas, se logra distinguir claramente el n´ ucleo que se caracteriza por tener un color morado en contraste con colores claros del citoplasma, y a´ un m´as claros en el exterior de la c´elula. Esto facilita el uso de un m´etodo de segmentaci´ on basado en color. Para evitar el excesivo costo de procesamiento computacional, cada observaci´on se escala a un tama˜ no de 64X64 pixeles. En la Figura 5.4 se muestran algunos ejemplares representativos de cada tipo de gl´obulos blancos.

5.3.2.

Segmentaci´ on en color

Los n´ ucleos celulares constituyen los elementos m´as importantes en las observaciones realizadas debido a su color que los diferenc´ıa del resto de los elemenos en la escena. Adem´ as, la forma que presenta cada n´ ucleo determina la clase a la que pertenece la c´elula. En la Figura 5.5 se se˜ nala el n´ ucleo de una c´elula perteneciente a la clase Segmentadas. llegue concentrada hacia la muestra.

74

´ DE LEUCOCITOS 5 CLASIFICACION

Figura 5.3: Procedimiento de instalaci´ on de la c´ amara. Izq.- Montaje de Accesorios. Der.- C´amara ajustada al microscopio.

Figura 5.4: Tipos de Leucocitos. Segmentados: neutr´ofilo y eosin´ofilo, No Segmentados: linfocito y monocito

5.3 M´etodo de clasificaci´ on de leucocitos

75

Figura 5.5: C´ elula segmentada neutr´ ofila.

La segmentaci´on realizada utiliza un algoritmo propuesto por [Tomaz et al., 2003], que se adecu´o en esta tesis para separar n´ ucleos celulares. En cada observaci´ on el n´ ucleo puede estar ubicado en diferentes posiciones y tener un color caracter´ıstico en diferentes tonalidades. Al utilizar una t´ecnica de segmentaci´ on basada en pixel, el tama˜ no y la orientaci´ on de cada n´ ucleo son irrelevantes. La Figura 5.6 presenta el procedimiento utilizado en el proceso de segmentaci´on de la imagen. En la mayor´ıa de las observaciones, la imagen presenta un fondo complejo y el ´area que ocupa el n´ ucleo es m´as peque˜ na que el resto de la escena. Se aplica un filtro inicial que elimina gran parte de los pixeles que no pertenecen al n´ ucleo. Este filtro inicial se dise˜ n´o utilizando la informaci´on obtenida al observar los histogramas de los canales R, G, y B de una imagen que corresponde a un recorte de n´ ucleo de una observaci´ on. Al repetir este procedimiento con las n observaciones, se obtienen histogramas similares. En la Figura 5.7 se muestra un ejemplo. Como se puede ver, los valores para cada pixel que corresponden al canal G son peque˜ nos. En los casos en los que la imagen es muy clara o muy obscura debido a los cambios de iluminaci´on producidos en el momento de su captura, se presenta un desplazamiento peque˜ no a la derecha o a la izquierda, sin embargo esto no afecta significativamente los experimentos subsecuentes. Considerando una muestra M de tama˜ no n, cada observaci´ on que compone a esta muestra consiste en un arreglo tridimensional X(i,j,k) correspondiente a la estructura de una imagen, donde i = 1, 2, ..., 64, j = 1, 2, ..., 64, k = 1, 2, 3. A partir de la informaci´on almacenada en X, para cada canal k se forma un histograma

´ DE LEUCOCITOS 5 CLASIFICACION

76

Figura 5.6: Desarrollo del proceso de segmentaci´ on.

HISTOGRAMAS DE CANALES RGB DE UN RECORTE DE NÚCLEO 150 Canal R 100 Pixeles 50 0

0

50

100

150

200

250

300

3000 Canal G 2000 1000 0

Pixeles 0

50

100

150

200

250

300

300 Canal B 200 100 Pixeles 0

0

50

100

150

200

250

300

Figura 5.7: Histogramas de los canales RGB de un recorte de n´ ucleo de una c´ elula segmentada.

77

5.3 M´etodo de clasificaci´ on de leucocitos

Figura 5.8: Diferencias entre d1 y d2 .

Hk , donde la longitud de Hk es 256 y la i-´esima posici´on de H contiene la ocurrencia de los valores desde 0 para la posici´on Hk1 hasta 255 para la posici´on Hk256 . Con la informaci´on que se tiene en Hk , se obtienen las siguientes diferencias:

d1 = Hki+1 − Hki

y

d2 = Hki+2 − Hki+1

(5.1)

Gr´aficamente, esto se puede ver en la Figura 5.8. Para cada valor de d1 y d2 , se eval´ uan las siguientes condiciones, donde i = 1 . . . 256 :

V mini = i

}

Si d1 < d2 ( existe un pico m´ınimo)

V maxi = 0 V mini = 0

} Si d1 > d2 ( existe un pico m´aximo)

(5.2)

V maxi = i V mini = 0

} Si d1 = d2 ( pues no existen picos m´ınimos ni m´aximos)

V maxi = 0 . V mini y V maxi son vectores que contienen los ´ındices del histograma Hk , en los cuales existe un pico m´ınimo o m´aximo, respectivamente. De esta manera son definidos umbralinf = min(V max) y umbralsup = max(V min). Se calcula finalmente umbralinf y umbralsup de las n observaciones para obtener los umbrales

´ DE LEUCOCITOS 5 CLASIFICACION

78

a). Célula segmentada original

b). Célula segmentada después de aplicar el filtro inicial

Figura 5.9: Resultados de Filtro inicial aplicado a una c´ elula segmentada.

utilizados en el filtro inicial: //RGB son valores que estan en el rango de 0 a 255 k=1 |B >= umbralk=3 |G <= umbralk=2 ) Si (R >= umbralinf sup inf

ES NUCLEO En la Figura 5.9 se muestra una observaci´ on correspondiente a una c´elula de la clase Segmentada antes y despu´es de aplicar el filtro inicial.

Modelo de color para n´ ucleos de leucocitos. Para modelar el esquema utilizado en la segunda parte de la segmentaci´on, las im´agenes de recortes de n´ ucleos son transformadas al espacio de crominancia TSL, debido a que en este espacio la informaci´on del color se encuentra en dos canales, T y S reduciendo la cantidad de informaci´on con la que se trabaja, adem´as como se menciona en [Terrillon et al., 2000], es recomendable trabajar en el espacio TSL a´ un cuando las condiciones de iluminaci´on var´ıan, siendo efectivo cuando se utiliza un modelo Gaussiano. Utilizando las siguientes transformaciones, se obtiene la representaci´ on equivalente de cada pixel en el espacio TSL, el canal L(iluminaci´on) no se utiliza, por lo que no se muestra la ecuaci´on equivalente.      

s S=

9 5(r + g 0 2 ) 02

y

T =

0

tan−1 ( gr 0 ) π

     0,

+ 0.5, g 0 6= 0 (5.3) g0 = 0

79

5.3 M´etodo de clasificaci´ on de leucocitos

donde

0

r =

R − 1/3 R+G+B

0

y

g =

G − 1/3 R+G+B

(5.4)

Para representar el color del n´ ucleo, se define una matriz de covarianza CT S , que indica la relaci´on de los valores para los canales T y S de la imagen. Para construir la matriz de covarianza CT S , se considera a T y S como la uni´on de los componentes T y S de cada observaci´on, es decir l Ti,j → Tkl

y

l Si,j → Skl

(5.5)

donde, k = 642 (l − 1) + 64(i − 1) + j l = 1...354

(5.6)

i = 1...64 j = 1...64

Tambi´en se obtiene un vector de medias Vm utilizando los canales T y S de las n observaciones.

· Vm =

¸T (5.7)

Mt Ms

Mt y Ms son escalares que se representan el promedio de los elementos de T y S, respectivamente. La matriz de covarianza queda definida como   CT S = 

 σ2 T

σT S   σT S σ 2 S

(5.8)

´ DE LEUCOCITOS 5 CLASIFICACION

80

donde, Pl

σ2T = σ2S =

i=1 (Ti

− Mt )2

i=1 (Si

− Ms )2

Pl

σT S =

Pl

i=1 (Ti

(5.9)

− Mt )(Si − Ms )

La distancia |λ2i,j | del pixel(i,j) al vector Vm se define utilizando como m´etrica la distancia de Mahallanobis como sigue.

|λ2i,j | = [Xi,j − Vm ]T CT−1 S [Xi,j − Vm ]

(5.10)

donde, Xi,j = pixeli,j de la imagen obtenida despu´es de haber aplicado el filtro inicial. Las barras verticales en |λ2i,j | indican que se trata de un valor positivo, pues como se mencion´ o en la secci´on 3.2.1, una distancia siempre es positiva.

Umbralizaci´ on. Antes de hacer una umbralizaci´ on binaria con |λ2i,j |, ´esta se normaliza utilizando la ecuaci´on utilizada por Tomaz [Tomaz et al., 2003].

disM = 1 −

λ2i,j cons

(5.11)

donde, cons = 9. El valor de cons es obtenido experimentalmente. Despu´es de esta normalizaci´on, se umbraliza la regi´on que se obtuvo al aplicar el filtro inicial, considerando como parte del n´ ucleo a los pixeles cuyo valor es mayor a 0.7. Los resultados de esta primera umbralizaci´ on se pueden ver en la Figura 5.10, en la que a´ un pueden distinguirse algunos pixeles que no forman parte del n´ ucleo. Finalmente, para eliminar los pixeles aislados que aparecen en la imagen, se aplica un filtro de mediana con una ventana de 9x9 pixeles.

5.3 M´etodo de clasificaci´ on de leucocitos

81

Figura 5.10: Umbralizaci´ on con el Modelo de Mahalanobis. a)Imagen original. b)Imagen despu´es de aplicar filtro inicial. c)Imagen despu´es de aplicar modelo de Mahalanobis.

5.3.3.

Extracci´ on de caracter´ısticas

En el cap´ıtulo anterior se mencion´o que la problem´atica abordada en esta tesis consiste en clasificar una c´elula sangu´ınea en Segmentada o No Segmentada considerando su morfolog´ıa nuclear. Como parte de la soluci´on dada, se comienza por digitalizar un campo visto a trav´es de una c´amara adaptada a un microscopio ´optico y posteriormente separar el n´ ucleo de la imagen observada. El proceso detallado de ´esta etapa se ha descrito en la secci´on anterior. Una vez conclu´ıda la segmentaci´ on del n´ ucleo, el siguiente paso consiste en la extraci´on de caracter´ısticas para clasificar a la imagen. Por lo tanto, es preciso recordar lo visto en el cap´ıtulo 3, donde se se˜ nala que las Redes neuronales reciben como entrada vectores de caracter´ısticas que describen los ejemplos de entrenamiento y son una herramienta u ´til en la clasificaci´on de patrones. En este trabajo de tesis se utilizan las redes neuronales como la t´ecnica para clasificar a las regiones etiquetadas como n´ ucleo, y catalogarlas dentro de la clase Segmentados o No Segmentados tomando en cuenta caracter´ısticas que permitan describir su forma. En esta secci´on se muestra el procedimiento para obtener los vectores de caracter´ısticas que se dan como entrada a la red neuronal. La Figura 5.11 muestra un esquema general que indica el procedimiento utilizado en el m´odulo de extracc´on de caracter´ısticas.

Extracci´ on de caracter´ısticas estructurales El proceso de extracci´on de caracter´ısticas estructurales recibe como entrada la imagen segmentada que se obtuvo en la etapa anterior, en la cual puede existir m´as de una regi´on

´ DE LEUCOCITOS 5 CLASIFICACION

82

Figura 5.11: Extracci´ on de caracter´ısticas.

y para cada regi´on de ´estas se obtienen 12 atributos, as´ı se tienen 13 caracter´ısticas de cada imagen. Con el n´ umero de regiones y el ´area de cada regi´on es posible tener una aproximaci´ on de la clase a la que puede pertenecer la c´elula, pues una imagen que contenga m´as de una regi´on de tama˜ no similiar es muy probable que corresponda a una c´elula de la clase Segmentada, debido a que su n´ ucleo se encuentra fragmentado, a diferencia de las c´elulas de la clase No Segmentada, cuyo n´ ucleo es casi redondo y no est´a dividido. Sin embargo, esta aproximaci´on no es suficiente para ubicar a todas las c´elulas en la clase a la que pertenecen, pues gran parte de las im´agenes est´an formadas por s´olo una regi´on. Las caracter´ısticas que se enlistan en la tabla 5.1 se calculan para las n observaciones. Todas son escalares para no elevar el costo computacional involucrado en su procesamiento. La descripci´on de algunas de ellas se encuentra en la secci´on 3.4, por lo que en esta tabla s´olo se describen aquellas que fueron deducidas a partir de las caracter´ısticas estructurales definidas en la tabla 3.1 de dicha secci´on. Para cada observaci´on se obtiene un vector de caracter´ısticas. En la Figura 5.12 se muestra la tabla de caracter´ısticas correspondiente a algunos datos obtenidos para la clase Segmentados. Extracci´ on de caracter´ısticas estructurales con an´ alisis de varianza Las caracter´ısticas estructurales con an´alisis de varianza son caracter´ısticas elegidas despu´es de realizar un an´alisis para ambas clases de c´elulas, de la varianza de un conjunto

83

5.3 M´etodo de clasificaci´ on de leucocitos

´ NUMERO

1 2 3 4 5 6 7 8 9 10 11

CARACTER´ISTICA

N´ umero de regiones que contiene la imagen Excentricidad Solidez Rectangularidad (Extent) Longitud de Eje mayor Longitud de Eje menor N´ umero de Euler Orientaci´on Di´ametro equivalente ´ Area del bounding box Relaci´on de ejes. Calculado como

12

Longitud de eje mayor/Longitud de eje menor Diferencia de ´areas. Calculado como ´ ´ Area del Convex Hull − Area de la regi´on Varianza de los radios. Es la varianza de las distancias

13

euclidianas del centro de masa de la regi´on a cada punto que forma su per´ımetro. Tabla 5.1: Caracter´ısticas estructurales.

Figura 5.12: Almacenamiento de las caracter´ısticas estructurales.

´ DE LEUCOCITOS 5 CLASIFICACION

84 ´ NUMERO

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

CARACTER´ISTICA

´ Area de la regi´on Elongaci´on (raz´on de aspecto). Es la cuadratura del B. box. Calculado como Longitud de la base/Longitud de la altura Longitud de Eje mayor Longitud de Eje menor Relaci´on de Ejes Excentricidad Orientaci´on ´ Area del bounding box ´ Area vac´ıa. Calculada como Area del B.Box − Area de la regi´on ´ Area del Convex Hull N´ umero de Euler Di´ametro equivalente Solidez Rectangularidad ´ Diferencia de Areas N´ umero de regiones Varianza de los radios

Tabla 5.2: Caracter´ısticas estructurales iniciales para el an´ alisis de varianza.

de caracter´ısticas estructurales. Las caracter´ısticas elegidas para el an´alisis de varianza se presentan en la tabla 5.2, en la cual s´olo se definen las caracter´ısticas que no han sido consideradas en tablas de caracter´ısticas ya mostradas. Las caracter´ısticas mostradas en la tabla se calculan para todas las observaciones de cada clase y se almacenan dichos valores en un vector, de tal manera que para cada caracter´ıstica se obtienen 2 vectores (uno para cada clase). Posteriormente se calcula la varianza de cada vector caracter´ıstico para ambas clases, con estos valores se obtiene una diferencia (como valor absoluto). En la tabla 5.3 se presentan los resultados obtenidos al aplicar el procedimiento antes descrito. Como se puede observar, para cada caracter´ıstica se muestran 3 columnas: la primera respresenta la varianza obtenida para las c´elulas de la clase Segmentadas, la segunda contiene la informaci´on referente a la varianza para la clase No segmentadas. En la tercera columna se muestra la diferencia (como valor absoluto) de los valores

85

5.3 M´etodo de clasificaci´ on de leucocitos CARACTER´ISTICA

´ 1. Area de la regi´on 2. Elongaci´on 3. Longitud de Eje mayor 4. Longitud de Eje menor 5. Relaci´on de Ejes 6. Excentricidad 7. Orientaci´on ´ 8. Area del bounding box ´ 9. Area vac´ıa ´ 10. Area del Convex Hull 11. N´ umero de Euler 12. Di´ametro equivalente 13. Solidez 14. Rectangularidad ´ 15. Diferencia de Areas 16. N´ umero de regiones 17. Varianza de los radios

V arianzaSeg

V arianzaN oSeg

Diferencia de varianzas

1.5391 0 0.0017 0.009 0 0 0.0264 1.6162 0.0061 2.4198 0 0.008 0 0 0.2299 0 0.0010

2.2133 0 0.0011 0.009 0 0 0.0284 2.2583 0.0061 2.3072 0 0.0009 0 0 0.1029 0 0.0010

0.6742 0 0.0060 0.0003 0 0 0.0198 0.6421 0 1.1266 0 0.0014 0 0 0.1269 0.0001 0

Tabla 5.3: Resultados del an´ alisis de varianza para 17 caracter´ısticas estructurales.

encontrados en la primera y segunda columna, para cada una de las 17 caracter´ısticas consideradas. De acuerdo a los resultados observados en la tercera columna, tenemos que el criterio para la selecci´on de las caracter´ısticas fue descartar a aquellos renglones cuya diferencia entre ambas clases (tercera columna) sea mayor a 0.0001, considerando una precisi´on de 4 d´ıgitos en la parte decimal debido a que los valores obtenidos para estas diferencias son por naturaleza muy peque˜ nos. La condici´on propuesta para la selecci´on de caracter´ısticas es: Si |V arianzaSeg − V arianzaN oSeg | > 0.0001, entonces se elige la caracter´ıstica en caso contrario se descarta la caracter´ıstica Los resultados obtenidos con este m´etodo se observan en la tabla 5.4.

´ DE LEUCOCITOS 5 CLASIFICACION

86 ´ NUMERO

1 2 3 4 5 6 7 8

CARACTER´ISTICA

´ Area de la regi´on Longitud de Eje mayor Longitud de Eje menor Orientaci´ on ´ Area del Bounding box ´ Area del Convex Hull Di´ametro equivalente Diferencia de ´areas

Tabla 5.4: Caracter´ısticas estructurales obtenidas con el an´ alisis de varianza.

Extracci´ on de caracter´ısticas radiales Las caracter´ısticas radiales deben su nombre a que se derivan de la medida del centro de masa de la regi´on de inter´es a su per´ımetro, lo cual se interpreta como un radio geom´etrico. A continuaci´on se definen 2 conceptos b´asicos para describir el procedimiento utilizado para obtener las caracter´ısticas radiales. Distancia radial, DR.- Distancia euclidiana del centro de masa a alg´ un punto que forma el per´ımetro de la regi´on. Vector de caracter´ısticas radiales, V .- Vector que contiene las distancias radiales DR de una regi´on. De acuerdo a las definiciones anteriores, para cada observaci´ on se obtiene un vector de caracter´ısticas radiales de longitud variable, dado que dicha longitud depende de la cantidad de puntos que forma el per´ımetro de la regi´on. En caso de recibir como entrada una imagen que contenga m´as de una regi´on, se considera s´olo la regi´on que tiene la mayor ´area, para extraer sus caracter´ısticas radiales. Sin embargo, la red neuronal recibe como entrada una matriz de caracter´ısticas que deber´a formarse a partir de los vectores de caracter´ısticas radiales, y con vectores de diferente tama˜ no no es posible construir dicha matriz. Para solucionar este problema, se propone un m´etodo para escalar los vectores sin producir alteraciones significativas en la informaci´on que contienen, pues esta informaci´on es un descriptor de la forma de la regi´on.

5.3 M´etodo de clasificaci´ on de leucocitos

87

Figura 5.13: M´ etodo para el c´ alculo de las caracter´ısticas radiales.

El escalamiento propuesto consiste en elegir el tama˜ no al cual se reducir´an los vectores de caracter´ısticas de las n observaciones, para lo cual se busca entre los n vectores de caracter´ısticas aquel que tenga la menor longitud Lmin , este valor es usado para escalar todos los vectores cuya longitud es mayor a Lmin . A continuaci´ on se presentan dos m´etodos para realizar este escalamiento. La Figura 5.13 muestra el m´etodo utilizado para la extracci´on de las caracter´ısticos radiales. En los p´arrafos siguientes se describen con detalle las t´ecnicas de escalamiento utilizadas para ajustar los vectores de caracter´ısticas radiales a un mismo tama˜ no. Escalamiento Aleatorio En este caso para cada observaci´ on se toman aleatoriamente Lmin elementos de su correspondiente vector V de caracter´ısticas radiales conservando el orden, para formar un segundo vector V 0 . Dado que cada vector V 0 es de la misma longitud, se construye la tabla

´ DE LEUCOCITOS 5 CLASIFICACION

88

Figura 5.14: Almacenamiento de las caracter´ısticas radiales obtenidas aleatoriamente.

de caracter´ısticas al colococar a los vectores V10 , V20 , V30 , ...Vn0 como renglones de dicha tabla. Esto se muestra en la Figura 5.14 Al realizar una selecci´on aleatoria de los elementos de V resulta un muestreo no homog´eneo, pues cada vez se eligen diferentes puntos para formar el vector de caracter´ısticas radiales.

Escalamiento con Transformaci´ on Lineal Para obtener una selecci´on homogenea de los elementos que forman el vector de caracter´ısticas radiales, se realiza un escalamiento utilizando la siguiente transformaci´on lineal: Vi0 = b

k Vj k ∗ ic Lmin

(5.12)

donde, i = 1..Lmin j = 1..n Vi0 = vector de caracter´ ısticas resultante de longitud Lmin Finalmente se construye una tabla de caracter´ısticas similar a la que se muestra en la

5.3 M´etodo de clasificaci´ on de leucocitos

89

Figura 5.15: Izquierda. Per´ımetro de un n´ ucleo. Centro. Puntos escogidos para formar V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0 en el escalamiento lineal.

Figura 5.16: A la izquierda: Regi´on nuclear de una c´elula segmentada. A la derecha: Per´ımetro de la regi´on de la izquierda.

Figura 5.14, en la que cada regl´on est´a constitu´ıdo por los vectores V10 , V20 , V30 , ...Vn0 . En la Figura 5.15 se muestra el per´ımetro de una regi´on y las im´agenes obtenidas al realizar un escalamiento aleatorio y un escalamiento lineal.

Propiedades de la Transformada R´ apida de Fourier En la Figura 5.16 se muestra la regi´on nuclear de una observaci´ on y su per´ımetro. Para obtener componentes de frecuencia significativos, la funci´on se transforma del dominio del tiempo al dominio de la frecuencia usando la transformada r´apida de Fourier. La Figura 5.17 en la parte superior representa el per´ımetro mostrado en 5.16 en el dominio del tiempo, mientras que en la parte inferior se muestra la magnitud de dicho per´ımetro despu´es de aplicar la FFT. Uno de los principales objetivos en la selecci´on de caracter´ısticas para el entrenamiento de la red neuronal es evitar variaciones de rotaci´on, traslaci´on y escalamiento de las im´agenes. Se utilizan 2 propiedades de la transformada de Fourier para neutralizar los efectos de rotaci´on y escala. Estas propiedades son: multiplicaci´ on por una constante y el cambio del tiempo al dominio de la frecuencia. En el dominio del tiempo, rotar una funci´on significa desplazarla; mientras que el es-

´ DE LEUCOCITOS 5 CLASIFICACION

90

Figura 5.17: Per´ımetro de la regi´ on de inter´ es. Arriba. Representaci´on del per´ımetro en el dominio del tiempo. Abajo. Representaci´on del per´ımetro en el dominio de la frecuencia, considerando solo la parte de magnitud despu´es de aplicar la FFT

calamiento la multiplica por una constante, que es el factor de escalamiento. Dada una funci´on de tiempo f (t), la Transformada R´apida de Fourier esta dada por:

z[f (t)] = F (jω)

(5.13)

F (jω) =| F (jω) | ejφ

(5.14)

donde, | F (jω) | es la amplitud. Adem´as si f (t) es multiplicada por una constante A, se tiene: z[Af (t)] = AF (jω)

(5.15)

AF (jω) = A | F (jω) | ejφ

(5.16)

La constante A es el factor escala que afecta la funci´on f (t), siempre que una imagen es capturada bajo diferentes escalas. Para nulificar el efecto de la constante A en la magnitud, el efecto de A en la funci´on f (t) se elimina. Esto se logra al normalizar la funci´on f (t). La

5.3 M´etodo de clasificaci´ on de leucocitos

91

normalizaci´on consiste en dividir Vi0 por el m´aximo de los elementos de Vi0 . La propiedad de desplazamiento en el dominio de la frecuencia elimina los efectos de rotaci´on. Sin embargo si alguna imagen es rotada en el dominio del tiempo, resulta en un cambio de la funci´on f (t) por un tiempo t0 . La funci´on f (t) se convierte en f (t−t0 ) cuando la rotaci´on ocurre. La FFT est´a dada por: z[f (t − t0 )] =| F (jω) | ejφ .e−jφt0

(5.17)

z[f (t − t0 )] =| F (jω) | ej(φ−ωt0 )

(5.18)

S´olo el componente de fase de la transformada es afectado por la rotaci´on, por lo tanto la amplitud, que no se ve afectada por el movimiento resulta u ´til. El centro de masa se utiliz´o como el punto de referencia en el c´alculo de distancias radiales para eliminar variaciones causadas por los efectos traslaci´on. Utilizando estas propiedades de la Transformada de Fourier, se crean los vectores de caracter´ısticas considerando que f (t) = Vi0 . Como resultado de esta transformaci´on se obtiene un conjunto de n´ umeros complejos y se extrae la amplitud o m´odulo de cada uno de ellos para formar un nuevo vector de caracter´ısticas Di . Con este nuevo conjunto de vectores se construye la tabla de caracter´ısticas que se muestra en la Figura 5.18.

5.3.4.

Entrenamiento de la red

El entrenamiento se realiza con una red neuronal de retropropagaci´on, la cual requiere de un problema supervisado, as´ı la red aprende a clasificar vectores de entrada en clases definidas por el usuario. En este caso las clases son Segmentados y No Segmentados. El tipo de aprendizaje por retropropagaci´on debe su nombre a que los pesos de las neuronas se corrigen primero en la capa de salida, despu´es en la segunda capa oculta si es que existe, y al final en la primera capa oculta, es decir en la primera capa que recibe la informaci´on directamente de la entrada. La arquitectura de la red neuronal es tal, que la capa m´as interna tiene menos neuronas que las capas externas ya que por experimentaci´ on

´ DE LEUCOCITOS 5 CLASIFICACION

92

Figura 5.18: Almacenamiento de las caracter´ısticas obtenidas despu´ es de aplicar FFT.

al aumentar el n´ umero de neuronas en las capas ocultas, los resultados no mejoran. El entrenamiento se realiza de manera independiente con cada conjunto de caracter´ısticas mostrado en las tablas de las Figuras 5.12 y 5.18. En cada caso la red neuronal tiene m neuronas de entrada, donde m corresponde al n´ umero de caracter´ısticas o columnas de las tablas mostradas en las figuras correspondientes. Los vectores de clases son par´ametros adicionales que se introducen a la funci´on de entrenamiento. La red neuronal tiene 2 neuronas de salida que corresponden a las clases que la red es capaz de reconocer. Para explicar la manera en que la red neuronal recibe los datos, suponga que la matriz E es la entrada, y el vector C contiene las etiquetas de las clases a reconocer. 

 e1,1

e1,2

   e2,1 e2,2   E= . .     . .  em,1 em,2

.....

e1,n

.....

e2,n

.....

.

.....

.

    · ¸  C = 1 2 . . 2     

(5.19)

..... em,n

donde, n corresponde al n´ umero de observaciones. Cada columna en la matriz de entrada E representa las caracter´ısticas extra´ıdas (en forma de vector) para una observaci´ on de

93

5.3 M´etodo de clasificaci´ on de leucocitos

cierta clase, y la correspondiente fila en el vector C representa la clase a la que pertenece. Los vectores de caracter´ısticas de clase se colocan de manera alternada en la matriz Mce y se considera igual n´ umero de observaciones para ambas clases. Como son dos clases que la red neuronal reconoce, el vector de clases CM contiene los n´ umeros 1 y 2 de manera alternada representando a cada clase. La matriz de entrada que se muestra a continuaci´ on corresponde al conjunto de caracter´ısticas estructurales de la Figura 5.12. 

Mce

                   =                  

 1

1

1

. . . . .

1

0.853 0.789 0.481 . . . . . 0.899 0.863 0.786 0.762 . . . . . 0.867 0.594 0.777 0.526 . . . . . 0.877 48.63 47.89 40.44 . . . . . 45.78 25.32 51.56 35.47 . . . . . 49.81 1

1

1

. . . . .

1

24.69 45.89 105.8 . . . . . 48.99 33.53 56.78 33.14 . . . . . 51.78 1.363 1.567 0.928 . . . . . 1.678 1.921 1.987 1.141 . . . . . 1.874 140

134

269

. . . . .

123

                                     

(5.20)

24.25 10.23 30.55 . . . . . 12.78 · CM =

¸ 1 2 . . 2

(5.21)

Cabe decir que el 10 % de las n observaciones se utilizan para probar la red y con el resto se entrena. Cada vez que se prueban los datos se eligen aleatoriamente para tomar una muestra diferente cada vez. Los datos de prueba y de entrenamiento se organizan en matrices como se indica en la ecuaci´on 5.19, de esta forma quedan definidas una matriz de prueba P y una matriz de entrenamiento Mce . El entrenamiento se detiene cuando cualquiera de las siguientes condiciones ocurre:

´ DE LEUCOCITOS 5 CLASIFICACION

94

El n´ umero m´aximo de ´epocas (repeticiones) sea alcanzado. La m´axima cantidad de tiempo ha sido excedida. El desempe˜ no ha sido minimizado a la meta. Como parte de la experimentaci´on se preprocesan las matrices de caracter´ısticas con PCA reduciendo el n´ umero de caracter´ısticas de entrada, mejorando el ´ındice de reconocimiento. Despu´es de aplicar PCA a las matrices de entrenamiento que se forman a partir de las tablas de caracter´ısticas obtenidas, se reduce el n´ umero de caracter´ısticas y se entrena la red. Al terminar en entrenamiento la red neuronal se prueba con la matriz de prueba P y finalmente se comparan las etiquetas separadas de la matriz de prueba (vector CM ) con la salida obtenida de la red neuronal. Los resultados se contabilizan utilizando una matriz de confusi´on2 y se obtiene la precisi´on del clasificador utilizado.

5.3.5.

Reconocimiento de observaciones originales

La evaluaci´on del desempe˜ no de la red neuronal, respecto a precisi´on, desempe˜ no y fiabilidad se realiza con la t´ecnica de Ten Fold Cross Validation –Validaci´ on cruzada en 10 particiones–. El m´etodo consiste en tomar de las n observaciones el 90 % para entrenar y el 10 % para probar. Este procedimiento se repite 10 veces y en cada vez se rotan los datos para analizar diferentes conjuntos en cada caso. Como resultado de cada prueba se obtienen un ´ındice de reconocimiento Ri , al promediar los valores de estos Ri se obtiene un RT que representa un ´ındice de precisi´on en los resultados obtenidos.

2

Una matriz de confusion indica en su posicion (i, j) el numero de muestras de la clase j asignadas por el clasificador a la clase i. Esta estructura permite averiguar los pares declases entre los que son mas frecuentes los errores del clasificador.

Cap´ıtulo 6

Pruebas y an´ alisis de resultados En este cap´ıtulo se muestran los resultados que se obtienen al utilizar la metodolog´ıa propuesta en la secci´on 2.4. Considerando una medida de similitud para el desarrollo del modelo de segmentaci´on y al menos tres t´ecnicas que permiten la extracci´on de caracter´ısticas utilizadas como descriptores de forma, en principio se describen los resultados obtenidos durante la etapa de adquisici´on de la imagen y posteriormente en la etapa de segmentaci´on. Despu´es se comenta el proceso de extracci´on de caracter´ısticas, que se divide en tres partes. Mostr´andose que las caracter´ısticas estructurales, no son los atributos que describen de la mejor manera a la forma de la regi´on nuclear. Finalmente se realiza un an´alisis comparativo sobre los resultados obtenidos con cada conjunto de caracter´ısticas y se muestran los resultados obtenidos en la evaluaci´ on del desempe˜ no de la red neuronal.

6.1. 6.1.1.

Pruebas Adquisici´ on y preprocesamiento de la imagen

En principio se recolectan los frotis sangu´ıneos que son analizados por un experto cl´ınico para obtener las observaciones utilizadas en esta tesis. El primer paso para obtener estos frotis consiste en la recolecci´on de muestras de sangre de diferentes pacientes, ca-

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

96

Figura 6.1: Recolecci´ on de muestras sangu´ıneas. Izquierda. Elecci´on del paciente. Centro. Extracci´on de la sangre. Derecha. Preparaci´on y tinci´on del frotis.

talogados como normales. Se toman en cuenta este tipo de pacientes con la finalidad de disminuir la posibilidad de encontrar c´elulas anormales (anat´omica y morfol´ogicamente) que generalmente se presentan en patolog´ıas como la leucemia o la anemia, adem´as de que la clasificaci´on realizada en este trabajo se realiza de acuerdo a las caracter´ısticas presentes en c´elulas normales. Las muestras biol´ogicas (frotis sangu´ıneos te˜ nidos para Recuento Diferencial) fueron proporcionadas por instituciones como los Laboratorios BioDiagnostics, el Banco de sangre de Tlaxcala, el Hospital General de Apizaco y el Laboratorio de Citolog´ıa del Instituto Mexicano del Seguro Social de Tlaxcala. En la Figura 6.1 se presentan las acciones involucradas en la recolecci´on y preparaci´on de las muestras de sangre y que van desde la elecci´on del paciente, hasta la toma de la muestra y la preparaci´on del frotis realizada por un experto cl´ınico. El procedimiento detallado para tinci´on de dicho frotis se comenta en la secci´on 3.1.2. A pesar de que la cantidad de frotis recolectados con esta t´ecnica fue de m´as de 100, se utilizaron 85 para la adquisici´on de las im´agenes dado que por cada muestra se hace un recorrido obteniendo diferentes im´agenes, de tal manera que por cada frotis se digitalizan entre 3 y 5 im´agenes. La digitalizaci´on de las im´agenes se realiz´o en las instalaciones de los Laboratorios BioDiagnostics1 con el apoyo de un experto cl´ınico

2

para el reconocimiento

de la c´elula. Para digitalizar las im´agenes primero se mont´ o la c´amara al microscopio, como se observa en la Figura 5.3. Para enfocar un campo en el microscopio se coloc´o una gota de aceite de inmersi´on sobre el frotis sangu´ıneo, que despu´es es colocado sobre la base del 1 2

Laboratorio cl´ınico particular ubicado en la Cd. de Apizaco, Tlax. Q.F.B. Gonzalo Romero Tirso.

6.1 Pruebas

97

Figura 6.2: Adquisici´ on de las observaciones. Izquierda: Gota de aceite sobre el frotis. Centro: Colocaci´on del frotis sobre la base del microscopio. Derecha: Campo visto a trav´es de la c´amara.

Figura 6.3: Campos vistos al microscopio con diferentes aumentos. Izquierda: Utilizando el objetivo de 40X. Derecha: Utilizando el objetivo de 100X.

portaobjetos acerc´andolo de tal manera que exista contacto f´ısico con el objetivo 100X del microscopio. Esta secuencia de pasos se observa en la Figura 6.2. Para la adquisici´on de las im´agenes se trabaj´o con el objetivo 100X dado que se distinguen mejor las caracter´ısticas de la c´elula, en la Figura 6.3 se puede apreciar la diferencia al enfocar un campo visto con el objetivo 40X y otro al cambiar al objetivo 100X. Los tipos de c´elulas observadas pertenecen a 2 clases principales: Segmentados y No Segmentados. Cada clase tiene subtipos, sin embargo la forma de su n´ ucleo es representativa de cada una. Las c´elulas que pertenecen a la clase Segmentados se caracterizan por tener un n´ ucleo deforme, mientras que las c´elulas de la clase No Segmentados presentan un n´ ucleo de forma redondeada. En la Figura 6.4, se muestran los subtipos b´asicos de c´elulas Segmentadas y No Segmentadas. En cada campo observado a trav´es de la c´amara se visualiza al menos una c´elula de inter´es como se aprecia en la parte derecha de la Figura 6.3; de este campo se recorta manualmente el ´area que encierra a la c´elula de inter´es, con lo cual se obtienen im´agenes como las que aparecen en la Figura 6.4, de este modo se adquieren 354 observaciones que pertenecen a los tipos se˜ nalados en la Figura 6.5. Es importante hacer notar que el tipo de c´elula llamado bas´ofilo no se incluye en las

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

98

Figura 6.4: Tipos de gl´ obulos blancos. Arriba.- Segmentados: Neutr´ofilo, Eosin´ofilo, Bas´ofilo. Abajo.- No Segmentados: Linfocito y monocito.

Figura 6.5: Gl´ obulos blancos digitalizados.

observaciones porque es un tipo poco com´ un y dif´ıcil de identificar, adem´as de los pocos bas´ofilos que fueron identificados por el experto cl´ınico la mayor´ıa presentaron deformaciones o estaban parcialmente destru´ıdos; sin embargo se puede observar uno de ellos en la parte superior derecha de la Figura 6.4. Por otra parte, debido a que en el modelo utilizado en la etapa de segmentaci´ on se utilizan recortes de n´ ucleo celular, de cada observaci´on se recorta manualmente parte del n´ ucleo correspondiente adquiriendo con esto 354 observaciones de recortes de n´ ucleos celulares, en la Figura 6.6 se muestra un ejemplo. Las observaciones de celulas completas y de recortes de n´ ucleo se escalan a un tama˜ no de 64x64 pixeles para su procesamiento posterior.

6.1.2.

Segmentaci´ on de la imagen

Utilizando las 354 observaciones de c´elulas completas y recortes de n´ ucleos de la c´elula encontrada en dicha observaci´on se construye un modelo basado en color para segmentar el n´ ucleo de la imagen. Debido a que los tonos morados que presentan los n´ ucleos permiten diferenciar claramente a cada uno, se adecu´o el modelo propuesto por [Tomaz et al., 2003]

6.1 Pruebas

99

Figura 6.6: Recorte de n´ ucleo de una c´ elula de la clase Segmentada.

dise˜ nado originalmente para segmentar piel, que se describi´o en la secci´on 4.3. Para ahorrar recursos computacionales y facilitar el proceso de segmentaci´ on se dise˜ n´o un filtro inicial obtenido experimentalmente al observar las caracter´ısticas de color en el espacio de color RGB pertenecientes los recortes de n´ ucleo. Los histogramas de los canales R, G y B correspondientes a los recortes de n´ ucleo de algunas observaciones se muestran en la Figura 6.7, donde se aprecia que la cantidad de color verde es peque˜ na en relaci´on al rojo y al azul. Debido a que los histogramas obtenidos para cada canal presentan una curva caracter´ıstica, se utilizan 5.1 y 5.2 para determinar los puntos donde dicha curva comienza y termina de crecer. Con los umbrales obtenidos de esta manera umbralinf y umbralsup se eliminan la mayor parte de los pixeles que no pertenecen al n´ ucleo. Los resultados obtenidos despu´es de hacer esta umbralizaci´ on se observan en la Figura 6.8. El filtro inicial aplicado a las im´agenes m´as claras produce resultados como los que se muestran en la Figura 6.9, mientras que al aplicarse a im´agenes obscuras se obtienen los resultados mostrados en la Figura 6.10, donde como se puede observar la segmentaci´ on no es buena, pues el n´ ucleo se encuentra parcial o totalmente oculto. Tambi´en se hicieron pruebas a im´agenes de c´elulas semi-destru´ıdas, no importando lo claro u obscuro que ´estas sean. Los resultados de ´estas pruebas se muestran en la Figura 6.11. Un peque˜ no subconjunto de la clase segmentados presenta un n´ ucleo muy dividido, cuando se aplica sobre este tipo el filtro se obtienen los resultados que aparecen en la Figura 6.12. Despu´es de observar los efectos de la aplicaci´on de este primer filtro, a continuaci´ on se muestran los resultados conseguidos durante el dise˜ no y uso del segundo filtro, que como

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

100

Pixeles

Canal R 3000

200

2000

100

1000

Pixeles

0

Pixeles

0

100

200

0

100

2000

50

1000

0

0

100

200

0 3000

200

2000

100

1000 0

100

200

100

0

100

200

0

0

100

200

0

100

200

0

100

200

0

100

200

200 100

0

100

200

0

0

100

0

100

200

0

3000

300

200

200

2000

100

1000

0

Canal B 200

200

300

0

Pixeles

Canal G

300

0

100

200

0

100

0

100

200

0

Figura 6.7: Histogramas de los canales RGB de 4 tipos de recortes de n´ ucleos. La primera fila de histogramas corresponde a una c´elula Segmentada Eosin´ofila. La segunda fila de histogramas pertenece a una c´elula Segmentada Neutr´ofila. La tercera fila de histogramas es de una c´elula No Segmentada linfoc´ıtica. La cuarta fila es de una c´elula No Segmentada Monoc´ıtica

se dijo en la secci´on 6.1.2, es creado a partir del an´alisis de color de recortes pertenecientes a los 354 n´ ucleos celulares. Tambi´en es importante mencionar que para analizar las propiedades de color en ´estos recortes se requiere una conversi´ on previa del espacio de color RGB al espacio TSL, y posterior a ´esta transformaci´on se utiliza s´olo la informaci´on de los canales T y S, de tal forma que en realidad se trata de un mapeo de R3 (RGB) a R2 (TS). El cambio entre espacios de color, se realiza de acuerdo a las transformaciones correspondientes a la ecuaci´on 5.3, y los resultados se muestran gr´aficamente en la Figura 6.13. Despu´es de esta transformaci´on se separan los canales T y S de cada imagen y se almacena la informaci´on de cada canal en un vector T y S, respectivamente. Posteriormente se construye un vector V T y V S al unir los vectores T y S de los n recortes de n´ ucleos. Esto se observa en la Figura 6.14. Para modelar el color de los recortes de n´ ucleo utilizando la informaci´on de VT y VS, se define la matriz de covarianza Cs a partir de 5.8 y se obtiene el vector de medias Vm utilizando 5.7.

6.1 Pruebas

Figura 6.8: Resultados del filtro inicial. a).- C´elula Segmentada Eosin´ofila. b).C´elula Segmentada Neutr´ofila. c).- C´elula No Segmentada linfoc´ıtica. d).- C´elula No Segmentada Monoc´ıtica

Figura 6.9: Resultados del filtro inicial aplicado a im´ agenes muy claras. a).C´elula No Segmentada Monoc´ıtica. b).- C´elula Segmentada Neutr´ofila. c) y d) C´elulas Segmentadas eosin´ofila.

101

102

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

Figura 6.10: Resultados del filtro inicial aplicado a im´ agenes obscuras. La c´elula que esta en la parte superior izquierda es un neutr´ofilo y las dem´as son eosin´ofilos, ambas pertenecientes a la clase segmentados.

Figura 6.11: Resultados del filtro inicial aplicado a im´ agenes de c´ elulas semidestruidas. En este caso la claridad no se considera.

103

6.1 Pruebas

Figura 6.12: Resultados del filtro inicial aplicado a im´ agenes de c´ elulas con el n´ ucleo muy dividido. En este caso la claridad no se considera.

Figura 6.13: Conversi´ on del espacio de color RGB a TSL.

Figura 6.14: Uni´ on de los vectores T y S de los n Recortes de n´ ucleos.

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

104

A continuaci´on se muestran los vectores VT y VS correspondientes a los recortes de n´ ucleos de las 354 obervaciones. · VT =

¸ 0.3371 0.3371 0.3371 0.3375 0.3382 0.3382 0.3430 0.3477 ... 0.3481

· VS =

¸ 3.6535 3.6535 3.6535 3.6522 3.5163 3.5163 3.5452 3.5731 ... 3.5750

La matriz de covarianza Cs y el vector de medias Vm que se obtienen con los vectores anteriores son:





 0.0001 −0.0214  Cs =   −0.0214 5.8557 · Vm =

(6.1)

¸T 0.0922 22.8193

(6.2)

Para medir la similitud entre 2 pixeles,uno que pertenece a la imagen que recibe el filtro y otro que forma parte de un recorte de n´ ucleo y definir un umbral que clasifique al primero de ellos como n´ ucleo se utiliza la m´etrica de la Distancia de Mahalanobis |λ2i,j | definida por la ecuaci´on 5.10. Esta m´etrica es u ´til debido a que toma en cuenta la correlaci´on entre las variables multidimensionales que se consideran en este trabajo, el Tono y la Saturaci´ on. En la Figura 6.15 se muestra la correlaci´on que existe entre los vectores Tono T y Saturaci´on S. De ´esta manera |λ2i,j | esta definida como una matriz que contiene las medidas de similitud de cada pixel pixel(i,j) de la imagen a filtrar al vector de medias Vm . Para definir el umbral primero se normaliza el valor de |λ2i,j | utilizando 5.11. Despu´es de esta normalizaci´on se define el umbral para decidir si el pixel(i,j) forma parte del n´ ucleo, es decir, Si |λ2i,j | > 0.7 entonces pixel(i,j) = N U CLEO

(6.3)

El valor de 0.7 se obtuvo por experimentaci´ on considerando que una distancia de 1.0 representa un pixel que no pertenece al n´ ucleo. Para eliminar los pixeles que aun permanecen de forma aislada en la imagen, se aplica

105

6.1 Pruebas

Figura 6.15: Correlaci´ on entre las variables Tono y Saturaci´ on correspondientes a los vectores T y S, respectivamente. Los valores de T son normalizados. Filtro inicial

Imagen Original

F. de Mahalanobis

F. de la mediana

20

20

20

20

40

40

40

40

60

60 20

40

60

60 20

40

60

60 20

40

60

20

40

60

Figura 6.16: Resultados de la segmentaci´ on del n´ ucleo de un monocito.

un filtro de mediana utilizando una ventana de 9x9 pixeles. El tama˜ no de la ventana se eligi´o despu´es de probar con otros tama˜ nos y observar que este tama˜ no elimina la mayor cantidad de pixeles aislados sin afectar significativamente la forma de la regi´on filtrada. En la figura 6.16 se muestran los resultados de la etapa de segmentaci´ on para un tipo de c´elula no segmentada.

6.1.3.

Extracci´ on de caracter´ısticas

Como se ha mencionado en cap´ıtulos anteriores, la extracci´on de caracter´ısticas es muy importante en el proceso de identificaci´ on de los objetos de inter´es, en este trabajo los objetos de inter´es son los n´ ucleos c´elulares.

106

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

El an´alisis que se realiz´o a la imagen en la secci´on 6.1.2, permiti´o extraer la regi´on que corresponde al n´ ucleo de la c´elula sin afectar significativamente su forma. La extracci´on de caracter´ısticas se realiza tomando como entrada la imagen obtenida en la secci´on anterior, sin embargo en algunos casos aun despu´es de aplicar los filtros se˜ nalados se obtienen im´agenes que contienen m´as de una regi´on etiquetada como n´ ucleo. En estos casos, la regi´on que se considera para extraer las caracter´ısticas es la que presenta una mayor ´area. La cantidad de observaciones que se utilizaron para construir las matrices de caracter´ısticas estructurales, estructurales con an´ alisis de varianza y radiales fue de 220; 110 para cada tipo de c´elula, esto es debido a que se cuenta con 232 ejemplares de la clase Segmentados, casi el doble que para las c´elulas del tipo No segmentados cuyo n´ umero es de 122. Como se menciona en [Katz, 2000], para evitar un sobreentrenamiento de la red hacia una clase espec´ıfica se considera igual n´ umero de ejemplares. Los resultados contemplan 3 tipos de experimentos fundamentales. En cada caso se trata del uso de un conjunto distinto de caracter´ısticas para describir la forma de la regi´on nuclear. El primer experimento esta enfocado al uso de las caracter´ısticas estructurales, el segundo utiliza caracter´ısticas estructurales con an´ alisis de varianza y el tercero se realiza con las caracter´ısticas radiales, siendo ´estas u ´ltimas mucho m´as en n´ umero que las estructurales. En el primer experimento se considera el conjunto de 13 caracter´ısticas estructurales que se muestran en la Figura 5.12, entre las que se encuentran: n´ umero de regiones, eccentricidad, solidez, extremos de la imagen, longitud del eje mayor, longitud del eje menor, n´ umero de Euler, orientaci´on, di´ametro equivalente, ´area del bounding box, relaci´on de ejes, diferencia de ´areas y varianza de los radios. Con estos atributos, la matriz de caracter´ısticas que se obtiene es la que se muestra en la Figura 6.17, donde el acomodo de las caracter´ısticas para cada clase se realiza de manera intercalada denot´andose como S a la clase Segmentados y como N a la clase No Segmentados. Esta es la matriz de caracter´ısticas estructurales utilizada en el primer

6.1 Pruebas

107

Figura 6.17: Matriz de caracter´ısticas estructurales. Las columnas denotadas con Si representan a las caracter´ısticas de c´ elulas Segmentadas mientras que las que se denotan con Ni indican a las caracter´ısticas de c´ elulas No Segmentadas.

experimento. Como prueba adicional, se obtiene un nuevo conjunto reducido de caracter´ısticas estructurales al aplicar la t´ecnica de PCA descrita en la secci´on 3.2.2. Despu´es de reducir la matriz de caracter´ısticas estructurales mostrada en la Figura 6.17, disminuyen a 8 los atributos3 con los que se construye una nueva matriz de caracter´ısticas estructurales. El segundo experimento esta encaminado hacia el uso de lo que en este trabajo se han denominado caracter´ısticas estructurales con an´ alisis de varianza, obtenidas en la secci´on 5.3.3. Este conjunto de 8 caracter´ısticas se muestran en la tabla 5.4 e incluye las siguientes: ´area de la regi´on, longitud de eje mayor, longitud de eje menor, orientaci´ on, ´area de Bounding Box, ´area del Convex Hull, di´ametro equivalente y diferencia de ´areas. Con ´estas caracter´ısticas y de forma similar a como se hizo en el primer experimento, se construye la matriz de caracter´ısticas estructurales con an´ alisis de varianza (ver Figura 6.18). En este caso tambi´en se aplic´o PCA al conjunto de 8 caracter´ısticas estructurales con an´ alisis de varianza, obteniendo un nuevo conjunto de s´olo 4 atributos (componentes principales). 3 en realidad se trata de 8 componentes principales, ya que PCA al reducir no permite conocer cu´ ales fueron las caracter´ısticas seleccionadas.

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

108

Figura 6.18: Matriz de caracter´ısticas estructurales con an´ alisis de varianza.

El tercer experimento utiliza 2 conjuntos distintos de 111 caracter´ısticas radiales, dado que para construir la matriz de caracter´ısticas es necesario tener igual n´ umero de atributos para las 354 observaciones. El problema en el caso de las caracter´ısticas radiales, es que existen un n´ umero distinto de caracter´ısticas para cada observaci´ on, por lo cual se utilizan dos formas de escalar el n´ umero de atributos a el valor m´ınimo de caracter´ısticas encontrado en las 354 observaciones, que es de 111. De ´esta manera, al utilizar las 2 formas de escalamiento descritas en la secci´on 5.3.3: escalamiento aleatorio y escalamiento con transformaci´ on lineal, se obtienen 2 conjuntos de caracter´ısticas radiales. Utilizando el procedimiento descrito en el primer experimento para la construcci´on de la matriz se caracter´ısticas, se obtienen las matrices de caracter´ısticas radiales, una para cada tipo de escalamiento. En la Figura 6.19 se observa la estructura de la matriz de caracter´ısticas radiales, en la cual se utiliza un escalamiento con trasformaci´on lineal. Del mismo modo que en experimentos anteriores, se aplica PCA a las matrices de caracter´ısticas radiales para construir nuevas matrices de caracter´ısticas reducidas. Esta prueba permite evaluar tambi´en a cada conjunto de caracter´ısticas radiales, generadas con distintas formas de escalamiento. Es de esperarse que las caracter´ısticas estructurales describan de una mejor manera la forma de las regi´on nuclear. Sin embargo este no es el caso, como se comenta en las secciones siguientes.

6.1 Pruebas

109

Figura 6.19: Matriz de caracter´ısticas radiales utilizando escalamiento con transformaci´ on lineal.

6.1.4.

Entrenamiento de la Red Neuronal

Para entrenar a la red neuronal con los subconjuntos de caracter´ısticas obtenidos en la secci´on anterior se probaron distintas funciones para entrenamiento y funciones de transferencia, las cuales se muestran en la Figura 6.20, obteniendo un mejor desempe˜ no con el gradiente escalado conjugado y la funci´on de transferencia logsig. El conjunto de caracter´ısticas utilizadas para esta prueba, corresponde a las caracter´ısticas estructurales con an´ alisis de varianza. En la tabla 5.4 se enlistan dichas caracter´ısticas . De las 354 observaciones que se obtuvieron, se utiliza igual n´ umero de cada clase para la experimentaci´on, en este caso 110 de cada tipo, dejando el resto para pruebas adicionales. Cabe hacer notar que las pruebas suplementarias se realizan con diferente n´ umero de muestras para cada clase, ya que no se cuenta con igual n´ umero de muestras para cada tipo de leucocito, adem´as de que se trata de ejemplares no utilizados durante la fase de entrenamiento. Las muestras utilizadas para pruebas adicionales son 134, de las cuales 122 son de la clase Segmentados y 22 de la clase No segmentados. De las 110 observaciones obtenidas para cada clase, la red neuronal se entrena con 9/10,

110

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

Figura 6.20: Tipos de entrenamiento y funciones de transferencia.

Figura 6.21: Distribuci´ on de las observaciones para la experimentaci´ on.

es decir con 99 observaciones de cada tipo. En la Figura 6.21 se muestra la distribuci´on del n´ umero de observaciones que se utilizan en cada caso. Como se puede observar, se cuenta 232 observaciones para la clase de c´elulas Segmentadas, casi el doble que de c´elulas No segmentadas. Esto se debe a que para la clase No segmentadas, se consideran dos subtipos de leucocitos y uno de ellos, por naturaleza representa s´olo un 5 % aproximadamente del total de las c´elulas que forman la sangre (ver Figura 3.3, secci´on 3.1.1). La Figura 6.22 indica la cantidad de cada subtipo de leucocito utilizada para cada clase de c´elula. En todos los experimentos los datos fueron desordenados aleatoriamente respecto de las columnas, de tal forma que tanto los datos de entrenamiento como los de prueba no

111

6.1 Pruebas

Figura 6.22: Distribuci´ on de las observaciones por clase.

posean caracter´ısticas particulares que pudieran influir en los resultados. Adem´as, para validar el desempe˜ no de la red se utiliz´o la t´ecnica de Ten Fold Cross Validation –TFCV–, tomando 10 % de las 110 observaciones de cada clase para prueba y el 90 % restante para entrenamiento. De esta manera, en el primer experimento con 13 caracter´ısticas estructurales la matriz de caracter´ısticas es de 13x99, mientras que para las pruebas se utiliza una matriz de 13x11, es decir 99 datos para entrenamiento y 11 para prueba. Cuando se aplica reducci´on con PCA se obtienen 8 componentes principales, con los cuales se entrena a la red. Las pruebas adicionales realizadas como parte de este primer experimento se realizan con 122 datos de la clase Segmentados y 12 datos de la clase No segmentados arrojando un ´ındice de reconocimiento de 81.34 % cuando se aplica PCA antes de entrenar a la red neuronal y 76.11 % cuando no se aplica. N´otese que estos datos son totalmente distintos a los utilizados durante el entrenamiento. El segundo experimento hace uso de 8 caracter´ısticas estructurales con an´ alisis de varianza, de tal manera que la matriz de caracter´ısticas de entrada es de 8x99, y la de prueba de 8x11. De igual forma que en el primer experimento, se prueba tambi´en con otro conjunto de caracter´ısticas que se obtienen al reducir con PCA; en este caso la reducci´on genera 4 componentes principales. Sin embargo, en este caso los resultados no mejoran como se puede ver en la Figura 6.23. Por otro lado, las pruebas realizadas con los 134 ejemplares separados en un principio

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

112

Figura 6.23: Resultados de las configuraciones utilizando diferentes observaciones de c´ elulas Segmentadas y No Segmentadas.

arrojan un 79.85 % cuando no se aplica PCA y un 67.16 % cuando se utiliza reducci´on. En el tercer experimento se utilizan las caracter´ısticas radiales considerando una matriz de caracter´ısticas de 111x99, dejando para prueba una matriz de 111x11 datos. En un primer caso, se entrena con las caracter´ısticas que se obtuvieron al hacer un escalamiento aleatorio, mientras que en otro caso se entrena con las caracter´ısticas generadas al realizar un escalamiento con transformaci´on lineal. Las pruebas adicionales realizadas como parte de este tercer experimento para los 2 grupos de caracter´ısticas: las extra´ıdas con escalamiento aleatorio y las extra´ıdas con escalamiento lineal, se realizan igualmente con 122 datos de la clase Segmentados y 12 datos de la clase No segmentados arrojando un ´ındice de reconocimiento de 100.00 % cuando se aplica PCA antes de entrenar a la red neuronal y 100.00 % cuando no se aplica para ambos grupos de caracter´ısticas. Los resultados que se obtienen despu´es de los entrenamientos realizados en los 3 experimentos se muestran en la Figura 6.23. Como se puede observar, los mejores ´ındices de reconocimiento se obtienen cuando se utilizan como descriptores de forma a las caracter´ısticas radiales aplicando PCA antes de entrenar la red. La gr´afica del comportamiento en el entrenamiento se puede ver en la Figura 6.24. Es importante decir que los resultados mostrados en la Figura 6.24 corresponden al promedio de 10 pruebas realizadas con la t´ecnica TFCV para cada caso, adem´as que la

113

6.2 An´ alisis de resultados

ENTRENAMIENTO CON CARACTERISTICAS ESTRUCTURALES 10 10 sin PCA con PCA 5

ERROR

10

0

10

−5

10

−10

10−1 0 1100

2

10 EPOCAS

4

10

Figura 6.24: Comportamiento de entrenamiento utilizando diferentes observaciones de c´ elulas Segmentadas y No Segmentadas con caracter´ısticas estructurales y radiales.

selecci´on de las 110 observaciones utilizadas en los experimentos respectivos es aleatoria para cada una de las 10 veces que se realiz´o la t´ecnica de TFCV.

6.2.

An´ alisis de resultados

Retomando el diagrama mostrado en la Figura 5.1, se pueden realizar algunos comentarios para cada fase del m´etodo usado para la identificaci´ on y clasificaci´on de leucocitos. Los resultados obtenidos en la fase de adquisici´on de las muestras son satisfactorios, dado que la calidad de las im´agenes es buena para el an´alisis propuesto, pues en todas ellas es posible diferenciar claramente al n´ ucleo del resto de la escena. La t´ecnica de segmentaci´on utilizada es buena. Permiti´ o extraer los n´ ucleos celulares sin afectar su forma significativamente. Al utilizar la distancia de Mahalanobis como medida de similitud, se logr´o calcular la diferencia del color del n´ ucleo de un leucocito, respecto al color promedio de los n´ ucleos de un conjunto de 354 leucocitos utilizados en la fase de experimentaci´on. Por otro lado, con el uso de ´esta m´etrica es posible considerar la correlaci´on que existe en los canales T y S, que se utilizaron para modelar el color caracter´ıstico del n´ ucleo de los leucocitos. Despu´es de hacer un an´alisis visual de las im´agenes se observ´o que la aplicaci´on del filtro

114

´ 6 PRUEBAS Y ANALISIS DE RESULTADOS

inicial se puede omitir, dado que al aplicar el filtro creado con el modelo de Mahalanobis los resultados son buenos. Como consecuencia de una buena segmentaci´ on se extrajeron caracter´ısticas que permiten clasificar adecuadamente a la c´elula como leucocito Segmentado o leucocito No segmentado. Respecto a la extracci´on y selecci´on de caracter´ısticas, al observar los resultados obtenidos con los descriptores de Fourier haciendo un an´alisis visual de la simetr´ıa en las gr´aficas de los vectores caracter´ısticos, se hace notar la posibilidad de trabajar con la mitad de los datos que constituyen los descriptores de Fourier sin afectar los resultados de forma significativa. Por este motivo los resultados obtenidos al aplicar PCA fueron muy similares a los obtenidos cuando no se aplic´o. Los tipos de escalamiento utilizados para el ajuste del tama˜ no de los vectores que almacenan los descriptores de Fourier resultaron igualmente u ´tiles; por una parte el escalamiento lineal permite elegir de manera m´as equivativa los pixeles que forman el nuevo vector reducido, mientras que con el escalamiento aleatorio se eligen de manera distribuida a dichos pixeles. En la extracci´on de caracter´ısticas estructurales resulta interesante observar que el an´alisis de caracter´ısticas con an´alisis de varianza arroja buenos resultados, permitiendo trabajar con un conjunto m´as peque˜ no de datos y adem´as saber cu´ales son las caracter´ısticas m´as apropiadas para describir la forma del n´ ucleo, lo cual no es posible cuando se usa PCA como m´etodo de reducci´on. La t´ecnica de an´alisis de varianzas propuesta en este trabajo de tesis constituye una nueva t´ecnica de selecci´on de caracter´ısticas, viable de probarse con un conjunto de datos distinto al usado en este trabajo para comprobar la factibilidad de su uso, como m´etodo de selecci´on de caracter´ısticas. Un detalle observado en las caracter´ısticas estructurales con an´ alisis de varianza, es el hecho de que al reducir con PCA y obtener s´olo 4 componentes principales, disminuye el ´ındice de reconocimiento. En cambio en las caracter´ısticas estructurales y radiales ocurre lo contrario, debido posiblemente a que 4 atributos son insuficientes para describir la forma

6.2 An´ alisis de resultados

115

de la regi´on. Al considerar en la fase de pruebas, a un conjunto de muestras totalmente ajeno al utilizado en la fase de entrenamiento, se obtienen buenos resultados. Este hecho confirma la veracidad en los experimentos realizados y garantiza una clasificaci´on adecuada con nuevos conjuntos de muestras. Finalmente, podemos decir que el m´etodo utilizado en esta investigaci´ on es muy u ´til en el an´alisis de espec´ımenes biol´ogicos, ya que es posible hacer distinciones precisas en el an´alisis de color, lo que es de gran importancia en el estudio de ciertas patolog´ıas.

Cap´ıtulo 7

Conclusiones 7.1.

Conclusiones generales

El objetivo principal en este trabajo de tesis fue clasificar a dos tipos de c´elulas de sangre humana empleando t´ecnicas de visi´on por computadora. Al revisar la metodolog´ıa utilizada, es posible observar que no es sencillo emular la capacidad de visi´on que el humano posee y mucho menos igualarla. Por otro lado, se puede notar que los componentes de un sistema de visi´on var´ıan de acuerdo a la aplicaci´on. Durante la fase de adquisici´on de la imagen existieron condiciones que no se lograron controlar como las condiciones de preparaci´on de la muestra, el ´area de trabajo, la iluminaci´on ambiental y la iluminaci´on de la fuente. Considerando estos inconvenientes se opt´o por el uso de t´ecnicas que atenuaran los efectos de dichas variaciones, de esta manera en la fase de segmentaci´ on se crea un modelo de color utilizando el espacio de color TSL propuesto por [Tomaz et al., 2003], obteniendo buenos resultados. Adem´as, la segmentaci´on es casi directa, sin ser estrictamente necesario eliminar primero los elementos del fondo en la imagen. Esto es una importante contribuci´ on para el an´alisis visual de leucocitos, ya que se puede aplicar el algoritmo de segmentaci´ on propuesto en este trabajo de tesis sin necesidad de recalcular la matriz de covarianza y la distancia de Mahalanobis, que se requiere para la umbralizaci´ on de pixeles que pertenecen o no al

118

7 CONCLUSIONES

n´ ucleo de la c´elula, reduciendo el tiempo de c´alculo en an´alisis posteriores. Como el objetivo principal fue clasificar a las c´elulas de acuerdo a su morfolog´ıa nuclear, se opt´o por considerar caracter´ısticas que describieran lo mejor posible, la forma de dicha regi´on. Se pens´o en principio, que al considerar como descriptores a un conjunto reducido de caracter´ısticas estructurales se tendr´ıa una buena descripci´on de la forma y como consecuencia un buen ´ındice de reconocimiento; sin embargo al probar con otro conjunto mayor de caracter´ısticas que se deduce a partir del centroide y el per´ımetro de la regi´on, se logra tener una descripci´on m´as completa de la forma de la regi´on al usar algunas propiedades de la FFT, alcanzando un ´ındice de reconocimiento del 99 %. Tambi´en vale la pena mencionar que los ´ındices de reconocimiento en el caso de las caracter´ısticas estructurales y radiales, mejoraron al aplicar la t´ecnica de PCA antes de entrenar a la red neuronal. En este caso lo que se observa es que el n´ umero de ´epocas se redujo notablemente cuando se preprocesan los datos con PCA, lo cual es de esperarse sobre todo cuando se utilizan las caracter´ısticas radiales, dado que para obtenerlas se aplic´o la FFT y al observar la representaci´on gr´afica de dichas caracter´ısticas es notable la simetr´ıa que hay en dicha gr´afica, lo cual permite suponer que es posible tomar s´olo la mitad de los datos que se observan en dicha gr´afica y considerar a este conjunto como caracter´ısticas radiales. Finalmente se comprob´o una vez m´as que la red neuronal de retroprogaci´on utilizada por [Katz, 2000] es una buena alternativa para la clasificaci´on de c´elulas.

7.2.

Trabajo a Futuro

Existe mucho trabajo que hacer con el tipo de observaciones que se manejan en este trabajo y con la metodolog´ıa utilizada. A continuaci´ on se mencionan algunas propuestas: 1. Sustituir la forma emp´ırica utilizada en el dise˜ no del filtro inicial usado en la segmentaci´on, por un an´alisis de regiones empleando t´ecnicas de agrupaci´on como K-means. 2. Dado que cada c´elula identificada tiene m´as subtipos, al utilizar t´ecnicas de segmentaci´on basada en textura y color para aislar el citoplasma y extraer sus caracater´ısticas,

7.2 Trabajo a Futuro

119

se puede tener una descripci´on m´as completa de la c´elula y esto puede ampliar el n´ umero de clases a reconocer. 3. Agregar un m´odulo que permita adem´as de identificar, contar las c´elulas visualizadas en la escena. 4. Analizar nuevos par´ametros encontrados (valores y vectores caracter´ısticos de la regi´on segmentada) para determinar si representan un patr´on espec´ıfico que permita reconocer una clase. 5. La superposici´on temporal de regiones segmentadas de la misma clase con t´ecnicas de empalmamiento, puede ser u ´til en el an´alisis para determinar el tipo de la c´elula. 6. Implementar una segmentaci´ on semi-autom´atica al definir un espacio de color exclusivo para las im´agenes de frotis sangu´ıneo utilizando la t´ecnica descrita en [Guzm´an, 2002]. 7. Analizar el comportamiento de la l´ogica difusa en el proceso de segmentaci´ on para lograr una mejor descripci´on de la regi´on de inter´es, pues de acuerdo a [Carron, 1995] reporta buenos resultados. 8. Desarrollar una interfaz gr´afica en la que se integran los m´odulos que componen este trabajo de tesis. 9. Promover la aplicaci´on GUI para fines educativos que trabajar´ıa en tiempo real. 10. Utilizar la metodolog´ıa aplicada en este trabajo, como marco de referencia para el desarrollo de aplicaciones similares que persigan la identificaci´ on de otro tipo de objetos de inter´es en el ´area cl´ınica u otras ´areas.

Referencias [Ses, 1999] (1999). Gu´ıa de operaci´ on y mantenimiento b´ asico Sistema K-1000. CIBA CORNING DIAGNOSTICS -MEXICO-, Departamento de Servicio T´ecnico, Zona Centro. M´exico. [Mot, 2004] (2004). Manual de operaci´ on de Moticam 350. Micro-optic industrial group CO; LTD., U.S.A. [Abdallah et al., 1995] Abdallah, M. A., Samu, T. I., and Grissom, W. A. (1995). Automatic target identification using neural networks. [Acosta et al., ] Acosta, B. M., Zuluaga, M. C. A., and Salazar, I. H. Tutorial de redes neuronales. http://ohm.utp.edu.co/neuronales. [Alpaydm, 2004] Alpaydm, E. (2004). Introduction to Machine Learning. [Awcock and R., 1996] Awcock, G. J. and R., T. (1996). Applied Image Processing. [Beckman Coulter, 2006] Beckman Coulter, I. (2006). Contadores hematol´ogicos beckman coulter. http://www.beckmancoulter.com. [Bourgin, 1994] Bourgin, D. (1994). http://www.neuro.sfc.keio.ac.jp. [Carron, 1995] Carron, T. (1995). Segmentation d´ımages coleur dans la base TreinteLuminance-Saturation:approche num´erique et symbolique. [Comaniciu, 2001] Comaniciu, D. (2001). Cell image segmentation for diagnostic pathology. www.caip.rutgers.edu/riul/research/papers/ps/cells.ps.gz.

122

REFERENCIAS

[Cormack, 1997] Cormack, D. H. (1997). Histolog´ıa de HAM. M´exico D.F. [Cortijo, 2001] Cortijo, B. F. J. (2001). Bioestad´ıstica: M´etodos y Aplicaciones. [de la Escalera, 2001] de la Escalera, H. A. (2001). Visi´ on por computador. Fundamentos y M´etodos. [Duda, 2001] Duda, O. R. (2001). Pattern Classification. [Flores, 2001] Flores, P. L. (2001). Recuperaci´ on de im´ agenes combinando redes neuronales y wavelets. Tesis INAOE. [Freggiaro and Espejo, 2006] Freggiaro,

L.

E.

and

Espejo,

R.

(2006).

http://www.forobioquimico.com.ar. [Gal´enica, 2005] Gal´enica (2005). http://www.galenica.cl/tecnologia_vcs.html. [Garc´ıa and Sierra, 2001] Garc´ıa, L. D. and Sierra, J. L. C. (2001).

Bioestad´ıstica.

http://nutriserver.com/cursos. [Gonz´alez and Woods, 1996] Gonz´alez, R. C. and Woods, R. E. (1996). Tratamiento Digital de im´ agenes. [Goodrich and Tamassia, 2003] Goodrich, M. T. and Tamassia, R. (2003). Data etructures and algorithms in Java. [Guzm´an, 1997] Guzm´an, D. L. A. (1997). Etude d´espaces couleur pour la segmentation et l´ aide ´ al´ analyse. Th´ese Doctorale. [Guzm´an, 2002] Guzm´an, D. L. A. (2002). Procesamiento digital de im´agenes colposc´opicas. [Hair et al., 2001] Hair, J. F., Rolph, A. E. J., and Tatham, R. L. (2001). An´ alisis multivariante. [Hen and Hwang, 2002] Hen, H. Y. and Hwang, J.-N. (2002). Handbook of neural network signal processing.

REFERENCIAS

123

[Hunke, 1994] Hunke, M. H. (1994). Locating and tracking of human faces with neural networks. [Katz, 2000] Katz, A. R. J. (2000). Image analysis and supervised learning in the automated differentiation of white blood cells from microscopic images. Master’s thesis. [Kohavi, 1995] Kohavi, R. (1995). A study of cross validation and bootstrap for accuracy estimation and model selection. [MathWorks, 2000] MathWorks, T. I. (2000). Matlab 6.0.0.88. [Mitchell, 1997] Mitchell, T. M. (1997). Machine Learning. [Moore, 2001] Moore, A. W. (2001). Cross validation for detecting and preventing overfitting. http://www-2.cs.cmu.edu/~awm/tutorials/overfit.html. [Oppenheim, 1998] Oppenheim (1998). Manual para t´ecnicos de laboratorio. M´exico D.F. [Pajares and de la Cruz, 2002] Pajares, G. and de la Cruz, J. M. (2002). Vision por computador. Im´ agenes digitales y aplicaciones. [Pal and Pal, 1993] Pal, N. R. and Pal, S. K. (1993). A review on Image Segmentation Techniques, volume Vol. 26 No. 9. [Pratt, 1978] Pratt, W. K. (1978). Digital Image Processing. [P´erez and Hague, 2002] P´erez, L. G. and Hague, J. M. T. (2002). Dynamic threshold selection for image segmentation of natural structures based upon a performance criterion. [Reyes, 2005] Reyes, G. O. F. (2005). Clasificaci´ on de llantos de beb´es para identificaci´ on de hipoacusia y asfixia por medio de un sistema h´ıbrido (gen´etico-neuronal). Tesis ITA. [S´anchez, 2006] S´anchez, J. (2006). Revista creces. portal de tecnolog´ıa, ciencias y biolog´ıa. http://www.tcb.cl. [Schapira and Arroyo, 1994] Schapira, A. and Arroyo, I. (1994). Cells++. un contador de c´elulas. http://www.ubp.edu.ar/investigacion/revista7/art6.html.

124

REFERENCIAS

[Sinha, 2002] Sinha, N. (2002). Blood cell segmentation using em algorithm. [Solano, 2002] Solano, M. R. (2002). Modelado y reconocimiento de objetos usando apariencia y multieigenespacios particionados. Tesis INAOE. [Swokowski, 1989] Swokowski, E. W. (1989). C´ alculo con geometr´ıa anal´ıtica. [Terrillon and Akamatsu, 2000] Terrillon, J. and Akamatsu, S. (2000). Comparative performance of different chrominance spaces for color segmentation and detection of human faces in complex scene images. [Terrillon et al., 1998] Terrillon, J., David, M., and Akamatsu, S. (1998). Automatic detection of human faces in natural scene images by use of a skin color model and of invariant moments. [Terrillon et al., 2000] Terrillon, J., Shirazi, M., Fukamachi, H., and Akamatsu, S. (2000). Comparative performance of different skin chrominance models and chrominance spaces for the automatic detection of human faces in color images. [Tomaz et al., 2003] Tomaz, F., Candeias, T., and Shahbazkia, H. (2003). Improved automatic skin detection in color images. [Urdiales, 2002] Urdiales, C. (2002). http://campusvirtual.uma.es/TRcolor.PDF. [Ushizima et al., 2004] Ushizima, D., Da-Fontoura, L., Rizzatti, E., and Zago, M.-A. (2004). A texture approach to leukocyte recognition. [Webner, 2006] Webner,

D.

(2006).

Enciclopedia

m´edica

en

espa˜ nol.

http://www.nlm.nih.gov. [Wikipedia Foundation, 2006] Wikipedia Foundation, I. (2006). Wikipedia enciclopedia libre. http://es.wikipedia.org. [Woodliff and Herrmann, 1993] Woodliff, H. J. and Herrmann, R. (1993). Hematolog´ıa Cl´ınica. M´exico D.F.

REFERENCIAS

125

[Yang and Waibel, 1995] Yang, J. and Waibel, A. (1995). Tracking human faces in real time.

Ap´ endice A

Espacios de color El uso de color como descriptor para la segmentaci´ on de una imagen resulta importante en la extracci´on de caracter´ısticas. A continuaci´ on se definen algunos t´erminos empleados en el an´alisis del color. Brillo.- sensaci´on que indica si un ´area es m´as o menos iluminada. Tono.- sensaci´on que indica si un ´area parece similar al rojo, amarillo, verde o azul, o a una porci´on de dos de ellos. Coloraci´ on.- sensaci´on por la que un ´area tiene mayor o menor tono. Luminosidad.- brillo de una zona respecto a otra blanca en la imagen. Croma.- Coloridad de un ´area respecto al brillo de un blanco de referencia. Saturaci´ on.- relaci´on entre la coloraci´on y el brillo. Los par´ametros ps´ıquicos en la percepci´on del color son la luminosidad, el tono, y la saturaci´on. Un espacio de color es un m´etodo por el que se puede especificar, crear o visualizar cualquier color. A continuaci´ on se describen algunos espacios de color que son importantes para la colorimetr´ıa [Urdiales, 2002].

128

A.1.

A ESPACIOS DE COLOR

Espacio RGB

Este espacio de color se basa en la combinaci´ on de tres se˜ nales de luminancia crom´atica: el rojo, el verde y el azul (Red, Green, Blue). La manera de obtener un color espec´ıfico(X) consiste en determinar qu´e cantidad de cada uno de ellos (R, G, B) se necesita para obtenerlo.

X =R+G+B

(1.1)

Cuando una c´amara capta una imagen en color, para cada pixel en color se tienen en realidad tres, uno por cada componente (RGB), es decir, la longitud de onda de cada color b´asico. El inconveniente de este modelo es que en sus tres valores mezcla la informaci´on del color (tono y saturaci´on) y la intensidad.

A.2.

Espacio TSL

Los componentes fundamentales de este espacio de color son el Tinte, la Saturaci´ on y la Luminosidad. El tinte se puede relacionar con la longitud de onda como par´ametro, la luminosidad habla de la energ´ıa del color y la saturaci´ on habla de la pureza del color, es decir qu´e tan mezclado con el color blanco se encuentra dicho color. Este sistema fue propuesto por Munsell [Pratt, 1978], como un modelo de la percepci´on humana del color y tambi´en es conocido como sistema bi-c´onico debido a su construcci´on espacial [Guzm´an, 2002]. En la Figura A.1 se muestra la organizaci´on del espacio de color propuesto por Munsell.

A.3.

Espacio HSI

En este espacio caracteriza el color en t´erminos de tono o tinte (Hue), saturaci´on o cromatismo (Saturation) y brillo (Intensity). As´ı, de dos fuentes de luz con el mismo espectro, aquella que tenga mayor intensidad aparecer´a m´as brillante. Aunque, dos objetos de igual intensidad no siempre tienen el mismo brillo. La saturaci´on describe la blancura de un color. Las transformaciones matem´aticas que permiten el cambio del espacio RGB

A.3 Espacio HSI

Figura A.1: Diagrama esquem´ atico de los 3 ejes del sistema de color Munsell.Tomado de Hall, E.L. Computer Image Processing and Recognition. Academic Press, New York. 1979

129

130

A ESPACIOS DE COLOR

a HSI son las siguientes: R+G+B 3 √ 3(G − B) ) H = arctan( (R − G) + (R − B) I=

S =1−

min(R, G, B) 3

(1.1) (1.2) (1.3)

Las variaciones de este espacio de color son: HSL (Hue Saturation Lightness) HSV (Hue Saturation Value) HCI (Hue Croma/Colourfulness Lightness) HVC (Hue Value Croma) TSD (Hue Saturation Durkness) Las desventajas de este modelo son: 1. La no linealidad de las transformaciones realizadas, lo cual implica un elevado costo computacional. 2. La singularidad existente en el entorno del eje definido por R=G=B (Saturaci´on=0), que provoca que los valores obtenidos por el tono sean inestables.

A.4.

Los espacios XYZ, Luv, Lab

El espacio de color XYZ evita los coeficientes negativos obtenidos en los modelos anteriores para algunas coloraciones de determinada longitud de onda; que es causa de una fuente de error importante en los c´alculos colorim´etricos. En el modelo XYZ, la componente Y representa la luminosidad y XZ la coloraci´on. Este espacio es independiente del dispositivo utilizado y generalmente se trabaja con valores normalizados entre cero y uno. Este espacio constituye el llamado Diagrama Internacional XY, CIE o carta crom´atica xy. Y una vez obtenidas las coordenadas XYZ se pueden construir diferentes espacios CIES,

A.5 Los espacios de color YIQ, YUV, YCbCr y YCC

131

como Luv y Lab en los que la informaci´on se descompone en tono, cromatismo e intensidad del color. Espacio Luv Este modelo se defini´o en 1976, con la finalidad de obtener m´as uniformidad y precisi´on en la representaci´on del color. Posee 3 componentes: L, u and v. El componente L define la luminancia, mientras que u y v definen la crominancia. CIE Luv es muy utilizado en c´alculo de colores peque˜ nos o diferencias de color, especialmente con colores aditivos. En [Bourgin, 1994] se pueden encontrar las ecuaciones para la transformaci´on a este espacio de color a partir del espacio XYZ.

A.5.

Los espacios de color YIQ, YUV, YCbCr y YCC

En estos espacios se trabaja con la luminancia (luminosidad) y la crominancia (color). Estan muy relacionados con los sistemas de color para la televisi´on.

A.6.

El espacio CMY(K)

Est´a formado por C´ıan, Magenta, Amarillo y Negro. Se utiliza en la impresi´on y fotograf´ıas, por lo que depende del dispositivo (impresora). Para obtener los equivalentes respectivos, se resta de las componentes el color blanco en el caso de CMY, o el negro para CMYK.

132

A ESPACIOS DE COLOR

Ap´ endice B

Galer´ıa de im´ agenes En este apartado se ha colocado la base de datos recopilada y utilizada en este trabajo de investigaci´on, esperando sea u ´til para trabajos futuros. Como se menciona en cap´ıtulos anteriores, las muestras biol´ogicas se prepararon con sangre de pacientes normales, es decir, se excluyeron espec´ımenes que presentan patolog´ıas que pudieran ocasionar la presencia de formas anormales de c´elulas y de sus ´organos internos, como en el caso de la leucemia. Tambi´en es posible apreciar los efectos provocados por los cambios de iluminaci´on que fueron imposibles de controlar en el momento de la digitalizaci´on de las muestras. Esto debido, a los ajustes que son necesarios para enfocar a la imagen y obtener una mejor apreciaci´on de su composici´on interna.

134

´ DE IMAGENES ´ B GALERIA

Figura B.1: Leucocitos segmentados: Eosin´ ofilos. (Contin´ ua)

135

Figura B.2: Leucocitos segmentados: Eosin´ ofilos. (Continuaci´on)

136

´ DE IMAGENES ´ B GALERIA

Figura B.3: Leucocitos segmentados: Neutr´ ofilos. (Contin´ ua)

137

Figura B.4: Leucocitos segmentados: Neutr´ ofilos. (Continuaci´on)

138

´ DE IMAGENES ´ B GALERIA

Figura B.5: Leucocitos no segmentados: Linfocitos. (Contin´ ua)

139

Figura B.6: Leucocitos no segmentados: Linfocitos. (Continuaci´on)

Figura B.7: Leucocitos no segmentados: Monocitos.

140

´ DE IMAGENES ´ B GALERIA

Figura B.8: Casos especiales. En b1 y b2 se observan c´elulas bas´ofilas pertenecientes a la clase segmentados, es un tipo de c´elula que por su rareza fue exclu´ıda de las pruebas hechas en la investigaci´on. DOSe66-n contiene abajo un neutr´ofilo peque˜ no, arriba un eosin´ ofilo con el n´ ucleo parcialmente destruido y distribuido en el citoplasma. DOSe103mono muestra arriba a la izquierda un eosin´ofilo y abajo a la derecha un monocito. En DOSl40mono3 se observa arriba a la derecha un monocito y abajo a la izquierda un linfocito. DOSn28linfo10 arriba a la derecha presenta un neutr´ofilo grande y abajo a la izquierda un linfocito.

Ap´ endice C

Listado de m´ odulos que componen el m´ etodo de clasificaci´ on A continuaci´on se describe el nombre y la descripci´on de los principales funciones programadas en este trabajo de investigaci´ on. En la tabla C.1 se enlistan los nombres de las principales funciones implementadas, mientras que en el disco anexo al final de esta tesis, se encuentran los c´odigos adicionales para algunas variantes de funciones contenidas en la tabla, como la funci´on escalarIMG que presenta dos funciones relacionadas llamadas escalarNUCLEOS y escalarCUT.

142

´ ´ ´ C LISTADO DE MODULOS QUE COMPONEN EL METODO DE CLASIFICACION

´ DESCRIPCION

NOMBRE escalarIMG getfeatures disMaha RGBtoTSL unirfeatures filtroinicial getpromRGBmodif2006 getNrad muestrearRADIS predatosNET2crossViguales predatosNET2crossIguVAR2 FFTradis4mues

su funci´on es escalar una imagen a un tama˜ no de 64x64 pixeles. obtiene caracter´ısticas de la regi´on de inter´es devuelve imagen filtrada con modelo de Mahalanobis convierte imagen del espacio RGB al espacio TSL construye los vectores de caracter´ısticas estructurales aplica filtro inicial a la imagen recibida como entrada determina l´ımites de crecimiento de histogramas en RGB obtiene el n´ umero de puntos que forman el per´ımetro de una regi´on realiza el escalamiento caracter´ısticas radiales entrena red neuronal con caracter´ısticas estructurales entrena red neuronal con caracter´ısticas estructurales con an´alisis de varianza entrena red neuronal con caracter´ısticas estructurales

Tabla C.1: Principales funciones programadas

´Indice alfab´ etico An´alisis, 6, 8, 12, 20, 25, 60, 68, 82, 95, 109, Microscopio, 2, 6, 12, 70, 72, 73, 81, 96 113 C´elula, 2 anatom´ıa, 11 fisiolog´ıa, 11 Citolog´ıa, 11

Modelo, 117 Muestras, 5, 73, 94, 109, 113, 133 N´ ucleo, 75 Patr´ on, 19, 22, 37, 42, 44 PCA, 25, 26, 29, 68, 94, 107, 108, 111, 112,

Citoplasma, 11, 12 Color, 98, 127 Distancia, 35, 68, 80, 104, 117 eucl´ıdea, 24 Mahalanobis, 23, 24, 57, 104, 113 radial, 86, 91 Estad´ıstica, 11, 25, 31 Filtro, 27, 80, 99, 104, 105, 113, 118 inicial, 75, 99 mediana, 30 Fourier, 8, 59, 89, 91, 114 Hematolog´ıa, 11

114, 118 Procesamiento computacional, 73 im´ agenes, 11, 38, 59, 70 Recuento Diferencial, 1, 13, 15 Redes neuronales, 11 Regi´ on, 27, 28, 69, 80 Segmentaci´ on, 6, 27–30, 54, 58, 60, 62, 68, 73, 75, 81, 98, 113, 118 autom´ atica, 8 semi-autom´ atica, 26 T´ecnicas, 26, 31, 59

Leucocitos, 5, 13, 69 Membrana, 7, 11

agrupaci´ on, 118 clasificaci´ on, 31

´ ´ INDICE ALFABETICO

144 empalmamiento, 119 escalamiento, 87 segmentaci´on, 27, 29, 118 validaci´on, 11, 50 visi´on, 3, 5, 6, 117 Varianza, 20, 22, 25

Related Documents


More Documents from ""