1
Reconocimiento de Rostros mediante Puntos Caracter´ısticos Locales Alexander Ocsa M. , Alexander Rodriguez V. , Herbert Chuctaya H. , Gabriel Humpire M. ´ entre dos m´etodos de extraccion ´ de caracter´ısticas locales. La Resumen — Este art´ıculo presenta una comparacion ´ de puntos caracter´ısticos locales en los rostros usa la t´ecnica Active Shape Model (ASM). propuesta para la identificacion El primer m´etodo crea el vector caracter´ıstica considerando las distancias que forman en el grafo de Delaunay sobre ´ localizada donde los puntos localizados por ASM . El segundo m´etodo, con los mismos puntos se define una region cada punto caracter´ıstico de 7x7 pixeles sirve para formar vectores caracter´ısticas de componentes Wavelets en base a una familia de transformadas Wavelet en distintas escalas y orientaciones. Este enfoque permite que la propuesta ´ traslacion ´ y escala. Con las caracter´ısticas obtenidas se realiza una comparacion ´ param´etrica sea invariante a rotacion, con los vectores de las im´agenes almacenadas en la base de datos conformantes de un conjunto de entrenamiento. Los experimentos fueron hechos con la base de datos de BioIDFaceDataBase, con el cual se obtuvo un grado promedio de reconocimiento de 93 % (m´etodo 1) y 96 % (m´etodo 2). T´erminos de indexacion ´ — Reconocimiento facial, ASM, gabor, wavelets
1.
Introduccion ´
´ humana, la forma m´as sencilla de Desde la percepcion reconocer personas es mediante el rostro, este tiene carac´ ter´ısticas unicas como la distancia entre los ojos, anchura ´ de la nariz, forma de la barbilla, pomulos, forma de la boca, etc. ´ de personas en una imagen o v´ıdeo es La deteccion un tema ambicioso desde hace ya bastante tiempo, y ca´ ante entornos cada da vez se exige una mayor precision vez m´as dif´ıciles. Daidi [12] explica el principal problema que se presenta es que las caracter´ısticas del rostro var´ıan ˜ modificaciones de la posicion ´ o gestos del en pequenas rostro. Aplicaciones como: sistema de seguridad, identi´ de criminales, control fronterizo de emigrantes, ficacion evitar suplantaciones por p´erdida de documentos, etc utilizan t´ecnicas de reconocimiento de rostros. En intentos de solucionar estas problem´aticas surgen t´ecnicas como Active Shape Model (ASM) , Principal Component Analysis (PCA) y Active Appearance Model (AMM) descritos por Taylor [3]. Estas t´ecnicas pueden ser clasificados en m´etodos basados en caracter´ısticas locales que generalmente usan distancias biom´etricas y globales que ´ consideran el todo de la imagen para extraer informacion acerca del color y la textura. Las t´ecnicas basados en caracter´ısticas globales consideran caracter´ısticas generales de la imagen m´as no consideran el contenido espec´ıfico de la imagen que es un rostro. Una de los formas de responder consultas sobre una base de datos de rostros de forma r´apida es usando M´etodos de Acceso. En general las comunidades de Recu´ de Informacion ´ usan M´etodos de Acceso debido peracion ´ a sus extensas bases de datos en una forma eficiente aun en dimensiones grandes. ´ Por otro lado, la busqueda por similitud ha sido ampliamente usada en muchas a´ reas de las ciencias de ˜ Cesar A. Beltr´an Castanon es Presidente de la Sociedad Peruana ´ (SPC) ,profesor en la Universidad Nacional de San de Computacion ´ Agust´ın (UNSA) y Universidad Catolica Santa Mar´ıa (UCSM)
´ la computacion, tales como mineria de datos, bioin´ de video. Los M´etodos de Acceso form´atica y compresion M´etrico (MAM) son considerados buenos para resolver ´ ˜ busquedas por similitud ya que son disenadas para trabajar sobre espacios m´etricos reduciendo el costo de la ´ busqueda. En este trabajo presentamos un estudio comparativo entre dos t´ecnicas basado en caracter´ısticas locales. El componente principal de este trabajo es el uso de ASM ´ de puntos locales. Los como t´ecnica para la identificacion ´ de experimentos se realizaron comparando la precision los resultados luego de hacer consultas de los K vecinos m´as cercanos sobre un M´etodo de Acceso M´etrico. El art´ıculo esta estructurado de la siguiente forma : en ´ 2 se ver´a el estado del arte, en la seccion ´ 3 nuesla seccion ´ 4 los resultados finalizando en tra propuesta, en la seccion ´ 5 las conclusiones de los resultados del articulo. la seccion
2.
Estado del Arte
Son varios los problemas que se presentan al realizar reconocimiento de rostros en im´agenes como: la detec´ del rostro y busqueda ´ cion de la persona a la que m´as ´ se asemejan las caracter´ısticas extra´ıdas. En esta seccion se discutir´a de manera general los trabajos relacionados a esta a´ rea. Ver Zhao [11] que es un survey sobre el estado del arte en reconocimiento de rostros. Existen varios modelos para tratar este problema, estos son explicados ampliamente por Taylor [3], donde de´ sobre ASM , PCA y AMM. Para fine amplia informacion obtener mayor detalle Taylor [2] muestra una comparativa en el tiempo entre los metodos ASM y AAM. D. Cristinacce y N. Butcher [4] ASM muestran estudio comparativo entre un conventional feature detector classifier y boosted regression predictor. El primer modelo que aprende a discriminar funciones entre la apariencia y caracter´ısticas entre los m´as cercanos. El segundo modelo aprende a relacionar entre las apariencias de vecinos lo-
Published by SCGI 2008
2
Figura 1: Diagrama de contexto de nuestra propuesta ´ de caracter´ısticas verdadera. cales de una localizacion Para el reconocimiento existen varios compendios que explican el estado del arte se puede ver en [11] en el que ´ del rostro y su repexplica varios temas sobre la deteccion ´ J. Buhmann Et.Al. [6] y Lades Et.Al. [7] usan resentacion. ´ de caracter´ısticas. Wavelets de Gabor para la extraccion ´ del grafo creado por los En cuanto a la representacion nodos obtenidos por la plantilla del modelo Face Bunch Graph presenta una “arquitectura” robusta de un grafo que asocia a cada nodo un conjunto jets (valores imaginarios) de caracter´ısticas de Gabor explicado por Wiskott [9] en el articulo Face recognition by elastic bunch graph matching. Asi mismo, Changbo Hu y Rogerio Feris [5] definen al modelo ASM como un m´etodo que detecta puntos ´ por medio de una busqueda acotada en modelos de formas globales, con aprendizaje estad´ıstico de un conjunto ´ gede entrenamiento, una forma, es aquella informacion ´ o om´etrica que cuando se ha quitado la escala, posicion ´ sigue siendo la misma. Por tanto ASM tambi´en rotacion puede ser utilizado como plantilla de modelo al igual que Face Bunch Graph. El a´ rbol Slim tree propuesto por Traina ´ basado en Jr [1] introduce un nuevo algoritmo de division Minimum spanning tree (MST) e introduce un medidor de solapamiento llamado Fat-factor. El algoritmo Slim-down es usado para reducir el grado de solapamiento, haciendo el a´ rbol m´etrico m´as eficiente de esta manera mejora las consultas y funcionamiento.
3.
Propuesta
En la figura 1 se presenta el diagrama de contexto donde se muestra los pasos de los procesos que se ir´an detallando en las siguientes secciones.
3.1.
Ubicacion ´ de puntos en rostros con Active Shape Model (ASM)
´ de los puntos caracter´ısticos en el rosPara la ubicacion tro se usa Active Shape Model (ASM) que crea un modelo de las caracter´ısticas que se desee encontrar. Este modelo esta definido por una serie de puntos(v´ertices), as´ı como ´ entre los puntos(aristas). Examina la region ´ la conexion alrededor de cada punto encontrado en la imagen para encontrar la mejor “opcion“ en la imagen que se ajuste a los dem´as puntos. El modelo es emparejado de punto a punto para ubicar de una forma adecuada los puntos ´ se realiza utilizando los sobre la imagen. La adecuacion bordes de imagen. En la figura 2 se muestra como se extraen algunas caracter´ısticas de la imagen a tratar, posteriormente dichas caracter´ısticas ser´an analizadas por el modelo ASM para determinar si dicho objeto es un rostro. Para identificar ´ del roslos puntos locales es necesario detectar la region tro en la imagen utilizando el algoritmo Haar Cascade. El e´ xito de localizar los puntos caracter´ısticos depende de la ´ del rostro. correcta deteccion
Figura 2: Extracci´on de caracter´ısticas de una imagen tras tener previamente detectada el a´ rea del rostro. En la figura 3 se muestra los puntos extra´ıdos por ASM, ´ variables de configuracion ´ estos puntos se ubican segun del algoritmo, se procede ubicando una plantilla sobre la parte de la imagen que contiene un rostro.
3
3.3.
Figura 3: Plantilla de ASM que debe ser aplicada a un rostro y tratar de ubicar las mejores posiciones para obtener los respectivos puntos representativos
Una vez obtenidos los puntos, se procede a localizar los ojos para realizar el escalamiento de modo que todos los grafos resultantes tengan la misma distancia.
3.2.
Creacion ´ del Grafo
Procesamiento con Wavelets de Gabor
´ de puntos locales esta basado en la La representacion transformada Wavelet de Gabor. La transformada de Ga˜ con el cual es posibor realiza un an´alisis de la senal ble representar en cada instante de tiempo, las compo˜ Se trata pues de un dominio tiemponentes de la senal. frecuencia. Los wavelet de Gavor son formados multipli´ Gausiana. La funcion ´ cando un senoide con una funcion Gaussiana tiene un efecto limitador, aqu´ı los valores de cada pixel cercanos a un punto caracter´ıstico del rostro ´ contribuyen a la convolucion. ´ para los kerEl conjunto de coeficientes de convolucion ´ y escala sobre cada punto nels de diferentes orientacion caracter´ıstico forma el vector de caracter´ıstica local. ´ de valCada componente wavelet describe una seccion ores en escala a grises en una imagen I(x) alrededor de un pixel x = (x, y). Este esta basado en la transformada ´ de Gabor, definido como una convolucion.
En la figura 4 se muestra el resultado de aplicar el algoritmo de Delaunay Triangulation (DT) [8] tomando como puntos referenciales los ubicados por el algoritmo ASM.
3.4.
Extraccion ´ de Caracter´ısticas
Figura 4: La plantilla Active Shape Model (ASM) que se muestra en diferentes a´ ngulos En la figura 5 se muestra un ejemplo de un rostro que fue solapado por los puntos encontrados con ASM y la respectiva malla creada por el paso anterior.
Figura 6: Para la realizaci´on de una consulta se extraen las caracter´ısticas del rostro en base a los puntos locales identificados por Active Shape Model (ASM), luego se procede a hacer la consulta por similitud en la base de datos con vector caracter´ıstica obtenido
Figura 5: Un rostro ubicado por la plantilla de Active Shape Model (ASM) y el mallado creado por el algoritmo de Delaunay que ser´a usado para poder extraer las caracter´ısticas usando Gabor
´ de caracter´ısticas es una parte fundamenLa extraccion tal de un sistema de reconocimiento de personas. Este ´ de formas particulares para rostros tiene la informacion diferentes. En el presente trabajo se considera 68 puntos extra´ıdos del rostro que ubican el contorno del rostro, las cejas, ojos, nariz y boca. En la Figura 6 se muestra el proceso general de una consulta considerando tanto la ex´ de caracter´ısticas y la comparacion ´ con los datos traccion indexados.
4
BioID, disponible en la web en http://www.bioid.com/ downloads/facedb/. La base de datos BioID es mostrada en la figura 8 tiene las siguientes caracter´ısticas:
Figura 7: Para cada rostro encontrado se crea una grafo con los puntos de Active Shape Model (ASM) Con los puntos locales obtenidos con ASM se genera el grafo de Delaunay correspondiente. Los vectores caracter´ısticos son obtenidos de dos formas:
Figura 8: Base de datos BioID.
1. Por cada persona se tiene 10 im´agenes 2. Vista frontal de los rostros.
1. Considerando las distancias que forman en el grafo de Delaunay formado con los puntos localizados con ASM.
3. Un total de 1521 im´agenes.
´ local2. Con los mismos puntos se define una region izada donde por cada punto caracter´ıstico del rostro ˜ 7x7, que fue (x, y) se forma una matriz de tamano determinada emp´ıricamente, cuyo centro es (x, y). Los componentes Wavelets son formados por medio ´ de los componentes wavelets de de la interpolacion ´ que define la matriz. Estos componecada posicion nentes wavelets son obtenidos luego de usar una familia de transformadas Wavelet a distintas escalas y orientaciones. Se utiliza la parte real e imaginaria, con 5 escalas y 8 orientaciones diferentes. El resultado contiene 40 coeficientes que consisten en componentes wavelets para cada punto caracter´ıstico del rostro. Los valores de escalas que son usados var´ıan de [−1 : 1] en un factor de 0,5. Las orientaciones son ´ multiplos de π/8.
´ de luz. 5. Variacion
Entonces obtenemos dos tipos de vectores caracter´ısticas: (1) En base a las distancias de las aristas del grafo de Delaunay (caracter´ısticas locales en base a distancias) (2) Los componentes wavelets por cada nodo del grafo de Delaunay (caracter´ısticas locales en base a wavelets). La m´etrica utilizada es la distancia euclideana para ambos m´etodos comparando distancias entre las aristas para el m´etodo 1 y el valor de la amplitud obtenido en base al valor real e imaginario para el m´etodo 2.
4.
Experimentos
Para los experimentos se usaron im´agenes de rostros de una base de datos libre que pertenece a FGnet project of the European Working Group llamada
4. Un total de 23 personas distintas.
´ de 384x286 pixeles 6. Resolucion 7. Im´agenes en escala gray. 8. Expresiones faciales (Ojos abiertos, Ojos cerrados, Sonriente, Triste) 9. Formato PGM. 10. Detalles faciales (Con lentes, Sin lentes). Se tomo 3 conjuntos de prueba para hacer las comparaciones, cada conjunto de prueba esta constituido por un grupo de 10 im´agenes de una misma persona en distin´ posicion, ´ rotacion ´ y/o tas circunstancias de iluminacion, escala. Se realizo´ dos tipos de experimentos. En el primero se ´ de caracter´ısticas en base a las disle utilizo extraccion tancias entre las aristas del grafo y el segundo se le hizo un an´alisis de las im´agenes aplicando la transformada de wavelets de Gabor. En [10] se propone el uso de un solo punto como parte de los puntos caracter´ısticos del rostro para obtener los vectores caracter´ısticos locales utilizando Gabor [7], a diferencia de nuestra propuesta al usar una matriz de 7x7 obteniendo mejores resultados. En el cuadro 1 se muestra resultados generales comparando ambas t´ecnicas. En las gr´aficas 9 (a), 9 (b), 9 (c) de Recall And Precision ´ de cada t´ecnica sobre se determina el grado de precision distintos conjuntos de prueba.
5
Test Test1 Test2 Test3
CLDistancias 90.85 95.55 92.42
CLGabor 94.86 98.50 96.86
Cuadro 1: Resultados de grados de reconocimiento promedio para los distintos conjuntos de prueba. Estos resultados est´an en base a una consulta 1-Nearest Neighbor
5.
(a)
Conclusiones
En este art´ıculo se compara dos m´etodos de extrac´ de caracter´ısticas locales para el reconocimiento de cion rostros basado en Active Shape Model (ASM). Primero se identifica puntos caracter´ısticos del rostro, en base a eso se construye el grafo de Delaunay, el primer m´etodo utiliza las distancias obtenidas de las aristas del grafo, el segundo m´etodo se basa en componentes wavelets identificados por cada punto caracter´ıstico del rostro luego de aplicar una serie de transformadas wavelets a distintas escalas y orientaciones. Este enfoque permite que nuestra propuesta sea invariante a distintas funciones de trans´ como son: rotacion, ´ escala y traslacion. ´ formacion A diferencia del trabajo [10], en vez de Face Bunch Graph como plantilla del modelo a utilizar para generar el grafo de caracter´ısticas locales este trabajo utiliza ASM. Adem´as la propuesta hace uso de una matriz de 7x7 identificada de manera emp´ırica con el cual se consigue mejores resultados. Los experimentos muestran un grado promedio de reconocimiento de 93 % para el primer m´etodo y 96 % para el segundo m´etodo. El segundo m´etodo tiene un grado de reconocimiento mayor para mayores grados de recall, pero con un costo de procesamiento de datos m´as alto. Para trabajos futuros se investigar´a sobre los par´amet´ para ambas t´ecnicas comparandolo ros de optimizacion con m´etodos basado en caracter´ısticas globales, como por ´ como Principal ejemplo t´ecnicas basados en proyeccion Component Analysis (PCA).
Agradecimientos Los autores agradecen al Profesor C´esar Beltr´an por su apoyo y consejos.
Referencias [1] Jr. C. Traina, A. Traina, C. Faloutsos, and B. Seeger. Fast indexing and visualization of metric data sets using slimtrees. IEEE Trans. on Knowl. and Data Eng., 14(2):244–260, 2002. [2] T.F. Cootes and C.J.Taylor. Timeline of developments in asms and aams. In Imaging Science and Biomedical Engineering, Manchester M13 9PT, U.K., 2003. http://www.isbe. man.ac.uk/~bim/refs.html.
(b)
(c) Figura 9: Gr´aficas Precision and Recall comparando las t´ecnicas CLDistancias y CLGabor (a) Conjunto de prueba 1 (b) Conjunto de prueba 2 (c) Conjunto de prueba 3 [3] T.F. Cootes and C.J.Taylor. Statistical models of appearance for computer vision. In Imaging Science and Biomedical Engineering, Manchester M13 9PT, U.K., 2004. http: //www.isbe.man.ac.uk/~bim/refs.html. [4] D. Cristinacce and T. Cootes. Boosted regression active shape models. In 18th British Machine Vision Conference, Warwick, UK, pages 880–889, 2007. [5] Changbo Hu, Rogerio Feris, and Matthew Turk. Real-time view-based face alignment using active wavelet networks. In AMFG ’03: Proceedings of the IEEE International Workshop on Analysis and Modeling of Faces and Gestures, page 215, Washington, DC, USA, 2003. IEEE Computer Society. [6] M. Lades J. Buhmann and C. von der Malsburg. Size and distortion invariant object recognition by hierarchical graph matching. In Proceedings of The IEEE International Symposium on Workload Characterization (IISWC), pages 411–416, San Diego, CA, September 1990. [7] VORBRUGGEN J.-BUHMANN J. LANGE J. MALSBURG C. V.D. WURTZ R. LADES, M. and W. KONEN. Distortion invariant object recognition in the dynamic link architecture. page 300–311, 1993. [8] Gary L. Miller. A time efficient delaunay refinement algorithm. In SODA ’04: Proceedings of the fifteenth annual ACM-SIAM symposium on Discrete algorithms, pages 400–
6
[9]
[10]
[11]
[12]
409, Philadelphia, PA, USA, 2004. Society for Industrial and Applied Mathematics. FELLOUS J.-M. WISKOTT, L. and C. VON DER MALSBURG. Face recognition by elastic bunch graph matching. page 775–779., 1997. ¨ Laurenz Wiskott, Jean-Marc Fellous, Norbert Kruger, and Christopher von der Malsburg. Face recognition by elastic bunch graph matching. IEEE Trans. Pattern Anal. Mach. Intell., 19(7):775–779, 1997. W. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld. Face recognition: A literature survey. ACM Comput. Surv., 35(4):399–458, 2003. http://doi.acm.org/10. 1145/954339.954342. Daidi Zhong and Irek Def´ee. Performance of similarity measures based on histograms of local image feature vectors. Pattern Recogn. Lett., 28(15):2003–2010, 2007.