PROCESAMIENTO DE IMAGENES

Proyecto

El proyecto del curso corresponde al 30% de la nota final del curso. Con la realización de este proyecto se persigue que lo/as alumno/as puedan entender, diseñar e implementar la solución a un problema real.  El proyecto se llevará a cabo en grupos de dos personas.

El tema del proyecto para este semestre 2017-2 es la restauración de imágenes de baja calidad de caras, con el fin de poder realizar un mejor reconocimiento de las caras. Las imágenes pertencen a la base de datos AR-LQ y pueden ser bajadas con propósitos de educación e investigación en este directorio de dropbox. La base de datos cuenta con 1200 imágenes (12 imágenes de 100 sujetos). Para cada sujeto existen dos fotos de control C0 y C1 (dos fotos distintas de buena calidad del mismo sujeto); así mismo existen por cada sujeto cinco imágenes borrosas B1, B2, B3, B4 y B5 (con distintos grados de borrosidad) y cinco imágenes de baja resolución L1, L2, L3, L4 y L5 (con distintas resoluciones) como se muestra en la figura:

DB_ARQ.png

 

Las imágenes B1 ... B5, L1 ... L5, son imágenes de baja calidad tomadas de la imagen C0.

En verificación de caras la idea es decidir si dos fotos de caras pertenecen a la misma persona o no. Con este fin se utiliza un descriptor (vector de muchos elementos) que describe la foto de una cara, si las fotos pertenecen a la misma persona los descriptores son similares, en caso contrario los descriptores son distintos. Esta comparación la hace la función matching que simplemente calcula la norma de la diferencia de ambos descriptores, como se presenta en la siguiente figura.

GeneralSchema.png

 

En el proyecto, para la descripción de las caras  se debe usar la función facedescriptor . Esta función calcula un descriptor de 1475 elementos de una imagen de 165 x 120 pixeles.

En este proyecto Ud. tendrá que diseñar el procesamiento f1 y f2 de la figura de tal forma de maximizar la diferencia entre fotos de distintas personas y minimizar la diferencia entre fotos de la misma persona. La métrica de desempeño será la conocida como Equal Error Rate, que puede ser calculada usando este código en Matlab. Ver explicación en presentación PowerPoint vista en la clase del 14/nov.

El descriptor de la cara se basa en Local Binary Patterns (LBP) implementado en este código de Matlab: Bfx_lbp (esta es la última versión de LBP implementada en Balu).

Para el avance se debe llenar esta slide y enviar a domingo.mery@uc.cl antes del jueves 16/nov a las 10:45am (después de las 10:45 no se reciben). La slide se presenta el jueves a las 11:30am. 

Material de Apoyo:

- Paper que mide el nivel de "blurriness" de una imagen: Pertuz, S., Puig, D., & Garcia, M. A. (2013). Analysis of focus measure %  operators for shape-from-focus. Pattern Recognition, 46(5), 1415-1432. (Codigo Matlab: método WAVR hace una buena estimación)