RECONOCIMIENTO DE PATRONES

Enunciados de la Tarea 1, Tarea 2 y Tarea 3.

Tarea 1 (ENTREGA: Lunes 02/04/18 a las 10:30pm)

Objetivo

Diseñar un reconocedor automático de cinco caracteres en diferentes fonts.

Descripción

En estas dos imágenes (Training1 y Training2) se encuentran representaciones binarias de los caracteres W, +, &, H, @. Extraiga características de estos caracteres de tal forma que se pueda diseñar un clasificador que determine de manera automática cuál de ellos es. La idea es que Ud. diseñe el clasificador usando sólo estas dos imágenes, y que pruebe el desempeño en esta imágen de prueba Testing.

NUEVO!!! Las imágenes segmentadas se encuentran aquí (gracias a Gabriel Duran). Leer readme.txt con la descripción.

Ud. deberá entregar un informe de dos a 4 páginas en formato pdf en el que explique cómo realizó la extracción de características y la clasificación. Deberá incluir un gráfico del espacio de características y/o histogramas, en los que se aprecie la separación de las clases. Además deberá incluir la matriz de confusión, así como indicar el desempeño del clasificador, es decir qué porcentaje de letras se clasificaron correctamente. En un anexo deberá incluir el código del programa que utilizó.

No está permitido usar clasificadores ni extractores de características de Balu, ni de otros paquetes. Esta permitido usar funciones de procesamiento de imágenes tales como segmentación y operaciones morfológicas.

[ Enviar Tarea ]

 


Tarea 2 

(ENTREGA: Miércoles 09/05/18 a las 11:00pm)

Objetivo

Estudiar y analizar técnicas de selección de características.

En esta tarea trabajaremos con un subset de la base de datos VGG-Face y se puede desargar aquí (8GB). Este subset cuenta con 500 sujetos y cada uno tiene más de 100 fotos frontales de su cara. En esta tarea se usarán las primeras 10 imágenes de los primeros 60 sujetos para la selección de características. En esta etapa se deberá extraer características basadas en Local Binary Pattern, Haralick, Gabor y otras más que usted desee (por ejemplo algunas no vistas en clase como BSIF, LPQ, Haar, etc. u otras mencionadas en este paper). Usando este conjunto de datos (10 imágenes de 60 sujetos) se deberá seleccionar un máximo de 100 características, para ellos se deberá probar con dos algoritmos de selección (SFS y otro a elección) y dos algoritmos de transformación (PCA y otro a elección -como PLSR no visto en clases-). El entrenamiento del clasificador se realizará usando las 100 características seleccionadas extraidas en las 9 primeras imágenes de los sujetos 101, 102, ... 150. El testing se realizará con la imagen 10 de los sujetos 101, 102, ... 150. Como clasificador se deberá usar KNN con el número de vecinos que estime conveniente. Se debe reportar el porcentaje de éxito en la clasificación en las 50 imágenes de testing. Está permitido usar Balu u otras librerías que realicen la extracción de características y el clasificador KNN. No está permitido usar librerías de reconocimiento de caras, de reconocimiento de objetos, ni características extraídas de una red entrenada tipo deep learning o similar.

En la entrega deberá subir el código de

- código de extracción de características, 

- archivo con las características extraídas,

- código de selección de características,

- archivo de las características seleccionadas,

- codigo de clasificación.

(ver Informe Tipo para la Tarea 1)

Enviar Tarea ]

 

 


 

Tarea 3 (ENTREGA: Viernes 01/06/18 6:30pm)

Objetivo

Realizar un clasificador de la edad de una persona en 7 clases:

1: menos de 1 año

2: 1 o más años pero menos de 10

3: 10 o más años pero menos de 16

4: 16 o más años pero menos de 28

5: 28 o más años pero menos de 51

6: 51 o más años pero menos de 75

7: 75 o más años

Descripción

En esta base de datos existen 240 fotos faciales de cada una de las 7 clases mencionadas. Las fotos tienen el siguiente nombre de archivo: face_00X_NNNN.png, donde X es la clase (1, 2, ... 7), y el número NNNN es un número correlativo 00001, 00002, 00003, ... 00240 para las 240 imágenes por grupo etáreo. Diseñe un clasificador usando las primeras 200 fotos de cada clase (es decir X=1,2, ... 7 y las imágenes NNNN = 0001, ... , 0200), y pruebe el clasificador en las últimas 40 imágenes (es decir genero X=1,2, ... 7 y las imágenes NNNN = 0201, ... , 0240).

Restricciones: la solución deberá incluir extracción de características, selección de características y clasificación. Se podrá usar sólo los algoritmos vistos en clase a excepción de deep learning.

Informe: explicar la importancia de un sistema automático para reconocer de edad, explicar cada uno de los métodos empleados, hacer un diagrama con la solución propuesta, incluir la matriz de confusión obtenida en el set de pruebas y el desempeño (porcentaje de fotos bien clasificadas en el set de pruebas), incluir análisis de los resultados indicando mejoras futuras y conclusiones.

[ Enviar Tarea ]