Visión por Computador

VISION POR COMPUTADOR

El objetivo del curso es que el alumno pueda comprender la modelación geométrica del mundo tridimensional a través de vistas bidimensionales. Con esta modelación el alumno podrá ser capaz de elaborar algoritmos que i) realicen una reconstrucción del espacio tridimensional a partir de sus vistas, ii) sigan de objetos en secuencias de imágenes y iii) que establezcan correspondencia entre distintas imágenes de la misma escena. Asimismo, es posible llevar a cabo una simulación de una proyección bidimensional de una escena tridimensional en la posición deseada.

Calendario

LECTURA DE ARTÍCULOS

  1. Ma. 27/08/13 (8:00am): Lowe, D.G. (2004): Distinctive Image features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110. [PDF]
  2. Ju. 26/09/13 (8:00am): Sivic, J. & Zisserman, A. (2009): Efficient Visual Search of Videos Cast as Text Retrieval, IEEE Transactions on Pattern Analysis and Machine Intelligence, 31(4):591-605. [PDF]
  3. Ju. 17/10/13 (8:00am): Dalal, N. & Triggs, B. (2005): Histograms of oriented gradients for human detection, Proceedings of the Conference on Computer Vision and Pattern Recognition, Vol. 1, 886-893. [PDF]

 

 TAREAS

  1. Ju. 12/09/13 (6:30pm) Construcción de fotos panorámicas.
  2. Lu. 28/11/13 (6:30pm) Sistema de múltiples vistas.

PROYECTO 

  1. Lu. 04/11/13 (6:30pm) Estado del Arte
  2. NO HAY Definición del proyecto (sin estado del arte)
  3. Ma. 19/11/13 (11:30am) Presentación de avances
  4. Vi. 06/12/13 (6:30pm) Paper
  5. Lu-Ma. 09-10/11/13 (9am-6pm) Presentación Final

Proyecto:

El proyecto del curso consiste en la realización de un programa que sea capaz de seguir personas en un sistema de visión por computador estéreo de dos vistas calibradas. Las secuencias de imágenes se encuentran disponibles en los siguientes links:

El usuario deberá marcar con el mouse un bounding box de una persona (o una parte de ella) en alguna imagen de la secuencia de la cámara 1 (ó 2), y el algoritmo de tracking deberá seguir a esta persona en los siguientes frames, idealemnte hasta que salga del campo visual. La salida del algoritmo será un bounding box en ambas cámaras en los siguientes frames indicando dónde se encuentra la persona que se está siguiendo. El algoritmo deberá usar técninas de tracking monocular e incluir información estéreo que haga más robusto el seguimiento. Se deberán entregar métricas de desempeño (cuántas personas se siguen con éxito, cuántas no, etc.).

Al final del curso, los grupos deben entregar un informe, hacer una presentación y una "demo" mostrando el funcionamiento del algoritmo (ver más detalles aquí).