Reconstrucción 3D de humanos a partir de imágenes

  • Victoria Fernández Abrevaya – Max Planck Institute for Intelligent Systems.

La estimación de la forma tridimensional de humanos a partir de imágenes o video es una tarea central para muchas aplicaciones, cubriendo áreas tales como AR/VR, telepresencia y entretenimiento, por nombrar algunas. Se trata de un desafío importante, ya que la recuperación de información 3D a partir de sensores 2D es esencialmente un problema ambiguo y mal condicionado. En el caso de humanos, la solución tradicional consiste en construir modelos estadísticos usando bases de datos de scans 3D (por ejemplo, de cuerpos o rostros), los cuales se ajustan luego a datos de la imágen tales como el color del pixel, puntos clave, siluetas, etc. Recientemente, los algoritmos de ajuste basados en optimización han sido reemplazados por métodos de regresión que aprovechan técnicas modernas de aprendizaje profundo, entrenando redes neuronales de forma supervisada o autosupervisada, mejorando de esta manera la performance ante situaciones difíciles así como el tiempo computacional requerido. Este curso ofrecerá una introducción y una visión general de las técnicas clásicas y actuales para la estimación de la estructura 3D de humanos a partir de imágenes o video, con especial atención a métodos que tratan específicamente el cuerpo y el rostro.

Idioma: Español

Requisitos: Conocimientos básicos de machine learning y redes neuronales (el curso no cubre una introducción a los mismos). Álgebra lineal. Python