Pablo Barrera González: Investigación
Trabajos de Investigación
También hay vídeos con los principales resultados de estos trabajos.
METS (Multi-Eye Tracking System) y seguimiento tridimensional
METS es la aplicación principal desarrollada en mi tesis doctoral. Su objetivo es realizar el seguimiento de varios objetos al mismo tiempo usando para ello dos o más cámaras digitales.
Emplear dos o más cámaras nos permite la estimación directa de la posición 3D de un objeto, siempre y cuando seamos capaces de localizar el mismo objeto en cada una de las imágenes de las cámaras. Este proceso, el emparejamiento, puede resultar muy complejo lo que se traduce en un alto coste computacional. Como alternativa podemos trabajar directamente en el espacio tridimensional, realizar hipótesis sobre la posición del objeto y, posteriormente, validar cada una de las hipótesis usando para ello la información obtenida de las cámaras.
Como se muestra en este vídeo, el sistema es capaz de localizar cuatro objetos diferentes en posiciones estáticas. Dichos objetos aparecen y desaparecen de la escena y aún así el sistema es capaz de identificar su número y posición de manera correcta. El sistema proporciona una estimación para cada objeto tan pronto como éste aparece en la escena. Su velocidad de localización se debe a la utilización de una técnica de abducción. Ésta coloca nuevas hipótesis en las regiones en las que hay más probabilidad de que se encuentre un objeto. En caso contrario la localización de nuevos objetos resulta demasiado lenta, como se puede apreciar en este vídeo, dónde la técnica de abducción no está presente.
Aplicaciones de vídeovigilancia
El seguimiento tridimensional se puede aplicar para los sistemas de vigilancia basados en vídeo. En este proyecto empleamos cuatro cámaras convencionales conectadas a un servidor remoto para localizar tridimensionalmente la posición de una persona dentro de una habitación. Empleando las mismas técnicas desarrolladas en Mets, somos capaces de usar la información de la posición de cada persona para activar diferentes alarmas.
Este vídeo se corresponde a una aplicación de videovigilancia propiamente dicha. Detecta cuándo una persona está demasiado cerca de un área restringida y, en ese momento, activa una alarma. Si se aproxima otra persona que no cumple con los requisitos de tamaño y color, la alarma no se activa. La última versión también es capaz de seguir varias personas al mismo tiempo.
En este caso el sistema intenta localizar personas que han caído al suelo usando una estimación tridimensional de su posición. Al obtener una estimación 3D precisa de la posición de la persona resulta directo calcular la altura a la que se encuentra. Cuando la altura baja hasta el suelo el sistema activa la alarma.
Atención visual
En este proyecto hemos realizado un sistema de navegación visual que emplean técnicas de atención visual y de reconstrucción 3D ligera. El robot es capaz de mover las cámaras para localizar marcas visuales y obstáculos potenciales en su entorno, como pueden ser paredes. Una vez que las ha localizado, el sistema las añade a una representación 3D interna del mundo que resulta útil para navegar de manera segura por él. El sistema también mueve las cámaras para asegurarse de que los objetos añadidos a la representación del mundo se mantienen en las posiciones esperadas.
