
El pasado 10 marzo del presente año, Héctor Daniel Vázquez Delgado, doctorando del TecNM campus Tuxtla gutiérrez, presentó su examen de grado para obtener el título de Doctor en Ciencias de la Ingeniería con el trabajo de tesis “Algoritmo de Visión estéreo para la cadencia de video con FPGA”, el cual aprobó de manera satisfactoria.
Daniel Vázquez, propone en su tesis de grado un algoritmo de coincidencia estéreo integrado en una FPGA (Field Programmable Gate Arrays).

“La visión estéreo se centra en evaluar la profundidad de la ubicación de los objetos en una escena, basándose en dos o más puntos de vista, tal como lo hacen nuestros ojos. Los algoritmos procesan dos imágenes en escala de grises rectificadas como entrada y producen un mapa de disparidad. Este algoritmo se ha aplicado en detección de objetos o robots autónomos. En visión estéreo, para tomar decisiones en tiempo real, se requiere un intensivo procesamiento de hardware”. Detalló Vázquez Delgado.
Así mismo, destacó que como primer paso se realizó la estimación de mapas de disparidad con diferentes tamaños de ventana, utilizando la suma de diferencias absolutas (SAD) como métrica de correlación local. En el segundo paso, una vez que se obtienen los mapas de disparidad, se calcula la consistencia izquierda-derecha para cada tamaño de ventana. Posteriormente, en el paso tres, se estima una medida de similitud del pixel central y sus vecinos a través de una ventana de 5 × 5 y se extrae el gradiente de Sobel de la imagen de la izquierda.
En el cuarto paso los parámetros son procesados utilizando un Sistema de inferencia Difusa (FIS, por sus siglas en inglés), que combina las disparidades calculadas y genera un mapa de disparidad final. Finalmente, en el paso 5 se establece una arquitectura integrada en FPGA. Los resultados demostraron que esta formulación algorítmica proporciona resultados con mayor similitud al mapa de verdad en comparación con el estado actual de la técnica.

“Este proyecto se puede utilizar para la estimación de profundidades, talvez en casos más complejos como en cirugías. Ya hay algoritmos que se están implementado de este tipo para navegación autónoma, como son los vehículos no tripulados (drones o vehículos Tesla) que utilizan un campo de visión” compartió Daniel Vázquez.
Remarcó que el dispositivo que utilizó para su proyecto es de bajo costo en comparación a los que se encuentran en el mercado, ya que el FPGA propuesto por el ahora Doctor, vale de 3 mil a 4 mil pesos, mientras que otros dispositivos llegan a costar entre 15 mil hasta más de medio millón.

Este proyecto se elaboró en conjunto con el estudiante de maestría, Marco Antonio Palacios Ramos; teniendo como asesor de Tesis al Dr. Madaín Pérez Patricio.
“Ciencia y Tecnología con Sentido Humano”
Departamento de Comunicación y Difusión
TecNM campus Tuxtla Gutiérrez