Procesamiento de imágenes: ¿Qué son las oclusiones?


Estoy desarrollando un proyecto de procesamiento de imágenes y me encuentro con la palabra oclusión en muchos artículos científicos, ¿qué significan las oclusiones en el contexto del procesamiento de imágenes? El diccionario solo da una definición general. ¿Puede alguien describirlos usando una imagen como contexto?

Author: kmario23, 2010-05-04

4 answers

Oclusión significa que hay algo que desea ver, pero no puede debido a alguna propiedad de la configuración del sensor, o algún evento. Exactamente cómo se manifiesta o cómo lidias con el problema variará debido al problema en cuestión.

Algunos ejemplos:

Si está desarrollando un sistema que rastrea objetos (personas, autos,...) entonces se produce la oclusión si un objeto que está siguiendo está oculto (ocluido) por otro objeto. Como dos personas caminando una junto a la otra, o un coche que conduce bajo un puente. El problema en este caso es lo que haces cuando un objeto desaparece y reaparece de nuevo.

Si está utilizando una cámara de rango , entonces la oclusión son áreas donde no tiene ninguna información. Algunas cámaras de rango láser funcionan transmitiendo un rayo láser a la superficie que está examinando y luego tienen una configuración de cámara que identifica el punto de impacto de ese láser en la imagen resultante. Eso da las coordenadas 3D de ese punto. Obstante, dado que la cámara y el láser no están necesariamente alineados, puede haber puntos en la superficie examinada que la cámara puede ver, pero el láser no puede golpear (oclusión). El problema aquí es más una cuestión de configuración del sensor.

Lo mismo puede ocurrir en imágenes estéreo si hay partes de la escena que solo son vistas por una de las dos cámaras. Obviamente, no se pueden recopilar datos de rango a partir de estos puntos.

Probablemente haya más ejemplos.

Si especifica su problema, entonces tal vez podamos definir qué es la oclusión en ese caso, y qué problemas conlleva

 96
Author: Hannes Ovrén,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-04-24 15:32:40

El problema de la oclusión es una de las principales razones por las que la visión por computadora es difícil en general. Específicamente, esto es mucho más problemático en Object Tracking. Ver las siguientes figuras:

introduzca la descripción de la imagen aquí

Observe, cómo el rostro de la dama es no completamente visible en marcos 0519 & 0835 a diferencia de la cara en el marco 0005.


Y aquí hay una imagen más donde el rostro del hombre está parcialmente oculto en los tres marco.

oclusión parcial


Observe en la imagen de abajo cómo el seguimiento de la pareja en el cuadro delimitador rojo y verde se pierde en el fotograma central debido a la oclusión (es decir, parcialmente oculto por otra persona frente a ellos) pero se rastrea correctamente en el último fotograma cuando se vuelven ( casi) completamente visibles.

introduzca la descripción de la imagen aquí

Foto cortesía: Stanford, USC

 12
Author: kmario23,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-04-24 16:01:06

La oclusión es la que bloquea nuestra visión. En la imagen que se muestra aquí, podemos ver fácilmente a las personas en la primera fila. Pero la segunda fila es parcialmente visible y la tercera fila es mucho menos visible. Aquí, decimos que la segunda fila está parcialmente ocluida por la primera fila, y la tercera fila está ocluida por la primera y la segunda fila. Podemos ver tales oclusiones en las salas de clase (estudiantes sentados en filas), cruces de tráfico (vehículos esperando la señal), bosques (árboles y plantas), etc., cuando hay un montón de objetos. introduzca la descripción de la imagen aquí

 6
Author: Arun Sooraj,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-07-01 19:56:04

Como las otras respuestas han explicado bien la oclusión, solo agregaré a eso. Básicamente, hay una brecha semántica entre nosotros y las computadoras.

La computadora realmente ve cada imagen como la secuencia de valores, típicamente en el rango 0-255, para cada color en la imagen RGB. Estos valores se indexan en forma de (fila, col) para cada punto de la imagen. Así que si los objetos cambian su posición w. r. t la cámara donde se esconde algún aspecto del objeto (permite que las manos de una persona no se muestran), la computadora verá diferentes números (o bordes o cualquier otra característica), por lo que esto cambiará para que el algoritmo de la computadora detecte, reconozca o rastree el objeto.

 1
Author: altaf ur Rahman,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2018-04-29 06:34:20