¿Dónde empiezo a aprender sobre el procesamiento de imágenes y el reconocimiento de objetos? [cerrado]


Estoy interesado en escribir algunas aplicaciones básicas de reconocimiento de objetos computarizados, así que me imagino que necesito algunos antecedentes teóricos en algoritmos de procesamiento de imágenes, junto con algo de IA para las capacidades de toma de decisiones.

Soy un graduado en ciencias de la computación, y un día planeo obtener mi Maestría, con suerte en uno de estos campos. Mientras tanto, me gustaría tener una ventaja y hacer algo de autoaprendizaje.

Así que mi pregunta es, ¿por dónde empiezo? Apreciaría una flecha en la dirección correcta, algunos enlaces si es posible.

Author: casperOne, 2009-01-11

7 answers

Quizás esté interesado en revisar las respuestas a estas preguntas similares:

 18
Author: Ivan,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2017-05-23 12:18:25

Tal vez echar un vistazo a: OpenCV. Realmente buena biblioteca para el procesamiento de imágenes, y cuando usted sabrá qué utilizar para qué propósito, usted puede echar un vistazo 'bajo el capó' para saber cómo está funcionando:)

 13
Author: rkj,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-01-11 08:45:30

Bienvenido al divertido mundo de la visión por computadora, que es básicamente el campo que trata con el procesamiento de imágenes con algoritmos de IA para hacer reconocimiento/seguimiento/segmentación, etc. Sin ser exhaustivo, todo el trato implica la adquisición de imágenes, el procesamiento de imágenes, la segmentación de imágenes, el reconocimiento de imágenes.

La forma más fácil de comenzar es probablemente OpenCV. Sin embargo, en la mayoría de las aplicaciones, el uso de OpenCV es probablemente excesivo, ya que realmente no es tan difícil comenzar desde cero. Una vez que pasaste la parte de carga de imágenes (probablemente querrías considerar BMP ya que es más fácil de analizar), puedes implementar muchos algoritmos básicos de procesamiento de imágenes si solo tienes la fórmula matemática. También hay otras bibliotecas que probablemente podrías probar, cosas como torchvision, AForge (. NET) son buenas opciones.

Cuando se trata de la parte de IA, aquí es donde las cosas se vuelven interesantes. Es probable que desee utilizar SVM donde hay una serie de bibliotecas que puede utilizar, por ejemplo, libsvm, SVMlight y etc.

 7
Author: Hao Wooi Lim,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-01-12 01:56:21

Si está interesado en libros, le recomiendo "Introducción al procesamiento y análisis de imágenes" de John Russ a un nivel introductorio. También utilicé ImageJ como una buena aplicación gratuita de análisis de imágenes, buena para crear prototipos y probar cosas. Como otros han dicho, también vale la pena mirar la biblioteca OpenCV.

 3
Author: Ian Hopkinson,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-01-11 12:39:45

He escrito algunos tutoriales de OpenCV image processing / computer vision con código fuente gratuito, por lo que es posible que desee ver algunos de ellos para ayudar a comenzar: http://www.shervinemami.co.cc/openCV.html

 2
Author: Shervin Emami,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2012-09-17 01:44:25

Buenas respuestas. Espero que no tengas fobia a las matemáticas. Mi técnica favorita en estos días es Markov - Chain Monte Carlo (Google Spiegelhalter). El reconocimiento es un problema de optimización, y MCMC es una forma general de manejarlos a través de inferencia bayesiana.

 1
Author: Mike Dunlavey,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-01-11 16:48:43

Microsoft lanzó recientemente un SDK.NET de código abierto implementado en C# y C++ con una interfaz de cámara web muy rudimentaria y análisis de imágenes. Puede valer la pena tomar un navegar por el código extremadamente bien documentado solo para empezar.

 0
Author: ,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/ajaxhispano.com/template/agent.layouts/content.php on line 61
2009-01-11 12:53:58