La clasificación de imágenes por ordenador coge una imagen y predice el objeto que contiene mientras que la detección de objetos predice el objeto y encuentra su ubicación en términos de cuadros delimitadores. Por ejemplo, un clasificador de piscinas nos dirá si en la imagen hay piscinas, mientras que un modelo de detección nos dirá si hay piscina y dónde está. De forma que un modelo de detección nos dirá:
Esto es en términos generales, también dependerá del modelo y su implementación.
Podemos decir que, en la práctica, hay dos tipos de algoritmos de detección de objetos:
En comparación, los algoritmos de propuesta de región (primer grupo) suelen tener una precisión superior pero son más lentos en comparación con los de una única pasada que son bastante eficientes a pesar de hacer una única pasada.
*MMDetection no es un modelo de deep learning como tal sino que es un marco de código abierto para la detección de objetos que puede usar diferentes modelos de deep learning para ello como Faster R-CNN, SSD … es decir, modelos de una o varias pasadas.