Visión artificial

La visión artificial o visión por computadora permite procesar las imágenes captadas del mundo real, descomprimiéndolo en fragmentos pequeños llamados pixeles, solamente así las máquinas podrán entender ciertas magnitudes que le permiten realizar cálculos o algoritmos computacionales. Dicho esto, podríamos imaginar a un pixel que puede presentarse de dos formas: grises y colores,  los pixeles en escala gris toma un solo valor que va del 0 al 255 y los pixeles de colores toman tres valores (Red, Green, Blue), cada una de ellas también va del 0 a 255, respectivamente.

Pero, cómo es que las máquinas pueden interpretar esto? nuevamente invoquemos a nuestra imaginación, pensemos en una imagen cualquiera, por ejemplo un autorretrato (selfie) y ahora lo descargamos en nuestra PC hacemos clic en propiedades y nos muestra en detalles 600 x 630 pixeles, entonces nos indica su profundidad o el largo y alto de nuestra imagen pero en pixeles, bien esta cantidad los interpretes de imágenes del lenguaje Python toman ello como una grilla o matriz de 600 columnas por 630 filas,  por tanto invoca a diferentes funciones como Numpy dentro de la biblioteca correspondiente para su procesamiento y realizar los cálculos matriciales necesarios.  

Fig.1.- Detección de rostro con Haarcascade _frontal face
Fig. 2.- Detección color rojo

Al igual que los ojos permiten visualizar los objetos a nuestro alrededor algo similar sucede con las cámaras de video, pues sirven para que los dispositivos con procesadores (Computadores, Raspberry Pi, etc), microcontroladores (Arduino, Raspberry Pico Beaglebone, Esp8266, Esp32, etc.) y otros dispositivos de interfaz como el Elechouse V3, puedan interpretar acciones específicas en tiempo real. En este sentido, el campo de la visión por computadora como elemento transversal de la inteligencia artificial (IA), en los últimos años viene desarrollándose de forma vertiginosa, claro está con la aparición de diferentes sistemas embebidos como solución a procesos automatizados en la industria (tecnología de autos, robótica, domótica en hogares, seguridad, etc.) 

Fig.3 Detección color verde

Bien, parece que todo suena perfecto, bonito y emocionante para estos procedimientos, sin embargo permítanme serles sincero requiere paciencia, enfoque y voluntad, con ello será posible, así es que adelante, no olvidemos nuestra filosofía y pensamiento. Como la mayoría tiene instalado en su PC el sistema operativo Windows y si no lo tuviera los sistemas entorno Unix son aún más flexibles pues las bibliotecas o librerías ya viene pre instalados, solo hay que invocar las paqueterías necesarias. Volviendo al primer caso, se requerirá básicamente instalar lo siguiente para empezar a programar:

  • Instalar Python con anaconda
  • Instalar OPENCV para Python
  • Instalar sublime text3 o Visual Studio Code

Se puede instalar otros entornos de desarrollo para Python, pero de momento trabajaremos con sublime text3, ya que nos permitirá familiarizarnos con los comando del CMD. 

Para mayor información contáctenos que gustoso lo atenderemos para trabajar juntos.