Cómo analizar una imagen de WhatsApp con Google Cloud Vision y WOZTELL (Make)
Este tutorial explica cómo analizar automáticamente imágenes recibidas por WhatsApp usando Google Cloud Vision a través de Make.
Perfecto para extraer texto (OCR), objetos u otros metadatos de imágenes de WhatsApp para soporte, automatización o reportes.
Resumen
Tu escenario utiliza dos módulos principales y un filtro:
1. WOZTELL | Unleash WhatsApp – Watch New WhatsApp Message: Detecta nuevos mensajes de WhatsApp (incluyendo imágenes).
2. Filtro: Solo continúa si el mensaje contiene una imagen.
3. Google Cloud Vision – Run Text Detection (OCR) within an Image: Analiza la imagen para extraer texto u otras características.
Flujo visual:
Paso 1: Detectar nuevo mensaje de WhatsApp (WOZTELL)
1. En Make, añade el módulo: WOZTELL | Unleash WhatsApp – Watch New WhatsApp Message.
2. Conecta tu cuenta de WOZTELL.
3. Selecciona el canal/bandeja de WhatsApp a monitorear.
4. Este módulo se activa con cada mensaje nuevo recibido (texto, imagen, etc.).
Paso 2: Filtrar mensajes con imagen
1. Añade un módulo Filtro después del watcher de WhatsApp.
2. Configura el filtro para que solo pasen los mensajes cuyo tipo de contenido sea "imagen" (o cuando haya una URL/adjunto de imagen).
Paso 3: Analizar imagen con Google Cloud Vision
1. Añade el módulo: Google Cloud Vision – Run Text Detection (OCR) within an Image.
2. Conecta tu cuenta de Google Cloud.
3. Asocia la URL/contenido de la imagen del mensaje de WhatsApp al campo de entrada del módulo Vision.
4. Elige el tipo de análisis (por ejemplo, OCR para extracción de texto, detección de objetos, etc.).
Mejores prácticas
- Asegúrate de que tu canal de WhatsApp esté configurado para recibir mensajes multimedia.
- Prueba el escenario con diferentes tipos de imagen para asegurar una extracción robusta.
- Usa el manejo de errores en Make para casos donde las imágenes no sean soportadas o falle la API de Vision.
- Almacena o registra los datos extraídos para procesamiento posterior (opcional).
Resultado
Una vez activado, cada imagen recibida en WhatsApp será analizada automáticamente por Google Cloud Vision, extrayendo texto o metadatos para automatizaciones o reportes posteriores.
Próximos pasos
- Reenvía el texto extraído a Slack, correo o una base de datos.
- Expande el flujo para manejar múltiples tipos de imagen o funciones avanzadas de Vision (etiquetas, objetos, etc.).