Contexto
El BCP Bolivia necesitaba digitalizar grandes volúmenes de documentos físicos con calidad variable (manchas, watermarks, baja resolución).
Pipeline
- Ingesta: recepción de imágenes vía API REST
- Pre-procesamiento: corrección de perspectiva, eliminación de ruido
- Restauración: remoción de watermarks con inpainting
- OCR: extracción de texto estructurado por campos
- Post-procesamiento: validación y normalización de datos
- Output: JSON estructurado listo para ingesta en core bancario
Resultado
Pipeline en producción procesando documentos con 95%+ de precisión.