Módulo de Clasificación (Reconocimiento)
El Módulo de Clasificación (Reconocimiento) en DocView Capture identifica, separa y categoriza automáticamente documentos dentro de un lote utilizando tecnologías de reconocimiento como OCR (Reconocimiento Óptico de Caracteres), patrones predefinidos y clasificación basada en reglas.
Esto asegura que cada documento se asigne al tipo de documento correcto y se vincule a los campos de índice correctos para la indexación, validación y exportación posterior.
Proceso de Clasificación
1. Selección del Lote
- El sistema carga los lotes que han pasado QC y están listos para reconocimiento.
- Cada lote se identifica por:
- ID de Lote
- Nombre de Lote
- Marca de tiempo (ej. Lote 27781, DocView Demo Batch 26-02-2022 13:48:42).
2. Ejecución del Reconocimiento
- El motor OCR analiza cada página para extraer texto.
- Se aplican reglas de clasificación para determinar el tipo de documento (ej. Factura, Orden de Compra, Contrato).
- Se generan archivos de metadatos (ej.
1.xml) para cada documento reconocido.
3. Generación de Salida
- Los documentos reconocidos reciben metadatos/XML estructurados.
- Los resultados de clasificación alimentan el siguiente paso (Indexación).
Operaciones Clave
- Iniciar Reconocimiento – Inicia OCR y reconocimiento basado en reglas para el lote seleccionado.
- Extracción OCR – Extrae texto de imágenes escaneadas y PDFs para búsqueda e indexación.
- Clasificación de Documentos – Identifica el tipo de documento usando plantillas predefinidas, reglas o modelos ML.
- Creación de Metadatos – Genera archivos estructurados (ej. XML) con texto reconocido y resultados de clasificación.
Indicadores de Estado
Durante el procesamiento, el módulo muestra:
- ID de Lote – Identificador único del lote actual.
- Nombre de Lote & Marca de Tiempo – Etiqueta legible del lote.
- Estado del Proceso – Paso actual (ej. Start Recognize Generate).
- Documento OCR – Muestra qué XML/Doc se está procesando (ej.
1.xml).
Integración en Workflow
- Entrada – Los lotes provienen del Módulo QC (calidad y preparación aseguradas).
- Proceso – OCR + reglas de clasificación identifican y etiquetan documentos.
- Salida – Se generan metadatos (XML, JSON o entrada BD) y se pasan al Módulo de Indexación para completar campos y validación.