Skip to content

Módulo de Clasificación (Reconocimiento)

El Módulo de Clasificación (Reconocimiento) en DocView Capture identifica, separa y categoriza automáticamente documentos dentro de un lote utilizando tecnologías de reconocimiento como OCR (Reconocimiento Óptico de Caracteres), patrones predefinidos y clasificación basada en reglas.

Esto asegura que cada documento se asigne al tipo de documento correcto y se vincule a los campos de índice correctos para la indexación, validación y exportación posterior.

Proceso de Clasificación

1. Selección del Lote

  • El sistema carga los lotes que han pasado QC y están listos para reconocimiento.
  • Cada lote se identifica por:
    • ID de Lote
    • Nombre de Lote
    • Marca de tiempo (ej. Lote 27781, DocView Demo Batch 26-02-2022 13:48:42).

2. Ejecución del Reconocimiento

  • El motor OCR analiza cada página para extraer texto.
  • Se aplican reglas de clasificación para determinar el tipo de documento (ej. Factura, Orden de Compra, Contrato).
  • Se generan archivos de metadatos (ej. 1.xml) para cada documento reconocido.

3. Generación de Salida

  • Los documentos reconocidos reciben metadatos/XML estructurados.
  • Los resultados de clasificación alimentan el siguiente paso (Indexación).

Operaciones Clave

  • Iniciar Reconocimiento – Inicia OCR y reconocimiento basado en reglas para el lote seleccionado.
  • Extracción OCR – Extrae texto de imágenes escaneadas y PDFs para búsqueda e indexación.
  • Clasificación de Documentos – Identifica el tipo de documento usando plantillas predefinidas, reglas o modelos ML.
  • Creación de Metadatos – Genera archivos estructurados (ej. XML) con texto reconocido y resultados de clasificación.

Indicadores de Estado

Durante el procesamiento, el módulo muestra:

  • ID de Lote – Identificador único del lote actual.
  • Nombre de Lote & Marca de Tiempo – Etiqueta legible del lote.
  • Estado del Proceso – Paso actual (ej. Start Recognize Generate).
  • Documento OCR – Muestra qué XML/Doc se está procesando (ej. 1.xml).

Integración en Workflow

  • Entrada – Los lotes provienen del Módulo QC (calidad y preparación aseguradas).
  • Proceso – OCR + reglas de clasificación identifican y etiquetan documentos.
  • Salida – Se generan metadatos (XML, JSON o entrada BD) y se pasan al Módulo de Indexación para completar campos y validación.