Skip to content

Module de Classification (Reconnaissance)

Le Module de Classification (Reconnaissance) dans DocView Capture identifie, sépare et catégorise automatiquement les documents d’un lot en utilisant des technologies de reconnaissance telles que OCR (Reconnaissance Optique de Caractères), reconnaissance de motifs et classification basée sur des règles.

Cela garantit que chaque document est assigné au bon type de document et lié aux champs d’index appropriés pour l’indexation, la validation et l’exportation en aval.

Processus de Classification

1. Sélection du Lot

  • Le système charge les lots ayant passé le QC et prêts pour la reconnaissance.
  • Chaque lot est identifié par :
    • ID du Lot
    • Nom du Lot
    • Horodatage (ex. Lot 27781, DocView Demo Batch 26-02-2022 13:48:42).

2. Exécution de la Reconnaissance

  • Le moteur OCR analyse chaque page pour extraire le texte.
  • Les règles de classification déterminent le type de document (ex. Facture, Bon de commande, Contrat).
  • Des fichiers de métadonnées (ex. 1.xml) sont générés pour chaque document reconnu.

3. Génération de la Sortie

  • Les documents reconnus reçoivent des métadonnées/XML structurées.
  • Les résultats de classification alimentent l’étape suivante (Indexation).

Opérations Clés

  • Démarrer Reconnaissance – Lance le processus OCR et la reconnaissance basée sur règles pour le lot sélectionné.
  • Extraction OCR – Extrait le texte des images scannées et des PDFs pour recherche et indexation.
  • Classification de Document – Identifie le type de document à l’aide de modèles prédéfinis, règles ou modèles ML.
  • Création de Métadonnées – Génère des fichiers structurés (ex. XML) contenant texte reconnu et résultats de classification.

Indicateurs de Statut

Pendant le traitement, le module de classification affiche :

  • ID du Lot – Identifiant unique du lot courant.
  • Nom du Lot & Horodatage – Label lisible du lot.
  • État du Processus – Étape en cours (ex. Start Recognize Generate).
  • Document OCR – Indique quel XML/Doc est en cours de traitement (ex. 1.xml).

Intégration Workflow

  • Entrée – Les lots proviennent du Module QC (qualité et préparation garanties).
  • Processus – OCR + règles de classification identifient et étiquettent les documents.
  • Sortie – Métadonnées (XML, JSON ou entrée BD) générées et envoyées au Module d’Indexation pour remplissage des champs et validation.