Skip to main content
Blog·6 min di lettura·

L'Estrazione del Numero di Lotto dai PDF è un Problema Risolto. Il Tuo Team Semplicemente Non Lo Sa Ancora.

Approfondimento settore

Il processo di ispezione in entrata presso un fabbricatore di strutture di medie dimensioni assomiglia a questo: arriva un camion, l'autista scarica un pacco che include certificati di prova fisici o una pila di PDF stampati. L'impiegato di ricezione apre ogni certificato, trova il numero di lotto, lo digita in una cella in un foglio di calcolo condiviso, annota il numero dell'ordine d'acquisto, e passa al successivo. In una giornata di ricezione impegnativa, sono 40–60 immissioni di numeri di lotto. Il processo richiede circa 90 minuti.

Quei 90 minuti producono un foglio di calcolo con numeri di lotto che possono o meno essere corretti. Gli errori di trasposizione sui codici alfanumerici del lotto (ad esempio, digitare "A2B347" come "AB2347") sono comuni e spesso passano inosservati fino a quando una query di tracciabilità del lotto non fallisce mesi dopo. Alcuni certificati sono fotocopie di fotocopie con problemi di contrasto. Alcuni arrivano ruotati di 90 gradi. Alcuni usano "Melt No." mentre altri usano "Heat No." o "Cast No." — gli stessi dati, etichette diverse.

Il foglio di calcolo viene quindi immesso manualmente nel sistema ERP da qualcun altro, introducendo una seconda opportunità di errore. I PDF originali vengono archiviati in una cartella per data. Se qualcuno ha bisogno di trovare un numero di lotto specifico in seguito, cerca prima nel foglio di calcolo e poi scava nella cartella se la voce del foglio di calcolo è sbagliata.

Cosa Rende Difficile l'Estrazione del Numero di Lotto (e Cosa No)

Le sfide tecniche nell'estrazione automatizzata del numero di lotto sono ben comprese:

Variazione dell'etichetta del campo. Diversi molini utilizzano etichette diverse per lo stesso campo. "Heat No.", "Heat Number", "Melt No.", "Cast No.", "Charge No." e "HT#" si riferiscono tutti alla stessa cosa. Un semplice approccio OCR più parole chiave fallisce sulle varianti che non ha visto. L'estrazione basata sull'IA apprende che queste etichette sono semanticamente equivalenti ed estrae il valore associato indipendentemente da quale etichetta appare.

Variazione del layout del documento. I formati dei certificati di fabbrica non sono standardizzati. Alcuni molini utilizzano layout tabulari con celle etichettate. Altri utilizzano paragrafi in formato libero ("Il materiale del lotto 8A3291 è stato testato..."). Alcuni organizzano per tipo di test (sezione chimica, sezione meccanica). Un modello di estrazione addestrato sul formato di un molino potrebbe fallire completamente su un altro formato di molino se si basa su regole posizionali anziché su comprensione semantica.

Problemi di qualità della scansione. Documenti ruotati, fotocopie a basso contrasto e annotazioni scritte a mano su testo stampato creano sfide OCR. L'intelligenza artificiale moderna per i documenti gestisce la rotazione automaticamente e applica la pre-elaborazione dell'immagine per migliorare il contrasto prima dell'estrazione. Il divario di accuratezza tra un PDF digitale pulito e una scansione di fotocopia di terza generazione è reale ma gestibile — in genere 95–97% di accuratezza di estrazione su documenti puliti rispetto all'85–90% su scansioni degradate.

Certificati multi-lotto. Alcuni certificati coprono più numeri di lotto — una conversione da bobina a lastra dove il certificato fa riferimento sia al lotto originale della bobina che al lotto di produzione della lastra, o un certificato combinato che copre più righe di ordine d'acquisto. L'estrazione deve identificare quale numero di lotto corrisponde a quale voce o prodotto, non solo estrarre un elenco di numeri dal documento.

Nessuno di questi sono problemi irrisolti. I modelli di estrazione esistono. I motori OCR gestiscono la qualità della scansione. La domanda è se l'implementazione è sufficientemente accurata per l'uso in produzione.

Quali Sono i Tassi di Accuratezza nella Pratica

Per PDF digitali di alta qualità da molini importanti, l'estrazione del numero di lotto basata sull'IA raggiunge un'accuratezza del 97–99% nel campo del numero di lotto specificamente. Questo è migliore dell'immissione manuale, che ha un tasso di errore documentato del 2–5% sui codici alfanumerici immessi sotto pressione di tempo.

Per scansioni di qualità inferiore (trasmissioni fax fotocopiate, copie di terza generazione), l'accuratezza scende all'88–93%. A questo livello, un passaggio di revisione umana per le estrazioni a bassa confidenza contrassegnate è appropriato. Il sistema estrae ciò che può estrarre con sicurezza, contrassegna ciò che non può, e mette in coda i documenti contrassegnati per la revisione manuale — un insieme molto più piccolo dell'intero volume in arrivo.

Il flusso di lavoro combinato umano-più-IA raggiunge un'accuratezza migliore rispetto all'interamente manuale con una produttività più elevata: l'IA gestisce il 90–95% dei documenti senza intervento umano, e la revisione umana è concentrata sul 5–10% dove l'IA è incerta.

Impatto a Valle sulla Tracciabilità e il Collegamento ERP

L'accuratezza del numero di lotto non è solo una questione di qualità dei dati. È il fondamento della tracciabilità dei materiali nei prodotti metallici fabbricati.

Quando si verifica un evento di qualità — un guasto in campo, un reclamo del cliente, un richiamo — la prima domanda è "da quale lotto proveniva questo materiale?" Se il numero di lotto nel record ERP è errato, la query di tracciabilità fallisce. Non puoi identificare quali altre parti sono state realizzate dallo stesso lotto. Non puoi estrarre il certificato originale per verificare le proprietà del materiale. Non puoi tracciare indietro al fornitore o molino per l'azione correttiva.

Nella fabbricazione di recipienti in pressione, strutture e condotte, la tracciabilità del lotto non è opzionale. ASME Section VIII, AWS D1.1 e molti piani di qualità dei clienti richiedono che i numeri di lotto siano documentati e tracciabili attraverso il record di fabbricazione al prodotto finito. Un sistema di archiviazione certificati basato su immissione manuale produce record di tracciabilità di accuratezza variabile. Gli errori sono silenziosi — non si annunciano fino a quando qualcuno non tenta di utilizzare il record.

L'estrazione automatizzata con convalida (il numero di lotto estratto è confermato rispetto al PDF del certificato dopo l'estrazione) crea un record accurato quanto il certificato stesso. Il collegamento tra il record ERP e il documento del certificato originale è automatico anziché affidarsi a qualcuno per archiviare il PDF corretto nella cartella corretta.

Il processo di immissione dei dati quotidiano di 90 minuti diventa anche un'assunzione quasi in tempo reale: i certificati possono essere elaborati entro minuti dalla ricezione, i numeri di lotto sono nel sistema ERP prima che il materiale raggiunga il negozio, e il record di tracciabilità è completo prima che la fabbricazione inizi anziché essere assemblato dopo il fatto.

Cosa Leggere Dopo