Proses inspeksi masuk di pabrikan struktur berukuran menengah terlihat seperti ini: sebuah truk tiba, pengemudi membongkar paket yang berisi sertifikat pabrik fisik atau tumpukan PDF yang dicetak. Petugas penerimaan membuka setiap sertifikat, menemukan nomor batch, mengetiknya ke dalam sel di spreadsheet bersama, mencatat nomor PO, dan berpindah ke yang berikutnya. Pada hari penerimaan yang sibuk, itu adalah 40–60 entri nomor batch. Prosesnya memakan waktu sekitar 90 menit.
90 menit itu menghasilkan spreadsheet dengan nomor batch yang mungkin atau mungkin tidak benar. Kesalahan transposisi pada kode batch alfanumerik (misalnya, mengetik "A2B347" sebagai "AB2347") adalah umum dan sering tidak terdeteksi hingga kueri pelacakan batch gagal berbulan-bulan kemudian. Beberapa sertifikat adalah fotokopi dari fotokopi dengan masalah kontras. Beberapa datang diputar 90 derajat. Beberapa menggunakan "Melt No." sementara yang lain menggunakan "Heat No." atau "Cast No." — data yang sama, label berbeda.
Spreadsheet kemudian dimasukkan secara manual ke sistem ERP oleh orang lain, memperkenalkan peluang kedua untuk kesalahan. File PDF asli diarsipkan dalam folder berdasarkan tanggal. Jika seseorang perlu menemukan nomor batch tertentu nanti, mereka mencari di spreadsheet terlebih dahulu dan kemudian menggali folder jika entri spreadsheet salah.
Apa yang Membuat Ekstraksi Nomor Batch Sulit (dan Apa yang Tidak)
Tantangan teknis dalam ekstraksi nomor batch otomatis dipahami dengan baik:
Variasi label bidang. Pabrik yang berbeda menggunakan label yang berbeda untuk bidang yang sama. "Heat No.", "Heat Number", "Melt No.", "Cast No.", "Charge No." dan "HT#" semuanya merujuk pada hal yang sama. Pendekatan OCR-plus-keyword sederhana gagal pada varian yang belum pernah dilihat. Ekstraksi berbasis AI mempelajari bahwa label-label ini secara semantik setara dan mengekstrak nilai terkait terlepas dari label mana yang muncul.
Variasi tata letak dokumen. Format sertifikat pabrik tidak standar. Beberapa pabrik menggunakan tata letak tabel dengan sel berlabel. Yang lain menggunakan paragraf teks bebas ("Bahan dari batch 8A3291 diuji..."). Beberapa diorganisir menurut tipe pengujian (bagian kimia, bagian sifat mekanik). Model ekstraksi yang dilatih pada format satu pabrik dapat gagal sepenuhnya pada format pabrik lain jika bergantung pada aturan posisional daripada pemahaman semantik.
Masalah kualitas pemindaian. Dokumen yang diputar, fotokopi kontras rendah, dan anotasi tulisan tangan di atas teks yang dicetak menciptakan tantangan OCR. AI dokumen modern menangani rotasi secara otomatis dan menerapkan pra-pemrosesan gambar untuk meningkatkan kontras sebelum ekstraksi. Kesenjangan akurasi antara PDF digital yang bersih dan pemindaian fotokopi generasi ketiga adalah nyata tetapi dapat dikelola — biasanya 95–97% akurasi ekstraksi pada dokumen bersih versus 85–90% pada pemindaian yang terdegradasi.
Sertifikat multi-batch. Beberapa sertifikat mencakup beberapa nomor batch — konversi gulungan-ke-lembaran di mana sertifikat mereferensikan batch gulungan asli dan batch produksi lembaran, atau sertifikat gabungan yang mencakup beberapa item baris PO. Ekstraksi perlu mengidentifikasi nomor batch mana yang sesuai dengan item baris atau produk mana, bukan hanya mengekstrak daftar angka dari dokumen.
Tidak satupun dari ini adalah masalah yang belum terpecahkan. Model ekstraksi ada. Mesin OCR menangani kualitas pemindaian. Pertanyaannya adalah apakah implementasinya cukup akurat untuk penggunaan produksi.
Bagaimana Tingkat Akurasi Terlihat dalam Praktik
Untuk PDF digital berkualitas tinggi dari pabrik besar, ekstraksi nomor batch berbasis AI mencapai akurasi 97–99% pada bidang nomor batch khususnya. Ini lebih baik daripada pengetikan manual, yang memiliki tingkat kesalahan 2–5% yang terdokumentasi pada kode alfanumerik yang dimasukkan di bawah tekanan waktu.
Untuk pemindaian berkualitas lebih rendah (transmisi faks yang difotokopi, salinan generasi ketiga), akurasi turun menjadi 88–93%. Pada level ini, langkah tinjauan manusia untuk ekstraksi kepercayaan diri rendah yang ditandai adalah tepat. Sistem mengekstrak apa yang dapat dilakukan dengan percaya diri, menandai apa yang tidak dapat dilakukan, dan antrian dokumen yang ditandai untuk tinjauan manual — satu set yang jauh lebih kecil daripada volume masuk keseluruhan.
Alur kerja gabungan manusia-plus-AI mencapai akurasi lebih baik daripada semua manual dengan throughput lebih tinggi: AI menangani 90–95% dokumen tanpa intervensi manusia, dan tinjauan manusia difokuskan pada 5–10% di mana AI tidak yakin.
Dampak Hilir pada Pelacakan dan Tautan ERP
Akurasi nomor batch bukan hanya masalah kualitas data. Ini adalah dasar pelacakan material dalam produk logam yang diproduksi.
Ketika peristiwa kualitas terjadi — kegagalan di lapangan, keluhan pelanggan, penarikan — pertanyaan pertama adalah "batch mana bahan ini?" Jika nomor batch dalam catatan ERP salah, kueri pelacakan gagal. Anda tidak dapat mengidentifikasi bagian mana lagi yang dibuat dari batch yang sama. Anda tidak dapat menarik sertifikat asli untuk memverifikasi sifat material. Anda tidak dapat melacak kembali ke pemasok atau pabrik untuk tindakan perbaikan.
Dalam manufaktur bejana tekan, struktur, dan perpipaan, pelacakan batch bukan opsional. ASME Section VIII, AWS D1.1, dan banyak rencana kualitas pelanggan memerlukan nomor batch didokumentasikan dan dapat dilacak melalui catatan manufaktur ke produk jadi. Sistem pengarsipan sertifikat berdasarkan entri manual menghasilkan catatan pelacakan dengan akurasi yang bervariasi. Kesalahan diam-diam — mereka tidak mengumumkan diri sampai seseorang mencoba menggunakan catatan.
Ekstraksi otomatis dengan validasi (nomor batch yang diekstrak dikonfirmasi terhadap PDF sertifikat setelah ekstraksi) membuat catatan yang sama akuratnya dengan sertifikat itu sendiri. Tautan antara catatan ERP dan dokumen sertifikat asli bersifat otomatis daripada bergantung pada seseorang untuk mengarsipkan PDF yang benar di folder yang benar.
Proses entri data harian 90 menit juga menjadi asupan waktu nyata yang mendekati: sertifikat dapat diproses dalam hitungan menit dari penerimaan, nomor batch berada di ERP sebelum material mencapai lantai toko, dan catatan pelacakan selesai sebelum manufaktur dimulai daripada dirakit setelah kenyataan.