Quy trình kiểm tra đến hàng tại một nhà máy chế tạo kết cấu quy mô vừa phải trông như thế này: một chiếc xe tải đến, tài xế bỏ xuống một gói hàng có chứa các chứng chỉ nhà máy thực hoặc một chồng PDF in. Nhân viên nhận hàng mở mỗi chứng chỉ, tìm số lô, nhập vào một ô trong bảng tính được chia sẻ, ghi chú số lệnh mua, và chuyển sang cái tiếp theo. Một ngày nhận hàng bận rộn, đó là 40–60 mục nhập số lô. Quy trình mất khoảng 90 phút.
90 phút đó tạo ra một bảng tính với các số lô có thể đúng hoặc không. Lỗi chuyển vị trong các mã lô chữ số (ví dụ: nhập "A2B347" thành "AB2347") rất phổ biến và thường bị bỏ qua cho đến khi một truy vấn khả năng truy xuất lô thất bại vài tháng sau. Một số chứng chỉ là bản sao của bản sao có vấn đề về độ tương phản. Một số đến với vòng quay 90 độ. Một số sử dụng "Melt No." trong khi những cái khác sử dụng "Heat No." hoặc "Cast No." — những dữ liệu giống nhau, nhãn khác nhau.
Bảng tính sau đó được nhập thủ công vào hệ thống ERP bởi người khác, tạo ra cơ hội thứ hai để xảy ra lỗi. Các PDF gốc được lưu trữ trong một thư mục theo ngày. Nếu ai đó cần tìm một số lô cụ thể sau này, họ tìm kiếm trước trong bảng tính và sau đó đào vào thư mục nếu mục nhập bảng tính bị sai.
Điều Gì Làm Cho Trích Xuất Số Lô Khó Khăn (Và Điều Gì Không)
Những thách thức kỹ thuật trong trích xuất số lô tự động được hiểu rõ:
Biến thể nhãn trường. Các nhà máy khác nhau sử dụng các nhãn khác nhau cho cùng một trường. "Heat No.", "Heat Number", "Melt No.", "Cast No.", "Charge No." và "HT#" đều đề cập đến điều tương tự. Một cách tiếp cận OCR đơn giản cộng với từ khóa thất bại trên các biến thể nó chưa thấy. Trích xuất dựa trên AI tìm hiểu rằng những nhãn này tương đương về mặt ngữ nghĩa và trích xuất giá trị liên quan bất kể nhãn nào xuất hiện.
Biến thể bố cục tài liệu. Các định dạng chứng chỉ nhà máy không được tiêu chuẩn hóa. Một số nhà máy sử dụng bố cục dạng bảng với các ô được gắn nhãn. Những cái khác sử dụng các đoạn văn bản tự do ("Vật liệu từ lô 8A3291 đã được kiểm tra...")। Một số được tổ chức theo loại kiểm tra (phần hóa học, phần tính chất cơ học). Một mô hình trích xuất được đào tạo trên định dạng của một nhà máy có thể thất bại hoàn toàn trên định dạng của một nhà máy khác nếu nó dựa vào các quy tắc vị trí chứ không phải hiểu biết ngữ nghĩa.
Vấn đề chất lượng quét. Các tài liệu được xoay, các bản sao độ tương phản thấp và chú thích viết tay trên văn bản in tạo ra những thách thức OCR. AI tài liệu hiện đại xử lý quay tự động và áp dụng xử lý trước hình ảnh để cải thiện độ tương phản trước khi trích xuất. Khoảng cách chính xác giữa một PDF kỹ thuật số sạch sẽ và một bản quét photocopy thế hệ thứ ba là thực tế nhưng có thể quản lý — thường là 95–97% độ chính xác trích xuất trên các tài liệu sạch so với 85–90% trên các bản quét bị hỏng.
Chứng chỉ đa lô. Một số chứng chỉ bao gồm nhiều số lô — một chuyển đổi từ cuộn sang tấm nơi chứng chỉ tham chiếu cả lô cuộn gốc và lô sản xuất tấm, hoặc chứng chỉ kết hợp bao gồm nhiều mục dòng đơn hàng mua. Trích xuất cần xác định số lô nào tương ứng với mục dòng hoặc sản phẩm nào, không chỉ trích xuất danh sách số từ tài liệu.
Không cái nào trong số này là các vấn đề chưa giải quyết. Các mô hình trích xuất tồn tại. Các công cụ OCR xử lý chất lượng quét. Câu hỏi là liệu việc triển khai có đủ chính xác để sử dụng trong sản xuất hay không.
Mức Độ Chính Xác Trông Như Thế Nào Trong Thực Tế
Đối với các PDF kỹ thuật số chất lượng cao từ các nhà máy lớn, trích xuất số lô dựa trên AI đạt độ chính xác 97–99% trên trường số lô cụ thể. Điều này tốt hơn nhập thủ công, có tỷ lệ lỗi được ghi chép là 2–5% trên các mã chữ số nhập dưới áp lực thời gian.
Đối với các bản quét chất lượng thấp hơn (truyền fax được photocopy, bản sao thế hệ thứ ba), độ chính xác giảm xuống 88–93%. Ở mức này, một bước đánh giá lại của con người đối với các trích xuất được đánh dấu độ tin cậy thấp là thích hợp. Hệ thống trích xuất những gì nó có thể tự tin, đánh dấu những gì nó không thể, và đưa các tài liệu được đánh dấu vào hàng đợi để đánh giá lại thủ công — một tập hợp nhỏ hơn nhiều so với toàn bộ khối lượng đến.
Quy trình làm việc kết hợp con người cộng với AI đạt độ chính xác tốt hơn so với hoàn toàn thủ công với thông lượng cao hơn: AI xử lý 90–95% tài liệu mà không có sự can thiệp của con người, và đánh giá lại của con người tập trung vào 5–10% nơi AI không chắc chắn.
Tác Động Hạ Lưu Đến Khả năng Truy Xuất và Liên Kết ERP
Độ chính xác số lô không chỉ là vấn đề chất lượng dữ liệu. Nó là nền tảng của khả năng truy xuất vật liệu trong các sản phẩm kim loại được chế tạo.
Khi một sự kiện chất lượng xảy ra — một sự cố trường, một khiếu nại của khách hàng, một cuộc thu hồi — câu hỏi đầu tiên là "vật liệu này từ lô nào?" Nếu số lô trong bản ghi ERP bị sai, truy vấn khả năng truy xuất sẽ thất bại. Bạn không thể xác định những phần nào khác được tạo từ cùng một lô. Bạn không thể rút chứng chỉ gốc để xác minh các thuộc tính vật liệu. Bạn không thể truy tìm lại nhà cung cấp hoặc nhà máy để hành động sửa chữa.
Trong chế tạo bình chứa áp lực, kết cấu và đường ống, khả năng truy xuất lô không phải là tùy chọn. ASME Section VIII, AWS D1.1 và nhiều kế hoạch chất lượng của khách hàng yêu cầu các số lô được ghi lại và có khả năng truy xuất qua hồ sơ chế tạo đến sản phẩm hoàn thiện. Một hệ thống lưu trữ chứng chỉ dựa trên nhập liệu thủ công tạo ra các bản ghi khả năng truy xuất có độ chính xác thay đổi. Các lỗi là im lặng — chúng không tự công bố cho đến khi ai đó cố gắng sử dụng bản ghi.
Trích xuất tự động với xác thực (số lô được trích xuất được xác nhận so với PDF chứng chỉ sau khi trích xuất) tạo bản ghi chính xác như chứng chỉ chính nó. Liên kết giữa bản ghi ERP và tài liệu chứng chỉ gốc là tự động thay vì dựa vào ai đó lưu trữ PDF chính xác trong thư mục chính xác.
Quy trình nhập dữ liệu hàng ngày 90 phút cũng trở thành hấp thụ gần thời gian thực: các chứng chỉ có thể được xử lý trong vòng vài phút kể từ khi nhận, số lô nằm trong ERP trước khi vật liệu đến sàn shop, và bản ghi khả năng truy xuất hoàn tất trước khi chế tạo bắt đầu thay vì được lắp ráp sau sự kiện.