Proces kontroli przychodzenia w średniej wielkości wytwórni konstrukcji wygląda tak: przyjeżdża ciężarówka, kierowca rozładowuje paczkę zawierającą fizyczne certyfikaty fabryki lub stos wydrukowanych plików PDF. Pracownik przyjęcia otwiera każdy certyfikat, znajduje numer partii, wpisuje go do komórki w udostępnionym arkuszu kalkulacyjnym, notuje numer zamówienia zakupu i przechodzi do następnego. W obciążonym dniu odbioru są 40–60 wpisów numerów partii. Proces zajmuje około 90 minut.
Te 90 minut produkuje arkusz kalkulacyjny z numerami partii, które mogą być poprawne lub nie. Błędy przepisania w alfanumerycznych kodach partii (na przykład wpisanie "A2B347" jako "AB2347") są powszechne i często pozostają niezauważone do czasu, gdy zapytanie śledzenia partii ulegnie awarii miesiące później. Niektóre certyfikaty to kopie kopii z problemami kontrastu. Niektóre przyjeżdżają obrócone o 90 stopni. Niektóre używają "Melt No." podczas gdy inne używają "Heat No." lub "Cast No." — te same dane, różne etykiety.
Arkusz kalkulacyjny jest następnie ręcznie wpisywany do systemu ERP przez kogoś innego, co wprowadza drugą szansę na błąd. Oryginalne pliki PDF są archiwizowane w folderze według daty. Jeśli ktoś będzie musiał znaleźć określony numer partii później, najpierw przeszukuje arkusz kalkulacyjny, a następnie kopie folder, jeśli wpis w arkuszu kalkulacyjnym jest błędny.
Co Sprawia Że Ekstrakcja Numeru Partii Jest Trudna (i Co Nie)
Wyzwania techniczne w zautomatyzowanej ekstrakcji numeru partii są dobrze zrozumiane:
Zmienność etykiety pola. Różne fabryki używają różnych etykiet dla tego samego pola. "Heat No.", "Heat Number", "Melt No.", "Cast No.", "Charge No." i "HT#" odnoszą się do tego samego. Proste podejście OCR plus słowa kluczowe zawodzi na wariantach, których nie widział. Ekstrakcja oparta na SI uczy się, że te etykiety są semantycznie równoważne i wyodrębnia skojarzoną wartość, niezależnie od tego, która etykieta się pojawi.
Zmienność układu dokumentu. Formaty certyfikatów fabryki nie są standaryzowane. Niektóre fabryki używają układów tabelarycznych z oznaczonymi komórkami. Inne używają akapitów tekstu wolnego ("Materiał z partii 8A3291 został przetestowany..."). Niektóre są organizowane według typu testu (sekcja chemii, sekcja właściwości mechanicznych). Model ekstrakcji wytrenowany na formacie jednej fabryki może całkowicie nie zadziałać na formacie innej fabryki, jeśli opiera się na regułach pozycyjnych zamiast na zrozumieniu semantycznym.
Problemy z jakością skanowania. Obrócone dokumenty, kopie o niskim kontraście i odręczne adnotacje nad drukowanym tekstem tworzą wyzwania OCR. Nowoczesna SI do obsługi dokumentów automatycznie obsługuje obrót i stosuje wstępne przetwarzanie obrazu, aby poprawić kontrast przed ekstrakcją. Luka w dokładności między czystym cyfrowym plikiem PDF a skinem fotokopii trzeciej generacji jest realna, ale możliwa do zarządzania — typowo 95–97% dokładności ekstrakcji w czystych dokumentach wobec 85–90% w zdegradowanych skanach.
Certyfikaty wielopartyjne. Niektóre certyfikaty obejmują wiele numerów partii — konwersja ze zwoju na blachę, gdzie certyfikat odnosi się zarówno do oryginalnej partii zwoju, jak i partii produkcji blachy, lub połączony certyfikat obejmujący wiele pozycji linii zamówienia zakupu. Ekstrakcja musi zidentyfikować, który numer partii odpowiada któremu pozycji linii lub produktowi, a nie tylko wyodrębnić listę numerów z dokumentu.
Żaden z nich nie jest nierozwiązanym problemem. Modele ekstrakcji istnieją. Silniki OCR obsługują jakość skanowania. Pytanie dotyczy tego, czy implementacja jest wystarczająco dokładna do użytku produkcyjnego.
Jak Wyglądają Stawki Dokładności W Praktyce
W przypadku wysokiej jakości cyfrowych plików PDF z dużych fabryk, ekstrakcja numeru partii oparta na SI osiąga dokładność 97–99% w polu numeru partii w szczególności. To jest lepsze niż ręczne wpisywanie, które ma udokumentowany wskaźnik błędów 2–5% na kodach alfanumerycznych wpisywanych pod presją czasową.
W przypadku skanów niższej jakości (kopierte transmisje faksów, kopie trzeciej generacji), dokładność spada do 88–93%. Na tym poziomie etap przeglądu ludzkiego dla oznaczonych ekstrakcji o niskiej pewności jest odpowiedni. System wyodrębnia to, co może pewnie, oznacza to, czego nie może, i umieszcza w kolejce oznaczone dokumenty do ręcznego przeglądu — o wiele mniejszy zestaw niż całkowita wielkość przychodu.
Połączony przepływ pracy człowieka plus SI osiąga lepszą dokładność niż całkowicie ręczny przy wyższej przepustowości: SI obsługuje 90–95% dokumentów bez ludzkiej ingerencji, a przegląd ludzi skupia się na 5–10%, gdzie SI jest niepewna.
Wpływ Dalej na Śledzenie i Łączenie ERP
Dokładność numeru partii to nie tylko kwestia jakości danych. To fundament śledzenia materiałów w wytworzonych produktach metalowych.
Gdy dojdzie do zdarzenia jakościowego — awarii w terenie, skargi klienta, wycofania — pierwsze pytanie brzmi: "z której partii ten materiał?" Jeśli numer partii w rekordzie ERP jest błędny, zapytanie śledzenia ulegnie awarii. Nie możesz zidentyfikować, które inne części zostały wykonane z tej samej partii. Nie możesz wyodrębnić oryginalnego certyfikatu, aby zweryfikować właściwości materiału. Nie możesz śledzić dostawcę lub fabrykę w celu podjęcia działań naprawczych.
W produkcji zbiorników ciśnieniowych, konstrukcji i rurociągów śledzenie partii nie jest opcjonalne. ASME Section VIII, AWS D1.1 i wiele planów jakości klientów wymaga, aby numery partii były udokumentowane i możliwe do śledzenia przez zapis produkcji do produktu końcowego. System archiwizacji certyfikatów oparty na ręcznym wpisywaniu daje zapisy śledzenia o zmiennej dokładności. Błędy są milczące — nie ujawniają się, dopóki ktoś nie spróbuje użyć rekordu.
Zautomatyzowana ekstrakcja z weryfikacją (wyodrębniany numer partii jest potwierdzony względem pliku PDF certyfikatu po ekstrakcji) tworzy rekord tak dokładny jak sam certyfikat. Łącze między rekordem ERP a oryginalnym dokumentem certyfikatu jest automatyczne zamiast polegać na tym, że ktoś archiwizuje właściwy plik PDF w właściwym folderze.
Codzienny 90-minutowy proces wpisywania danych staje się również poborem bliskim czasem rzeczywistemu: certyfikaty mogą być przetwarzane w ciągu minut od odebrania, numery partii znajdują się w systemie ERP zanim materiał dotrze na hol, a zapis śledzenia jest kompletny przed началом produkcji zamiast być montowanym po fakcie.