KI-Prüfzeugnisextraktion: So funktioniert es (2026)

Kurze Antwort

Quick Answer

Die KI-Prüfzeugnisextraktion verwendet große Sprachmodelle und Computer Vision, um PDF- oder gescannte Werksabnahmeprüfzeugnisse zu analysieren, Chemiewerte, mechanische Eigenschaften, Schmelzennummern und Normreferenzen in strukturierte Felder zu übertragen – typischerweise in unter 10 Sekunden pro Dokument mit einer Feldgenauigkeit von 92–97 % vor der menschlichen Prüfung.

Werksabnahmeprüfzeugnisse (MTCs), Konformitätszeugnisse (CoCs) und ZfP-Berichte kommen in Dutzenden von Layouts von Hunderten von Lieferanten an. Keine zwei Stahlwerke formatieren eine Schmelzennummer oder ein Zugfestigkeitsergebnis gleich. Jahrzehntelang haben QS-Teams Werte von Hand übertragen. KI-Extraktion verändert diese Gleichung – aber das Verständnis, wie sie funktioniert, bestimmt, ob Sie dem Ergebnis in einem Compliance-Kontext vertrauen können.

Dieser Leitfaden deckt die gesamte Pipeline ab: vom rohen PDF bis zum verifizierten, strukturierten Datensatz.

Was KI-Zeugnisextraktion tatsächlich tut

Der Begriff „KI-Extraktion" umfasst mindestens drei verschiedene technische Schritte, die die meisten Plattformen still bündeln:

1. Dokumentklassifizierung Bevor ein Feld gelesen wird, identifiziert das System den Dokumenttyp – MTC, CoC, Schweißverfahrensqualifizierung, hydrostatischer Prüfbericht. Die Klassifizierung bestimmt, welches Extraktionsschema angewendet wird. Ein generisches Extraktionsschema, das auf einen Schweiß-PQR angewendet wird, verfehlt kritische Felder, die ein gezieltes Schema erfasst.

2. Layout-Analyse und Felderkennung Moderne Vision-Language-Modelle (VLMs) verarbeiten die gerenderte Seite, identifizieren Tabellenstrukturen, mehrspaltiger Layouts und Freitextabschnitte. Hier divergiert KI von traditionellem OCR: OCR gibt Zeichen in Lesereihenfolge zurück; ein VLM versteht, dass „0,18" unter einer „C%"-Spaltenüberschrift in einer Chemietabelle ein Kohlenstoffprozentsatz ist und keine zufällige Zahl.

3. Strukturierte Feldzuordnung Erkannte Werte werden einem kanonischen Schema zugeordnet – heat_number, chemical_composition.carbon, tensile_strength_mpa, yield_strength_mpa, elongation_pct, applicable_standard, certifying_mill usw. Plattformen wie TestCert pflegen ein normenbewusstes Schema, sodass extrahierte Werte sofort gegen ASTM-, EN- oder ASME-Grenzwerte validiert werden können, ohne einen separaten Schritt zu benötigen.

Die Extraktionspipeline im Detail

Eingang

PDFs kommen per E-Mail-Anhang, API-Push oder Lieferantenportal-Upload an. Die erste Herausforderung ist die Dateiqualität: Gescannte Dokumente bei 150 DPI liefern spürbar schlechtere Ergebnisse als native PDFs. Die meisten Produktionspipelines führen eine automatische Qualitätsprüfung durch und markieren niedrig aufgelöste Scans zur manuellen Überprüfung, bevor die Extraktion beginnt.

Vorverarbeitung

Die Vorverarbeitung umfasst:

Ausrichten und Kontrastnormalisierung für gescannte Bilder
Seitensegmentierung zur Trennung von Zeugnisseiten von Anschreiben oder Lieferscheinen
Spracherkennung (relevant für europäische Werke, die EN 10204-Zeugnisse auf Deutsch oder Französisch ausstellen)

Auswahl des Extraktionsmodells

Die meisten unternehmensgerechten Pipelines verwenden eine Zwei-Modell-Architektur:

Ein schnelles, leichtgewichtiges Modell für gut strukturierte, maschinell generierte PDFs (native PDF-Textebene intakt)
Ein schwereres Vision-Modell für gescannte oder komplexe Layouts

Das Routing zwischen Modellen basierend auf dem PDF-Typ reduziert Kosten und Latenz, ohne Genauigkeit zu opfern.

Konfidenz-Scoring

Jedes extrahierte Feld erhält einen Konfidenzwert. Felder mit niedrigem Konfidenzwert werden zur menschlichen Prüfung markiert, anstatt still in den Datensatz geschrieben zu werden. Der Schwellenwert ist konfigurierbar – ein Wareneingangsteam für Druckbehälterkomponenten kann einen niedrigeren Konfidenzschwellenwert setzen (mehr menschliche Prüfung) als ein Team, das handelsüblichen Baustahl empfängt.

Human-in-the-Loop-Prüfung

Markierte Felder werden einem Prüfer in einer Nebeneinanderansicht präsentiert: das Originaldokument links, extrahierte Felder rechts. Der Prüfer korrigiert, bestätigt oder lehnt einzelne Werte ab. Korrekturen fließen im Laufe der Zeit in die Modellverbesserung zurück. Dieser Schritt ist für compliance-kritische Anwendungen nicht optional – er ist der Mechanismus, der KI-Extraktion auditierbar macht.

Genauigkeit: Was die Zahlen bedeuten

Veröffentlichte Genauigkeitszahlen für KI-Zeugnisextraktion liegen typischerweise zwischen 90 % und 98 % auf Feldebene. Der Kontext ist erheblich:

Dokumenttyp	Typische Feldgenauigkeit
Natives PDF MTC (einzelne Schmelze)	95–98 %
Gescanntes MTC (gute Qualität)	91–95 %
Gescanntes MTC (schlechte Qualität / handgeschriebene Notizen)	80–90 %
Gebündeltes Mehrschmelzen-Zeugnis	88–94 %
ZfP-Bericht (komplexes Layout)	85–92 %

„Feldgenauigkeit" bedeutet, dass der extrahierte Wert exakt mit dem Referenzwert übereinstimmt. Eine Feldgenauigkeit von 96 % über ein 40-Felder-MTC bedeutet, dass ungefähr 1,6 Felder pro Zeugnis einer Korrektur bedürfen. Mit einem Human-in-the-Loop-Prüfschritt nähert sich die effektive Fehlerquote, die Ihre Datenbank erreicht, null – vorausgesetzt, Prüfer sind darauf trainiert, jedes markierte Feld kritisch zu behandeln.

Was KI-Extraktion (noch) nicht zuverlässig kann

Ehrliche Einschätzung aktueller Einschränkungen:

Handgeschriebene Ergänzungen: Handgeschriebene Werte auf einem gedruckten Zeugnis verwirren auch starke Vision-Modelle. Diese sollten immer zur menschlichen Prüfung weitergeleitet werden.
Stark beschädigte Scans: Schwere Kompressionsartefakte, geringer Kontrast oder Faxqualitätsdokumente verringern die Genauigkeit erheblich.
Nicht standardmäßige Einheiten ohne explizite Bezeichnungen: Wenn ein Werk die Dehnung in Zoll pro Zoll ohne Beschriftung angibt, kann das Modell die Einheit falsch klassifizieren.
Seitenübergreifende Chemietabellen: Einige Werke teilen die Chemietabelle über zwei Seiten auf; Modelle, die Seiten unabhängig verarbeiten, übersehen möglicherweise die Fortsetzung.
Validierung der Zertifizierer-Unterschrift: KI kann den Namen des Unterzeichners extrahieren, kann jedoch nicht verifizieren, dass eine Nass- oder digitale Unterschrift authentisch ist.

Integrationsarchitektur

Für eine Produktionsbereitstellung integriert sich die KI-Zeugnisextraktion mit:

Dokumenteingang – E-Mail-Analyse, Lieferantenportal, EDI oder API
ERP / MES – extrahierte Datensätze werden über REST-Webhooks in SAP, Oracle oder benutzerdefinierte Systeme übertragen
Normenvalidierungsmotor – extrahierte Chemie-/Mechanikwerte werden gegen gespeicherte ASTM/ASME/EN-Grenzwerte geprüft
Audit-Protokoll – jedes Extraktionsereignis, jede Prüferaktion und jede Feldkorrektur wird mit Zeitstempel und Benutzeridentität protokolliert
Zeugnisspeicher – unveränderliche Speicherung des Original-PDFs neben dem extrahierten Datensatz

Wann ist Automatisierung wirtschaftlich sinnvoll?

Der Breakeven-Punkt hängt vom Dokumentvolumen und den aktuellen Arbeitskosten ab. Ein grobes Modell:

Durchschnittliche manuelle Eingabezeit pro MTC: 8–15 Minuten (einschließlich Nachschlagen, Validierung, Ablage)
Durchschnittliche KI-Extraktions- + Prüfzeit: 1–3 Minuten pro MTC
Bei 200 MTCs/Monat werden 25–35 Arbeitsstunden monatlich zurückgewonnen
Bei 2.000 MTCs/Monat favorisiert die Rechnung die Automatisierung stark, selbst bei Verarbeitungskosten pro Dokument

Die weniger offensichtlichen Kosten sind Fehlerkorrekturen. Ein verfehltes Dezimalkomma in einem Streckgrenzwert kann dazu führen, dass nicht konformes Material die Prüfung besteht. Die Kosten eines Nacharbeitsereignisses oder Feldversagens übersteigen die Kosten der Extraktionssoftware bei weitem.

Häufig gestellte Fragen

Funktioniert KI-Extraktion bei gescannten Zeugnissen älterer Werke?

Ja, aber die Genauigkeit variiert mit der Scanqualität. Native PDFs (Textebene intakt) liefern die besten Ergebnisse. Für gescannte Dokumente verbessern Vorverarbeitungsschritte wie Ausrichten und Kontrastnormalisierung die Modellleistung erheblich. Stark beschädigte Scans (unter ~150 DPI effektiv) sollten zur vollständigen manuellen Prüfung markiert werden.

Wie handhabt KI-Extraktion Mehrschmelzen-Zeugnisse?

Mehrschmelzen-Zeugnisse – bei denen ein Dokument mehrere Schmelzennummern abdeckt – erfordern, dass das Modell das Zeugnis vor der Extraktion in Pro-Schmelzen-Abschnitte segmentiert. Dies ist eines der schwierigeren Layout-Probleme. Plattformen, die dies gut handhaben, pflegen explizite Mehrschmelzen-Extraktionsschemata und präsentieren jede Schmelze als separaten Datensatz zur Prüfung.

Können extrahierte Daten für regulatorische Compliance-Einreichungen verwendet werden?

Mit einem ordnungsgemäß implementierten Human-in-the-Loop-Prüfschritt und einem vollständigen Audit-Trail: ja. Das Original-PDF und das Extraktionsereignisprotokoll bilden die Beweiskette. Einige regulatorische Rahmenbedingungen (z. B. PED, ASME Section IX) verlangen, dass das Originaldokument unabhängig davon aufbewahrt wird, sodass der Extraktionsdatensatz das Quelldokument ergänzt und nicht ersetzt.

Was ist ein Konfidenzwert in der KI-Extraktion?

Ein Konfidenzwert ist die selbst eingeschätzte Wahrscheinlichkeit des Modells, dass ein extrahierter Wert korrekt ist. Werte werden typischerweise als 0–1 oder 0–100 % ausgedrückt. Werte unterhalb eines konfigurierten Schwellenwerts (üblicherweise 0,85) werden zur menschlichen Prüfung markiert. Hochrisikoanwendungen verwenden niedrigere Schwellenwerte, um mehr Felder an Prüfer weiterzuleiten; hoch volumige, niedrigere Risiko-Workflows können höhere Schwellenwerte verwenden.

Wie lange dauert die KI-Extraktion pro Dokument?

Für ein natives PDF MTC mit einem Standardlayout wird die Extraktion typischerweise in 5–15 Sekunden abgeschlossen. Komplexe gescannte Dokumente können 20–40 Sekunden benötigen. Die menschliche Prüfung fügt je nach Anzahl der markierten Felder und Vertrautheit des Prüfers mit dem Format 1–4 Minuten hinzu.

Ready to automate your certificate workflow?

Try TestCert free

KI-Prüfzeugnisextraktion: So funktioniert es im Jahr 2026