Skip to main content
المدونة·5 دقيقة قراءة·

استخراج رقم الحرارة من ملفات PDF مشكلة تم حلها. فريقك فقط لا يعرف ذلك حتى الآن.

رؤية الصناعة

تبدو عملية الفحص الداخلي في شركة تصنيع هياكل متوسطة الحجم هكذا: تصل شاحنة، ينزل السائق صندوقًا يتضمن شهادات اختبار فعلية أو مجموعة من ملفات PDF المطبوعة. يفتح موظف الاستقبال كل شهادة، يجد رقم الحرارة، يكتبه في خلية في جدول بيانات مشترك، يلاحظ رقم الأمر (PO)، وينتقل إلى التالي. في يوم استقبال مشغول، هذا 40-60 إدخال لرقم حرارة. تستغرق العملية حوالي 90 دقيقة.

تلك 90 دقيقة تنتج جدول بيانات بأرقام حرارة قد تكون صحيحة أو لا. أخطاء النقل في الأكواد الأبجدية الرقمية (مثل كتابة "A2B347" بدلاً من "AB2347") شائعة وغالبًا ما تمر دون اكتشاف حتى يفشل استعلام تتبع الحرارة بعد أشهر. بعض الشهادات نسخ من نسخ بمشاكل في التباين. قليل منها يأتي مدورًا بزاوية 90 درجة. البعض يستخدم "Melt No." بينما يستخدم البعض الآخر "Heat No." أو "Cast No." — نفس البيانات، تسمية مختلفة.

يتم بعد ذلك إدخال جدول البيانات يدويًا إلى نظام ERP من قبل شخص آخر، مما يخلق فرصة ثانية للخطأ. يتم حفظ ملفات PDF الأصلية في مجلد حسب التاريخ. إذا احتاج أحد إلى العثور على رقم حرارة محدد لاحقًا، فيبحث في جدول البيانات أولاً ثم يحفر عبر المجلد إذا كان إدخال جدول البيانات خاطئًا.

ما الذي يجعل استخراج رقم الحرارة صعبًا (وما لا)

التحديات التقنية في استخراج رقم الحرارة الآلي مفهومة جيدًا:

تباين تسمية الحقل. تستخدم مصانع مختلفة تسميات مختلفة للحقل ذاته. "Heat No."، "Heat Number"، "Melt No."، "Cast No."، "Charge No."، و"HT#" تشير جميعها إلى نفس الشيء. يفشل نهج OCR البسيط زائد الكلمات الرئيسية على المتغيرات التي لم يرها. استخراج قائم على الذكاء الاصطناعي يتعلم أن هذه التسميات معادلة دلاليًا ويستخرج القيمة المرتبطة بغض النظر عن التسمية التي تظهر.

تباين تخطيط المستند. تنسيقات شهادات المصنع ليست معيارية. بعض المصانع تستخدم تخطيطات جدولية مع خلايا معنونة. البعض الآخر يستخدم فقرات نصية حرة ("المادة من الحرارة 8A3291 تم اختبارها..."). البعض ينظم حسب نوع الاختبار (قسم الكيمياء، قسم الخصائص الميكانيكية). قد يفشل نموذج الاستخراج المدرب على تنسيق مصنع واحد تمامًا على تنسيق مصنع آخر إذا كان يعتمد على قواعد موضعية بدلاً من الفهم الدلالي.

مشاكل جودة المسح. تدوير المستندات، والنسخ منخفضة التباين، والتعليقات المكتوبة بخط اليد على النص المطبوع تخلق تحديات OCR. يتعامل ذكاء وثائق حديث مع التدوير تلقائيًا ويطبق معالجة مسبقة للصورة لتحسين التباين قبل الاستخراج. فجوة الدقة بين ملف PDF رقمي نظيف ونسخة مسح فوتوغرافي من الجيل الثالث حقيقية لكن يمكن التعامل معها — عادةً 95-97% دقة استخراج على المستندات النظيفة مقابل 85-90% على المسح الضعيف.

شهادات الحرارة المتعددة. بعض الشهادات تغطي أرقام حرارة متعددة — تحويل ملف من لفة إلى لوحة حيث تشير الشهادة إلى كل من الحرارة الأصلية للملف والحرارة الناتجة عن الإنتاج، أو شهادة مشتركة تغطي عناصر PO متعددة. يجب أن يحدد الاستخراج رقم الحرارة الذي يتوافق مع أي عنصر سطر أو منتج، وليس فقط استخراج قائمة أرقام من المستند.

لا شيء من هذه مشاكل غير محلولة. نماذج الاستخراج موجودة. محركات OCR تتعامل مع جودة المسح. السؤال هو ما إذا كان التنفيذ دقيقًا بما يكفي للاستخدام في الإنتاج.

معدلات الدقة في الممارسة العملية

بالنسبة لملفات PDF الرقمية عالية الجودة من المصانع الكبرى، يحقق استخراج رقم الحرارة القائم على الذكاء الاصطناعي دقة 97-99% في حقل رقم الحرارة تحديدًا. هذا أفضل من الإدخال اليدوي، الذي له معدل خطأ موثق بنسبة 2-5% على الأكواد الأبجدية الرقمية المدخلة تحت ضغط الوقت.

بالنسبة للمسحات منخفضة الجودة (نقل الفاكس المنسوخ، النسخ من الجيل الثالث)، تنخفض الدقة إلى 88-93%. على هذا المستوى، خطوة مراجعة بشرية للاستخراجات المنخفضة الثقة المحددة مناسبة. يستخرج النظام ما يمكنه استخراجه بثقة، ويحدد ما لا يمكنه، وينقل المستندات المحددة للمراجعة اليدوية — وهي مجموعة أصغر بكثير من حجم الوصول الكامل.

يحقق سير العمل المشترك بين الإنسان والذكاء الاصطناعي دقة أفضل من جميع اليدوي بإنتاجية أعلى: يتعامل الذكاء الاصطناعي مع 90-95% من المستندات دون تدخل بشري، والمراجعة البشرية مركزة على 5-10% حيث يكون الذكاء الاصطناعي غير متأكد.

التأثير في اتجاه مجرى الأنهار على التتبع وربط ERP

دقة رقم الحرارة ليست مشكلة جودة البيانات فقط. إنها أساس تتبع المواد في المنتجات المعادن المصنعة.

عندما يحدث حدث جودة — فشل ميداني، شكوى العميل، استدعاء — السؤال الأول هو "من أي حرارة كانت هذه المادة؟" إذا كان رقم الحرارة في سجل ERP خاطئًا، فإن استعلام التتبع يفشل. لا يمكنك تحديد الأجزاء الأخرى التي تم صنعها من نفس الحرارة. لا يمكنك سحب الشهادة الأصلية للتحقق من خصائص المادة. لا يمكنك تتبع المورد أو المصنع للإجراء التصحيحي.

في تصنيع وعاء الضغط والهياكل والأنابيب، تتبع الحرارة ليس اختياريًا. ASME Section VIII و AWS D1.1 والعديد من خطط جودة العميل تتطلب توثيق أرقام الحرارة وتتبعها من خلال سجل التصنيع إلى المنتج النهائي. نظام حفظ MTC القائم على الإدخال اليدوي ينتج سجلات تتبع بدقة متغيرة. الأخطاء صامتة — لا تعلن عن نفسها حتى يحاول شخص ما استخدام السجل.

الاستخراج الآلي مع التحقق (يتم تأكيد رقم الحرارة المستخرج مقابل ملف PDF الشهادة بعد الاستخراج) ينشئ سجلاً دقيقًا مثل الشهادة نفسها. الرابط بين سجل ERP ومستند الشهادة الأصلي تلقائي بدلاً من الاعتماد على شخص لحفظ ملف PDF الصحيح في المجلد الصحيح.

تصبح عملية إدخال البيانات اليومية لمدة 90 دقيقة أيضًا قريبة من الوقت الفعلي: يمكن معالجة الشهادات في دقائق من الاستقبال، وتكون أرقام الحرارة في ERP قبل وصول المادة إلى سقيفة الإنتاج، وسجل التتبع مكتمل قبل بدء التصنيع بدلاً من تجميعها بعد الحقيقة.

ما يجب قراءته بعد ذلك