Skip to main content
คู่มือ·2 นาทีในการอ่าน·

การตรวจสอบความแม่นยำของการสกัดด้วย AI: แบบจำลองมนุษย์ในวงจร

คำตอบด่วน

Quick Answer

การตรวจสอบวงจรมนุษย์สำหรับการสกัดใบรับรองด้วย AI นำเสนอเขตข้อมูลความเชื่อมั่นต่ำที่ทำเครื่องหมายให้ผู้ตรวจสอบพร้อมกับเอกสารต้นฉบับ บันทึกการแก้ไขแต่ละครั้งด้วยประทับเวลาและตัวตนของผู้ใช้ และสร้างห่วงโซ่หลักฐานที่ตรวจสอบได้ซึ่งเป็นไปตามข้อกำหนดการปฏิบัติตามข้อบังคับ—โดยไม่ต้องให้ผู้ตรวจสอบตรวจสอบเขตข้อมูลแต่ละแห่งบนเอกสารแต่ละอีกครั้ง

วลี "การสกัดด้วย AI" หมายถึงระดับของการทำให้เป็นอัตโนมัติที่ทำให้ผู้จัดการควบคุมคุณภาพบางคนรู้สึกกังวลอย่างสมควร การสกัดใบรับรองการทดสอบโรงสีที่ผิดแต่ยอมรับว่าถูกต้องอาจเป็นเรื่องที่แย่กว่าการสกัดที่ไม่เคยถูกสกัดมาก่อน—มันให้ความมั่นใจที่เท็จ การตรวจสอบวงจรมนุษย์เป็นกลไกที่ทำให้การสกัด AI น่าเชื่อถือมากกว่าเพียงแค่รวดเร็ว

คำแนะนำนี้อธิบายวิธีการทำงานของแบบจำลองการตรวจสอบนั้น วิธีการกำหนดค่าสำหรับความอดทนต่อความเสี่ยง และรูปลักษณ์ของการติดตามการตรวจสอบ


เหตุใดการสกัด AI จึงต้องการระดับการตรวจสอบ

แบบจำลอง AI เป็นแบบจำลองที่น่าจะเป็น แบบจำลองเดียวกันที่สกัดค่าเคมี 97% อย่างถูกต้องจะอ่าน 3% ที่เหลือผิด ซึ่งแตกต่างจากมนุษย์ที่อาจหยุดชั่วคราวที่ค่าที่ผิดปกติและตรวจสอบอีกครั้ง แบบจำลองจะส่งออกการประมาณการที่ดีที่สุดด้วยคะแนนความเชื่อมั่น—มันไม่รู้ว่ามันไม่รู้วิธีที่ผู้เชี่ยวชาญด้านมนุษย์รู้

สำหรับแอปพลิเคชันที่มีความเสี่ยงต่ำ (การเติมดัชนีการค้นหาโดยอัตโนมัติ การเติมเรคคอร์ดฉบับร่างสำหรับการตรวจสอบหลัง) นี่เป็นเรื่องที่ยอมรับได้ สำหรับแอปพลิเคชันที่มีความสำคัญเกี่ยวกับการปฏิบัติตามข้อบังคับ—ความสามารถในการติดตามวัสดุสำหรับเรือบรรทุกความดัน การรับรองเหล็กโครงสร้างภายใต้ EN 1090 หรือบันทึก NDT ภายใต้ ASME Section V—การสกัด AI ที่ไม่ได้รับการตรวจสอบไม่ใช่หลักฐานเพียงพอของการปฏิบัติตามข้อบังคับ

แบบจำลองมนุษย์ในวงจรไม่ขอให้มนุษย์ทำงานที่ AI ทำซ้ำ มันขอให้พวกเขาเน้นความสนใจเป็นพิเศษในกรณีที่ AI ไม่มั่นใจ ในขณะที่เชื่อว่าการสกัดความเชื่อมั่นสูงจะไหลผ่านโดยอัตโนมัติ


คะแนนความเชื่อมั่น: คืออะไรและทำงานอย่างไร

ฟิลด์ทั้งหมดที่สกัดโดยตัวสกัดที่ใช้ LLM มีคะแนนความเชื่อมั่น—โดยทั่วไปค่าจาก 0.0 ถึง 1.0 ที่แสดงถึงการประเมินความน่าจะเป็นตนเองของแบบจำลองที่มูลค่าที่สกัดมาถูกต้อง

สิ่งที่ขับเคลื่อนความเชื่อมั่นต่ำ:

  • การแสดงผลอักขระที่คลุมเครือ (1 เทียบกับ l, 0 เทียบกับ O ในแบบอักษรบางตัว)
  • ข้อความที่ทับซ้อนกันหรือสิ่งประดิษฐ์ภาพใกล้เขตข้อมูล
  • โครงสร้างตารางที่ผิดปกติที่ต้องการการอนุมานคอลัมน์
  • ค่าที่อยู่นอกช่วงที่คาดไว้ของแบบจำลองสำหรับประเภทฟิลด์
  • คำอธิบายประกอบที่เขียนด้วยลายมือใกล้บริเวณที่สกัด
  • ความละเอียดในการสแกนต่ำในพื้นที่ของเขตข้อมูล

สิ่งที่คะแนนความเชื่อมั่นไม่ได้บันทึก:

  • ข้อผิดพลาดทางศัมพันธ์ (แบบจำลองสกัดตัวเลขที่ถูกต้อง แต่จากคอลัมน์ที่ผิด)
  • ค่าที่ดูสมเหตุสมผล แต่ผิด (ค่าคาร์บอน 0.22 เป็นการอ่านคาร์บอนที่ถูกต้อง แม้ว่าค่าที่แท้จริงคือ 0.12)
  • ข้อผิดพลาดที่มั่นใจและผิด (แบบจำลองผิดเกี่ยวกับอักขระชัดเจนที่อ่านผิดอย่างต่อเนื่อง)

นี่คือเหตุผลที่การให้คะแนนความเชื่อมั่นเป็นกลไกควบคุมคุณภาพที่จำเป็นแต่ไม่พอ มันจับกรณีที่แบบจำลองไม่มั่นใจ การตรวจสอบรอง—การตรวจสอบช่วงเทียบกับมาตรฐานที่ใช้บังคับ—จะจับกรณีที่การสกัดที่มั่นใจสร้างค่าที่ไม่น่าจะเป็นไปได้


การกำหนดค่าเกณฑ์การตรวจสอบ

ขั้นตอนการทำงานการตรวจสอบที่ออกแบบมาอย่างดีช่วยให้สามารถกำหนดค่าเกณฑ์ในหลายระดับ:

ระดับประเภทเอกสาร: เรือบรรทุกความดัน MTCs อาจส่งเส้นทางฟิลด์มากขึ้นไปยังการตรวจสอบมากกว่าใบรับรองเหล็กโครงสร้างสินค้า—โปรไฟล์ความเสี่ยงที่แตกต่างกันยุติธรรมเกณฑ์ที่แตกต่างกัน

ระดับประเภทฟิลด์: หมายเลขความร้อนและการอ้างอิงมาตรฐานอาจมีเกณฑ์ที่เข้มงวดกว่าเขตข้อมูลหมายเหตุเสริมซึ่งสะท้อนความสำคัญสัมพัทธ์สำหรับการติดตาม

ระดับซัพพลายเยอร์: ผู้จัดหาใหม่ที่ไม่มีประวัติการสกัดอาจส่งเส้นทางเอกสารมากขึ้นไปยังการตรวจสอบแบบเต็มในตอนแรก ผู้จัดหาที่มีประวัติการสกัด 12 เดือนที่สะอาดอาจมีเกณฑ์ที่ยืดหยุ่น

คำแนะนำเกณฑ์ที่ใช้งานได้:

แอปพลิเคชันเกณฑ์ความเชื่อมั่นที่ขอแนะนำสำหรับการตรวจสอบอัตราการตรวจสอบที่คาดหวัง
เหล็กโครงสร้างสินค้า0.905–15% ของเขตข้อมูล
ส่วนประกอบเรือบรรทุกความดัน0.8515–25% ของเขตข้อมูล
นิวเคลียร์ / อวกาศ0.80 หรือต่ำกว่า25–40% ของเขตข้อมูล
วัสดุอุตสาหกรรมฟาร์มาซูติคัลที่ได้รับการควบคุมการตรวจสอบด้วยตนเองทั้งหมด100% ของเขตข้อมูล

"อัตราการตรวจสอบ" ที่นี่หมายถึงสัดส่วนของเขตข้อมูลที่ผู้ตรวจสอบต้องยืนยันอย่างแข็งขัน การสกัดความเชื่อมั่นสูงจะถูกยอมรับโดยอัตโนมัติ เฉพาะเขตข้อมูลที่ทำเครื่องหมายไว้เท่านั้นที่ต้องการความสนใจของมนุษย์


ขั้นตอนการทำงานของผู้ตรวจสอบ

เมื่อเอกสารเข้าคิวการตรวจสอบ อินเตอร์เฟซผู้ตรวจสอบควรนำเสนอ:

มุมมองหน้าจออแบบแยก: PDF ต้นฉบับทางด้านซ้าย เขตข้อมูลที่สกัดมาทางด้านขวา ผู้ตรวจสอบไม่ควรต้องอพยพจากอินเตอร์เฟซการตรวจสอบเพื่อปรึกษาเอกสารต้นฉบับ

ไฮไลต์ฟิลด์: เมื่อผู้ตรวจสอบเลือกฟิลด์ที่ทำเครื่องหมายไว้ บริเวณที่สอดคล้องกันในเอกสารต้นฉบับควรถูกไฮไลต์—เพื่อให้ผู้ตรวจสอบสามารถเห็นได้ว่าแบบจำลองอ่านอะไร

การแก้ไขแบบอินไลน์: ผู้ตรวจสอบแก้ไขค่าโดยตรงในแผง Fieldfield แบบจำลองควรตรวจสอบการแก้ไขจากรูปแบบที่คาดไว้ (ช่วงตัวเลข รหัสมาตรฐานที่ทราบ) ก่อนยอมรับ

ตัวเลือกปฏิเสธ/สกัดซ้ำ: หากการสกัดแย่พอที่ฟิลด์ต่อฟิลด์ช้ากว่าการป้อนข้อมูลด้วยตนเองอย่างสมบูรณ์ ผู้ตรวจสอบควรสามารถปฏิเสธการสกัดและเรียกใช้การป้อนข้อมูลด้วยตนเองสำหรับเอกสารนั้น

การตรวจสอบเป็นแบบสำหรับเอกสารที่คล้ายกัน: สำหรับชุดใบรับรองที่มีรูปแบบเหมือนกันจากโรงสีเดียวกัน ผู้ตรวจสอบสามารถประมวลผลเขตข้อมูลที่ทำเครื่องหมายไว้ในโหมดแบบสามารถเห็นอินสแตนซ์ทั้งหมดของประเภทฟิลด์เฉพาะบนเอกสารหลายรายการพร้อมกัน

แพลตฟอร์มเช่น TestCert ใช้อินเตอร์เฟซการตรวจสอบแบบไหล่เคียงนี้พร้อมไฮไลต์ระดับฟิลด์ ซึ่งทำให้ขั้นตอนการตรวจสอบมีประสิทธิภาพพอที่แม้แต่การกำหนดค่าอัตราการตรวจสอบสูงจะเพิ่มเพียง 2–5 นาทีต่อเอกสารเมื่อเทียบกับการยอมรับโดยอัตโนมัติ


รอยติดตามการตรวจสอบ

สำหรับแอปพลิเคชันการปฏิบัติตามข้อบังคับ บันทึกเหตุการณ์การสกัดมีความสำคัญเท่ากับข้อมูลที่สกัด รายการแต่ละรายการในการติดตามการตรวจสอบควรบันทึก:

  • ตัวระบุเอกสาร (ไม่ซ้ำกันภายในระบบ)
  • ประทับเวลาการสกัด
  • เวอร์ชันแบบจำลองที่ใช้
  • ค่าที่สกัดต่อฟิลด์ คะแนนความเชื่อมั่น และการตัดสินใจยอมรับโดยอัตโนมัติ/ธงการตรวจสอบ
  • หากทำการตรวจสอบ: ตัวตนผู้ตรวจสอบ ประทับเวลาการตรวจสอบ ค่าเดิม ค่าที่แก้ไข (หรือยืนยันค่าเดิม)
  • ค่าที่ยอมรับสุดท้ายสำหรับแต่ละเขตข้อมูล
  • ผลการตรวจสอบมาตรฐาน (ผ่าน/ไม่ผ่านตามมาตรฐานที่ใช้บังคับ พร้อมเวอร์ชันมาตรฐานที่ตรวจสอบ)

บันทึกนี้ประกอบด้วยห่วงโซ่หลักฐานสำหรับผู้ตรวจสอบหรือผู้บังคับใจที่ถามว่า "คุณจะรู้ได้อย่างไรว่าค่าคาร์บอนในบันทึกวัสดุของคุณถูกต้อง"

คำตอบกลายเป็น: "ค่าได้รับการสกัดจากใบรับรองเดิม [ID เอกสาร] ทำการตรวจสอบโดย [ชื่อผู้ตรวจสอบ] ในวันที่ [วันที่] และตรวจสอบความถูกต้องกับ [ASTM A106 Grade B เวอร์ชัน 2024] PDF ต้นฉบับจะถูกเก็บรักษาไว้ในที่เก็บข้อมูลที่ไม่เปลี่ยนแปลงที่ [อ้างอิง]"


การปรับปรุงต่อเนื่องผ่านการตรวจสอบความเห็น

การแก้ไขของผู้ตรวจสอบเป็นสัญญาณการฝึกอบรมที่มีค่า การแก้ไขแต่ละครั้งระบุกรณีที่แบบจำลองผิดพลาด (หรือไม่มั่นใจ) เกี่ยวกับชุดประเภทเอกสารและฟิลด์เฉพาะ ในเวลากำลังจะมา สัญญาณนี้สามารถใช้เพื่อ:

  • ปรับแต่งแบบจำลองการสกัดในคลังเอกสารซัพพลายเยอร์เฉพาะของคุณ
  • อัปเดตแม่แบบการสกัดหรือคำแนะนำ
  • ปรับเกณฑ์ความเชื่อมั่นตามอัตราบวกเท็จและเท็จลบที่สังเกตได้
  • ทำเครื่องหมายข้อผิดพลาดอย่างเป็นระบบ (PDF จากโรงสีเฉพาะนั้นสับสนแบบจำลองอยู่เสมออ้อมหนึ่งประเภทฟิลด์) สำหรับการแก้ไขที่มีเป้าหมาย

องค์กรที่ถือว่าขั้นตอนการทำงานการตรวจสอบเป็นวงจรข้อมูลจะเห็นการปรับปรุงความแม่นยำในการสกัดอย่างต่อเนื่องในระหว่าง 6–18 เดือนเมื่อแบบจำลองเรียนรู้คลังเอกสารเฉพาะของคุณ ผู้ที่ถือว่าการตรวจสอบเป็นค่าใช้จ่ายมินิมัมล้วนๆนั้นไม่ใช่


คำถามที่พบบ่อย

การสกัดอัตโนมัติอย่างเต็มที่ (ไม่มีการตรวจสอบของมนุษย์) สามารถยอมรับได้หรือไม่

สำหรับแอปพลิเคชันที่ไม่สำคัญจากการปฏิบัติตามข้อบังคับ—เติมเรคคอร์ดฉบับร่างที่จะได้รับการตรวจสอบในระหว่างขั้นตอนการตรวจสอบการรับเข้าแยก—การสกัดอัตโนมัติเต็มที่อาจป้องกัน สำหรับแอปพลิเคชันที่เรคคอร์ดที่สกัดมาเป็นหลักฐานหลักของการปฏิบัติตามข้อบังคับวัสดุ รูปแบบบางส่วนของการตรวจสอบของมนุษย์จำเป็นต้องมีระบบการจัดการคุณภาพและกรอบข้อบังคับส่วนใหญ่ การตรวจสอบไม่จำเป็นต้องเป็นทุกด้าน มันจำเป็นต้องเป็นระบบและสามารถตรวจสอบได้

คุณจะป้องกันไม่ให้ผู้ตรวจสอบเหนื่อยล้าจากการลดคุณภาพการตรวจสอบได้อย่างไร

ให้นั่งเล่นการตรวจสอบสั้นๆ (น้อยกว่า 30 นาทีต่อเซสชัน) นำเสนอเขตข้อมูลในอินเตอร์เฟซที่ชัดเจนทางสายตาซึ่งลดภาระความรู้ความเข้าใจ และใช้การสอบเทียมเกณฑ์เพื่อให้อัตราการตรวจสอบต่ำพอเพื่อให้ผู้ตรวจสอบพบกับกรณีที่ไม่แน่นอนจริงๆแทนการยืนยันค่าที่ชัดเจน การฝึกอบรมผู้ตรวจสอบสิ่งที่ต้องมองหา (ไม่ใช่แค่ "ตรวจสอบเขตข้อมูลนี้" แต่ "นี่คือรูปแบบข้อผิดพลาดทั่วไปสำหรับซัพพลายเยอร์นี้") ยังช่วยปรับปรุงคุณภาพการตรวจสอบ

จะเกิดอะไรขึ้นเมื่อผู้ตรวจสอบทำการแก้ไขที่ไม่ถูกต้อง

การติดตามการตรวจสอบจะบันทึกการแก้ไขของผู้ตรวจสอบเป็นค่าที่ยอมรับด้วยตัวตนของผู้ตรวจสอบ หากการตรวจสอบดาวน์สตรีม (การตรวจสอบมาตรฐาน การตรวจสอบ หรือการตรวจสอบ QC) จะจับข้อผิดพลาด การติดตามจะแสดงว่าได้นำเข้ามาในที่ที่แน่นอน ระบบบางระบบใช้ขั้นตอนผู้ตรวจสอบคนที่สองสำหรับการแก้ไขที่มีความเสี่ยงสูง—คล้ายกับหลักการสี่ตาในการควบคุมทางการเงิน

การตรวจสอบวงจรมนุษย์เป็นไปตามข้อกำหนดลายเซ็นอิเล็กทรอนิกส์ 21 CFR Part 11 หรือไม่

การยืนยันของผู้ตรวจสอบที่บันทึกด้วยตัวตนผู้ใช้ที่ไม่ซ้ำใครและประทับเวลาเป็นไปตามข้อกำหนดการติดตามการตรวจสอบพื้นฐานของ 21 CFR Part 11 การปฏิบัติตามข้อบังคับที่สมบูรณ์ยังต้องมีการควบคุมการเข้าถึง (รหัสผ่าน + PIN หรือ MFA) เอกสารตรวจสอบระบบ และแนวปฏิบัติการเก็บรักษาบันทึกเฉพาะ ปรึกษาทีมการปฏิบัติตามข้อบังคับทางด้านวิศวกรรมของคุณสำหรับแอปพลิเคชันเฉพาะของคุณ

คิวการตรวจสอบควรได้รับการสั่งลำดับอগวาเพื่อให้เหมาะกับปริมาณ

ให้คุณลักษณะตามความสำคัญของวัสดุและการสั่งลำดับการเปิดตัวปลายน้ำไม่ใช่ตามเวลาที่มาถึง ใบรับรองสำหรับองค์ประกอบการรักษาความดันที่บล็อกการทดสอบแสดงสถิตยศาสตร์ควรมาก่อนใบรับรองสำหรับสมาชิกโครงสร้างสินค้าที่ไม่ได้อยู่บนเส้นทางวิจารณ์ ระบบที่อนุญาตให้ติดแท็กลำดับความสำคัญที่จุดรับเข้าจะเปิดใช้งานการเลือกสรรนี้

Ready to automate your certificate workflow?

Try TestCert free

คำแนะนำที่เกี่ยวข้อง