مشروع متكامل لاستخراج البيانات من الفواتير المصورة باستخدام نماذج التعلم العميق وتحديدا نموذج (LayoutLMv3).
النظام يعالج 7,000 فاتورة حقيقية ويستخرج 15 نوع من البيانات المهمة:
• أسماء الشركات والعناوين
• أرقام الفواتير والتواريخ
• تفاصيل المنتجات والأسعار
• الإجماليات والضرائب
التحديات التقنية المحلولة:
معالجة نصوص OCR غير دقيقة
استخراج بيانات متعددة الكلمات (عناوين، أسماء منتجات)
التعامل مع الجداول والأرقام
بناء خط معالجة كامل (preprocessing → training → inference)
النتائج:
• دقة F1: 61%
• معالجة 50,000+ كيان
• توازن بين Precision و Recall
• نظام جاهز للإنتاج ومقاوم لأخطاء OCR
المشروع يركز على الهندسة العملية وحل مشاكل البيانات الحقيقية.