تفاصيل العمل

طوّرت Document Extraction Pipeline لصالح STC Pay لمعالجة ملفات financial PDFs ذات التخطيطات المعقدة، بهدف استخراج البيانات المهمة منها وتحويلها إلى معلومات منظمة قابلة للاستخدام في الأنظمة الداخلية.

اعتمد النظام على توجيه الصفحات تلقائيًا بين OCR و Vision-Language Models بناءً على درجة تعقيد الـ layout في كل صفحة، مما ساعد على تحسين استخراج الـ structured fields من مستندات الشركات المعقدة وتقليل الأخطاء الناتجة عن المعالجة التقليدية.

حقق النظام دقة تقارب 95% field-level accuracy على 200-page holdout test set، وتم استخدامه لتحسين سرعة ودقة استخراج البيانات من المستندات المالية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات