طورت نظام متكامل لقراءة ومعالجة الفورمات الورقية (Paper Forms) بشكل أوتوماتيكي، بيقدر ياخد صور الفورمات الممسوحة ويستخرج منها البيانات بدقة عالية ويخزنها في قاعدة بيانات.
التحدي: الفورمات كانت فيها:
شبكات bubbles معقدة (Multiple choice grids)
حقول نصية بالعربي والإنجليزي
Checkboxes متنوعة (Day/Night, True/False)
صور مختلفة الجودة والإضاءة
- الحل اللي قدمته (Solution)
المكون التفاصيل
Image Preprocessing تدوير تلقائي، تنعيم، إزالة الضوضاء، تحسين التباين
Field Detection تحديد موقع كل حقل في الفورم (ID, Name, Date, Bubbles)
OCR Engine استخدمت paddle ocr للتعرف على النصوص
Bubble Recognition خوارزمية custom للتعرف على الدوائر المظللة
Data Validation التأكد من صحة البيانات المستخرجة
Database Integration تخزين مباشر في MySQL بصيغة منظمة
أمثلة من العمل (Work Samples)
الإدخال: صور فورمات ورقية (JPEG/PNG)
المخرجات: JSON منظم + تخزين في Database
JSON
{
"id": "1111",
"dt": "11",
"day_or_night": "day",
"name": "عمر محمد",
"date": "2020-01-01"
}
?️ التقنيات المستخدمة (Tech Stack)
Python - اللغة الأساسية
OpenCV - معالجة الصور
Paddle ocr - دعم أفضل للعربي
NumPy/Pandas - معالجة البيانات
MySQL - قاعدة البيانات
Flask - API بسيط للـ Integration