Arabic Character Recognition باستخدام EfficientNet (OCR Pipeline)
مشروع التعرّف على الحروف العربية يعتمد على نموذج Deep Learning (EfficientNet) مُدرَّب مسبقًا، حيث يقوم النظام بتنفيذ OCR Pipeline كاملة لتحويل الصور التي تحتوي على نصوص عربية إلى نص رقمي من خلال التعرّف على كل حرف على حدة.
فكرة المشروع:
بدل التعرّف على الكلمة كاملة، يقوم النظام باستخراج كل حرف منفصل من الجملة ثم إدخاله إلى نموذج EfficientNet المتدرّب للتعرّف عليه بدقة، مما يسمح بالتعامل مع الجمل العربية بمختلف أطوالها.
آلية العمل:
إدخال صورة تحتوي على جملة أو نص عربي
تنفيذ OCR مبدئي لاكتشاف مناطق النص
تقسيم النص إلى حروف منفصلة (Character Segmentation)
تحويل كل حرف إلى صورة مستقلة
إدخال كل صورة إلى نموذج EfficientNet المتدرّب
تجميع الحروف لإنتاج النص النهائي
التقنيات المستخدمة:
Python
EfficientNet (Pre-trained Model)
OpenCV (Image Processing & Character Segmentation)
OCR Pipeline
NumPy
مميزات المشروع:
التعرّف على كل حرف بشكل مستقل
دعم النصوص العربية
إمكانية التعامل مع جمل كاملة
نموذج جاهز ومُدرَّب
Pipeline مرنة وقابلة للتطوير
استخدامات المشروع:
أنظمة OCR للغة العربية
رقمنة النصوص والمستندات
تحليل النصوص من الصور
مشاريع بحثية وتطبيقات AI