قمت بتطوير نظام Backend باستخدام FastAPI يقوم بتحويل ملفات PDF الممسوحة ضوئيًا إلى نص عربي منسق بدقة عالية.
المميزات:
- قراءة ملفات PDF صفحة صفحة
- الحفاظ على ترتيب السطور كما في الملف الأصلي
- دعم اللغة العربية والإنجليزية
- إرجاع النتيجة بصيغة JSON جاهزة للعرض في أي واجهة
- مناسب للسير الذاتية، الكتب، المستندات الرسمية
التقنيات المستخدمة:
Python – FastAPI – Tesseract OCR – OpenCV – PDF2Image