تفاصيل العمل

مشروع: تحسين صور الوثائق لرفع دقة الـ OCR

نوع العمل:

تطوير برنامج معالجة صور (Image Processing Application) بلغة Python باستخدام مكتبات مثل OpenCV و NumPy.

الهدف الأساسي هو تحسين جودة الصور الممسوحة أو المصورة للوثائق المكتوبة بخط اليد أو النصوص المطبوعة لزيادة وضوحها ودقتها قبل تطبيق تقنيات OCR (التعرف الضوئي على النصوص).

ميزاته:

تحسين الحدة (Sharpening): باستخدام خوارزمية Laplacian لإبراز الحروف الباهتة.

زيادة التباين (Contrast Stretching): بتقنية percentile clipping لمعالجة مشاكل الإضاءة غير المتساوية بدون ظهور تشوهات.

إصلاح الخطوط المكسورة (Stroke Repair): عبر العمليات المورفولوجية (Morphological Closing) لإعادة ربط الحروف المكتوبة بخط ضعيف أو مكسور.

كود مرن: يمكن استخدامه على أنواع مختلفة من الوثائق (تاريخية، ممسوحة ضوئيًا، أو مصورة بكاميرا الهاتف).

تحسين دقة OCR: عبر رفع وضوح النصوص قبل تمريرها لخوارزميات التعرف الضوئي.

طريقة التنفيذ:

جمع البيانات: صور وثائق مكتوبة بخط اليد أو نصوص مصورة.

تطبيق خوارزميات المعالجة:

Sharpening لإبراز الحروف.

Contrast Stretching لتوزيع السطوع ومعالجة الظلال.

Morphological Closing لإصلاح التقطعات في النص.

المقارنة مع بدائل أخرى: تمت تجربة تقنيات مثل CLAHE و Unsharp Masking، لكن الطريقة النهائية أعطت نتائج أوضح وأكثر ثباتًا.

إخراج النتائج: حفظ الصور المحسنة بصيغة PNG بدون فقدان الجودة.

دمج مع OCR: تمرير النتائج لأدوات OCR (مثل Tesseract) للحصول على نصوص دقيقة.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات