مشروع: تحسين صور الوثائق لرفع دقة الـ OCR
نوع العمل:
تطوير برنامج معالجة صور (Image Processing Application) بلغة Python باستخدام مكتبات مثل OpenCV و NumPy.
الهدف الأساسي هو تحسين جودة الصور الممسوحة أو المصورة للوثائق المكتوبة بخط اليد أو النصوص المطبوعة لزيادة وضوحها ودقتها قبل تطبيق تقنيات OCR (التعرف الضوئي على النصوص).
ميزاته:
تحسين الحدة (Sharpening): باستخدام خوارزمية Laplacian لإبراز الحروف الباهتة.
زيادة التباين (Contrast Stretching): بتقنية percentile clipping لمعالجة مشاكل الإضاءة غير المتساوية بدون ظهور تشوهات.
إصلاح الخطوط المكسورة (Stroke Repair): عبر العمليات المورفولوجية (Morphological Closing) لإعادة ربط الحروف المكتوبة بخط ضعيف أو مكسور.
كود مرن: يمكن استخدامه على أنواع مختلفة من الوثائق (تاريخية، ممسوحة ضوئيًا، أو مصورة بكاميرا الهاتف).
تحسين دقة OCR: عبر رفع وضوح النصوص قبل تمريرها لخوارزميات التعرف الضوئي.
طريقة التنفيذ:
جمع البيانات: صور وثائق مكتوبة بخط اليد أو نصوص مصورة.
تطبيق خوارزميات المعالجة:
Sharpening لإبراز الحروف.
Contrast Stretching لتوزيع السطوع ومعالجة الظلال.
Morphological Closing لإصلاح التقطعات في النص.
المقارنة مع بدائل أخرى: تمت تجربة تقنيات مثل CLAHE و Unsharp Masking، لكن الطريقة النهائية أعطت نتائج أوضح وأكثر ثباتًا.
إخراج النتائج: حفظ الصور المحسنة بصيغة PNG بدون فقدان الجودة.
دمج مع OCR: تمرير النتائج لأدوات OCR (مثل Tesseract) للحصول على نصوص دقيقة.