يركّز هذا المشروع على تنفيذ خط أنابيب متكامل للرؤية الحاسوبية (End-to-End Computer Vision Pipeline) باستخدام لغة Python، حيث يجمع بين تقنيات معالجة الصور التقليدية ونماذج التعلم العميق.
بدأ المشروع بمرحلة تحميل الصور ومعالجتها مبدئيًا (Preprocessing)، والتي شملت:
تغيير حجم الصور (Resizing)
تدوير الصور (Rotation)
تحويلها إلى تدرج الرمادي (Grayscale Conversion)
تطبيق المرشحات (Filtering)
كشف الحواف (Edge Detection)
كشف الزوايا (Corner Detection)
تقسيم الصور (Image Segmentation)
بعد ذلك، تم تجهيز مجموعة بيانات للصور وبناء نموذجين للتصنيف:
شبكة عصبية التفافية (CNN)
شبكة متعددة الطبقات (MLP)
تم تقييم أداء النماذج باستخدام:
دقة التصنيف (Accuracy)
منحنيات الخطأ (Loss Curves)
مصفوفة الارتباك (Confusion Matrix)
وأظهرت النتائج تفوق نموذج الـ CNN على نموذج الـ MLP في تصنيف الصور، نظرًا لقدرة الشبكات الالتفافية على الحفاظ على الخصائص المكانية (Spatial Features) داخل الصورة.
يوضح هذا المشروع كيفية دمج تقنيات الرؤية الحاسوبية التقليدية مع التعلم العميق لبناء أنظمة فعّالة لتصنيف الصور.
الأدوات والتقنيات المستخدمة:
Python
OpenCV
PIL
NumPy
Matplotlib
Scikit-learn