### التفاصيل التقنية للتنفيذ
#### 1. **جمع البيانات والمعالجة المسبقة**
* **قواعد البيانات المستخدمة**:
* تم دمج قواعد بيانات عامة مثل **SMFD** و**RMFD**.
* بالإضافة إلى **جمع صور من الويب** لزيادة تنوع البيانات.
* **التوسيع (Augmentation)**:
* تم تطبيق تقنيات عديدة لتحسين قدرة النموذج على التعميم، مثل:
* التدوير، التكبير/التصغير، تعديل السطوع والتباين، والإخفاء الجزئي (occlusion).
* **تصنيف الفئات**:
* تم تحديد ثلاث فئات واضحة:
1. **with\_mask** (كمامة مرتداة بشكل صحيح)
2. **without\_mask** (لا يرتدي كمامة)
3. **mask\_weared\_incorrect** (ارتداء غير صحيح – مثل تغطية الفم دون الأنف)
---
#### 2. **نظام من مرحلتين: الكشف والتصنيف**
##### **المرحلة 1: كشف الوجه**
* **النهج**: أولاً يتم تحديد موقع الوجه في الصورة أو الفيديو.
* **النماذج المُجرّبة**:
* **Haar Cascades**: طريقة تقليدية وسريعة مناسبة للنماذج الأولية.
* **MTCNN**: دقيقة وتعمل في ظروف إضاءة وزوايا مختلفة.
* **YOLO-based Face Detection**: أسرع وأكثر دقة، مثالي للتطبيقات في الزمن الحقيقي.
##### **المرحلة 2: تصنيف حالة الكمامة**
* **معمارية النموذج**:
* تم استخدام نموذج **MobileNetV2** أو **EfficientNet**، نظرًا لكونها خفيفة وسريعة ودقيقة.
* **التعلم الانتقالي (Transfer Learning)**:
* تم استخدام أوزان مدربة مسبقًا من **ImageNet** لتقليل وقت التدريب وزيادة الدقة باستخدام بيانات محدودة.
* **التدريب**:
* تم تدريب النموذج على **صور مقطوعة للوجوه** (cropped) لتصنيفها إلى واحدة من الفئات الثلاث.
* تم تعديل الطبقة الأخيرة لتتناسب مع مشكلة التصنيف ثلاثي الفئات.
---
#### 3. **النشر في الزمن الحقيقي والتحسين**
* **الإطار المستخدم**:
* تم استخدام **OpenCV** لالتقاط فيديو ومعالجته في الزمن الحقيقي.
* **الأداء**:
* أداء شبه فوري على معالجات CPU عادية، وأداء عالي على GPU بعد التحسين:
* مثل **الكمّنة (Quantization)** أو استخدام **OpenVINO** لتحسين السرعة.
* **الناتج النهائي**:
* يتم رسم **مربعات** حول الوجوه المكتشفة، مع **تسمية توضح حالة الكمامة** وثقة التصنيف، باستخدام ألوان:
* **أخضر**: ارتداء صحيح
* **أصفر**: ارتداء غير صحيح
* **أحمر**: بدون كمامة
---
### التحديات التقنية والحلول
* **التحدي**: التغطية الجزئية للوجه (مثل النظارات أو القبعات) وتنوع ملامح الوجوه.
* **الحل**: الاعتماد على قاعدة بيانات متنوعة، مع التركيز على **منطقة الأنف والفم والذقن** بدلاً من ملامح الوجه الكاملة.
* **التحدي**: تقليل التأخير (Latency) في الفيديو الحي.
* **الحل**: استخدام معمارية خفيفة مثل **MobileNetV2** وكاشف وجوه سريع مثل **YOLO-Tiny** أو **YOLO-Nano** لخلق خط معالجة سريع وفعال.
---
### القيمة المضافة للمشروع
* **تعزيز الصحة العامة**: من خلال أداة تكنولوجية تدعم الالتزام بإجراءات السلامة.
* **قابلية التطبيق الواسعة**: يمكن نشر النظام بسهولة في أماكن حساسة مثل:
* المطارات، الجامعات، المتاجر، المكاتب الحكومية.
* **الأداء في الوقت الحقيقي**: يعمل بكفاءة على الأجهزة البسيطة دون الحاجة إلى موارد ضخمة.