الوصف: يهدف المشروع إلى تطوير نموذج يعتمد على تقنيات الذكاء الاصطناعي لحساب عدد الأشخاص في الصور الملتقطة من الأماكن المزدحمة. يتم دمج نموذج YOLO (You Only Look Once) للكشف عن الأجسام مع CSRNet (Convolutional Neural Network for Crowd Counting) لتحسين دقة تقدير عدد الأشخاص في الصور الملتقطة من الزوايا الواسعة أو الأماكن العامة مثل الشوارع، الملاعب، والاحتفالات.
الخطوات الرئيسية:
جمع البيانات: تم استخدام مجموعات بيانات متخصصة في حساب أعداد الحشود، مثل مجموعة بيانات ShanghaiTech، التي تحتوي على آلاف الصور مع الحشود المختلفة وتحتوي على التعليقات الخاصة بعدد الأشخاص في كل صورة.
معالجة البيانات:
تم تطبيق عمليات ما قبل المعالجة مثل تصحيح الإضاءة وتوحيد حجم الصور.
تقسيم الصور إلى مجموعات تدريب، واختبار، وتحقق لضمان التقييم العادل لأداء النموذج.
استخدام YOLO للكشف عن الأجسام:
تم استخدام نموذج YOLO في المرحلة الأولى لاكتشاف الأشخاص في الصور الكبيرة والمعقدة. YOLO قادر على اكتشاف الأشخاص بسرعة وكفاءة، مما يساعد في تحديد مواقع الأشخاص بشكل دقيق.
بعد اكتشاف الأشخاص، يتم إنشاء مربعات محيطة (bounding boxes) حول كل شخص في الصورة، والتي ستُستخدم لاحقًا في تحسين تقدير العدد.
تطبيق CSRNet لتقدير الكثافة:
CSRNet هو نموذج يعتمد على الشبكات العصبية التلافيفية (CNN) ويُستخدم لتقدير خرائط الكثافة (Density Maps). لكل صورة، يقوم CSRNet بتوليد خريطة كثافة تمثل توزيع الأشخاص في المشهد.
يتم دمج نتائج YOLO وCSRNet حيث يُستخدم YOLO لاكتشاف الأشخاص الفرديين في المناطق القليلة الكثافة، بينما يُستخدم CSRNet لتقدير الكثافة في المناطق المزدحمة التي يصعب فيها اكتشاف الأشخاص بشكل فردي.
التدريب والتقييم:
تم تدريب النموذج باستخدام الصور والتعليقات المدرجة في البيانات، مع استخدام خوارزمية MSE (Mean Squared Error) كدالة خسارة لتقليل الفرق بين العدد المتوقع من الأشخاص والعدد الحقيقي.
تم تقييم النموذج باستخدام مقاييس مثل MAE (متوسط الخطأ المطلق) وMSE لضمان دقة عالية في التقديرات.
اسم المستقل | Alaa H. |
عدد الإعجابات | 0 |
عدد المشاهدات | 9 |
تاريخ الإضافة |