التحدي: كانت أنظمة مراقبة الحشود التقليدية غير فعالة وتتطلب مراقبة بشرية مستمرة وتفتقر إلى قدرات التحليل الفوري لإدارة الأمان والسلامة.
الحل: قمت بتصميم ونشر منصة شاملة لمراقبة الحشود مدعومة بالذكاء الاصطناعي تجمع بين أحدث تقنيات Vision Transformers مع معالجة البث المباشر، وتشمل:
نماذج الذكاء الاصطناعي المتقدمة: تطبيق CLIP-EBC (Enhanced Blockwise Classification) مع Vision Transformer B/16 backbone، تحقيق 61.2 MAE و 278.3 RMSE على معيار NWPU - وضع أداء SOTA جديد
المعالجة في الوقت الفعلي: بناء بنية تحتية للبث المباشر قائمة على FastAPI تدعم عدة تدفقات متزامنة من YouTube/RTSP مع تحديثات كل 5 ثوان وإعادة الاتصال التلقائي
التحليل متعدد الوسائط: دمج عد الحشود، كشف الحركة (SSIM-based)، خرائط كثافة الحرارة، وطرح الخلفية لفهم شامل للمشهد
التأثير: خفض عبء المراقبة اليدوية بنسبة 80%، مكن من تنبيهات كثافة الحشود الفورية، وقدم رؤى قابلة للتنفيذ لفرق الأمان من خلال لوحة تحليل شاملة.
المهارات والتسليمات
تطوير نماذج التعلم العميق (Deep Learning)
معالجة الرؤية الحاسوبية والصور (Computer Vision)
معالجة البث المباشر (Real-Time Stream Processing)
تطوير APIs والتوثيق
التقنيات المستخدمة
تعلم الآلة: Python, PyTorch, CLIP, Vision Transformers, OpenCV
الخادم الخلفي: FastAPI,