وصف العمل
هذا المشروع عبارة عن تنفيذ حديث لورقة بحثية منشورة في مؤتمر CVPR 2016 بعنوان:
A Hierarchical Deep Temporal Model for Group Activity Recognition
المزايا الأساسية في هذا العمل:
استخدام ResNet-50 و ResNet-34 لاستخراج الخصائص بدلاً من AlexNet.
تطبيق نماذج LSTM و GRU لالتقاط العلاقات الزمنية بين اللاعبين والفرق.
تنفيذ نسخ متعددة من النماذج (من B1 حتى B9) بما في ذلك نسخة موحّدة End-to-End.
تحسين الدقة مقارنة بنتائج الورقة الأصلية (أعلى من 93%).
تنفيذ كامل باستخدام Python و PyTorch بدلاً من Caffe.
تفاصيل البيانات:
تم استخدام مجموعة بيانات من مباريات كرة الطائرة (55 فيديو – 4830 إطار).
تم تقسيم البيانات إلى تدريب – تحقق – اختبار بدقة عالية.
تتضمن التعليقات التوضيحية أنشطة فردية (9 تصنيفات) وأنشطة جماعية (8 تصنيفات).
نتائج الأداء:
Baseline 1 → دقة: 72.6%
Baseline 6 → دقة: 84.5%
Baseline 8 → دقة: 92.3%
Baseline 9 (End-to-End) → دقة: 93.1%
الأدوات والتقنيات:
Python, PyTorch
ResNet, LSTM, GRU
Kaggle GPU (P100 و T4) للتدريب
مجالات الاستخدام:
مراقبة الفيديو والتحليلات الأمنية
تحليل المباريات الرياضية
التعرف على السلوكيات الجماعية