تنفيذ حديث لنموذج التعرف على الأنشطة الجماعية باستخدام الشبكات العصبية العميقة (CVPR 2016)

تفاصيل العمل

وصف العمل

هذا المشروع عبارة عن تنفيذ حديث لورقة بحثية منشورة في مؤتمر CVPR 2016 بعنوان:

A Hierarchical Deep Temporal Model for Group Activity Recognition

المزايا الأساسية في هذا العمل:

استخدام ResNet-50 و ResNet-34 لاستخراج الخصائص بدلاً من AlexNet.

تطبيق نماذج LSTM و GRU لالتقاط العلاقات الزمنية بين اللاعبين والفرق.

تنفيذ نسخ متعددة من النماذج (من B1 حتى B9) بما في ذلك نسخة موحّدة End-to-End.

تحسين الدقة مقارنة بنتائج الورقة الأصلية (أعلى من 93%).

تنفيذ كامل باستخدام Python و PyTorch بدلاً من Caffe.

تفاصيل البيانات:

تم استخدام مجموعة بيانات من مباريات كرة الطائرة (55 فيديو – 4830 إطار).

تم تقسيم البيانات إلى تدريب – تحقق – اختبار بدقة عالية.

تتضمن التعليقات التوضيحية أنشطة فردية (9 تصنيفات) وأنشطة جماعية (8 تصنيفات).

نتائج الأداء:

Baseline 1 → دقة: 72.6%

Baseline 6 → دقة: 84.5%

Baseline 8 → دقة: 92.3%

Baseline 9 (End-to-End) → دقة: 93.1%

الأدوات والتقنيات:

Python, PyTorch

ResNet, LSTM, GRU

Kaggle GPU (P100 و T4) للتدريب

مجالات الاستخدام:

مراقبة الفيديو والتحليلات الأمنية

تحليل المباريات الرياضية

التعرف على السلوكيات الجماعية

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات