نظام التعرف على الأنشطة الجماعية في الفيديو باستخدام التعلم العميق (Group Activity Recognition)

تفاصيل العمل

قمت في هذا العمل بتطوير نظام ذكاء اصطناعي متقدم يعتمد على التعلم العميق (Deep Learning) ومجال الرؤية الحاسوبية (Computer Vision)، يهدف إلى تحليل مقاطع الفيديو والتعرف الآلي على الأنشطة الجماعية للأشخاص (Group Activity Recognition) مثل (المشي الجماعي، الانتظار، التحدث، وغيرها).

نوع العمل والمنهجية: يندرج المشروع تحت تصنيف "تحليل الفيديو" (Video Action Analysis)، حيث تم دمج الشبكات العصبية لاستخراج الخصائص المكانية والزمانية (Spatio-Temporal Features) لفهم سلوك المجموعات بدقة.

مراحل التنفيذ والتقنيات المطبقة:

معالجة الفيديو (Video Preprocessing): تقسيم الفيديو إلى إطارات (Frames)، استخدام مكتبة OpenCV للكشف عن الأشخاص (Person Detection)، وتجهيز البيانات للدخول للشبكة العصبية.

بناء معمارية النموذج (Model Architecture): استخدام نموذج هجين يجمع بين:

CNN (مثل ResNet/Inception): لاستخراج خصائص الصور وفهم ملامح الأشخاص في كل إطار.

RNN/LSTM: لتحليل التسلسل الزمني (Time Series) وفهم حركة الأشخاص عبر الزمن.

التدريب والتحسين (Training): تدريب النموذج على Dataset ضخمة، وضبط المعاملات (Hyperparameters) لتقليل نسبة الخطأ (Loss Function).

التقييم: تحقيق دقة تصنيف عالية (Accuracy) بلغت 85% واختبار النموذج على فيديوهات جديدة لم يرها من قبل.

التقنيات والأدوات المستخدمة:

اللغة: Python 3.

أطر العمل (Frameworks): TensorFlow / Keras (أو PyTorch).

معالجة الصور: OpenCV.

التعامل مع المصفوفات: NumPy.

النتيجة النهائية: تم بناء نموذج قادر على قراءة ملفات الفيديو وتصنيف النشاط الظاهر بدقة عالية، مع تسليم كود مصدري منظم (Clean Code) وتقرير يوضح معمارية الشبكة العصبية والنتائج.

يمكنك الاطلاع على عينة من نتائج التعرف على الأنشطة في الصور المرفقة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
7
تاريخ الإضافة
تاريخ الإنجاز
المهارات