تطوير وكيل ذكاء اصطناعي (AI Agent) لبيئات الألعاب المعقدة باستخدام PPO

تفاصيل العمل

يهدف هذا المشروع إلى تطبيق خوارزميات تعلم التعزيز (Reinforcement Learning) لتطوير وكيل ذكي قادر على اتخاذ القرارات في بيئات ديناميكية. استخدمت خوارزمية Proximal Policy Optimization (PPO) لتدريب الوكيل في بيئة Flappy Bird و Riverraid. تم تدريب النموذج لأكثر من 2,000,000 خطوة زمنية (Timesteps) حتى وصل إلى مرحلة الاستقرار وتحقيق أعلى مكافأة ممكنة. يتضمن المشروع التعامل مع مكتبات Gymnasium و Stable Baselines3.

ملفات مرفقة

- MP4
- FlappyBirdVideo…99999999966.mp4
- (92KB)
- MP4
- FlappyBirdVideo…99999999952.mp4
- (124.27KB)
- MP4
- FlappyBirdVideo…00000000023.mp4
- (136.28KB)
- MP4
- FlappyBirdVideo…00000000033.mp4
- (263.81KB)
- MP4
- FlappyBirdVideo…00000000027.mp4
- (221.47KB)
- MP4
- FlappyBirdVideo…00000000564.mp4
- (444.61KB)
- MP4
- FlappyBirdVideo…00000000574.mp4
- (397.51KB)
- MP4
- FlappyBirdVideo…99999999998.mp4
- (556.98KB)
- MP4
- FlappyBirdVideo…99999999933.mp4
- (547.8KB)
- MP4
- FlappyBirdVideo…99999999718.mp4
- (844.15KB)
- MP4
- randomflappybirdepisodes.mp4
- (192.92KB)

بطاقة العمل

اسم المستقل

Abdalla M.

عدد الإعجابات

عدد المشاهدات

تاريخ الإضافة

14/02/2026

تاريخ الإنجاز

05/11/2025

المهارات

تطوير وكيل ذكاء اصطناعي (AI Agent) لبيئات الألعاب المعقدة باستخدام PPO

تفاصيل العمل

ملفات مرفقة

بطاقة العمل

روابط

تابع مستقل على

وسائل الدفع المتاحة