قمت بتصميم وتدريب نموذج Deep Q-Network (DQN) ليُتقن لعبة 2048 بشكل تلقائي.
المشروع شمل:
- بناء بيئة محاكاة لعبة 2048 بكود مخصص للتعامل مع حالات البورد.
- تصميم شبكات عصبية (Convolution + Fully Connected) باستخدام مكتبة TensorFlow / Keras.
- استخدام تقنيات Replay Buffer و Target Network لضمان استقرار التعلم.
- ضبط دالة المكافأة (reward shaping) لمعاقبة الحركات غير المُجدية وتشجيع الوصول للبلاطات الكبيرة.
- متابعة تدريب النموذج وعرض التطورات باستخدام أدوات مثل TensorBoard و Matplotlib.
- التعامل مع مشاكل الأداء والذاكرة عند تشغيل النموذج على GPU، وتفعيل آلية نمو استهلاك الذاكرة (memory growth).
- التجربة أو التقييم بعدد من الحلقات لقياس المتوسط، أفضل نتيجة، أقصى بلاطة.
المشروع يُظهر قدرتي على بناء نماذج تعلم تعزيزي من الصفر، وتحسين الأداء والتعامل مع تحديات البرمجة والنمذجة في بيئات معقدة.