Sudoku Solving using Reinforcement Learning
طورت نموذجًا ذكيًا لحل ألغاز Sudoku باستخدام تقنيات التعلم المعزز (Reinforcement Learning) ضمن بيئة مخصصة تحاكي خطوات اللاعب البشري. المشروع يدمج بين الفهم الرياضي للعبة وتقنيات الذكاء الاصطناعي لصنع وكيل (Agent) قادر على حل الألغاز بطريقة فعّالة واستراتيجية دون الاعتماد على حلول مبرمجة مسبقًا (rule-based).
أبرز المكونات:
بناء بيئة تفاعلية مخصصة (Custom Gym Environment) لتمثيل لعبة Sudoku بمرونة ودقة.
استخدام خوارزمية Double Deep Q-Learning (Double DQN) مع Replay Buffer لتقوية عملية التعلم وتفادي التكرار.
تم تدريب النموذج على مجموعة ضخمة من ألغاز Sudoku (مثل مجموعة “1 Million Sudoku” من Kaggle).
الوكيل يتعلم من التجربة ويتكيف مع الألغاز الجديدة دون الحاجة لإعادة التدريب.
التقنيات المستخدمة:
Python
PyTorch / TensorFlow
OpenAI Gym (لإنشاء البيئة)
NumPy, Matplotlib (لتحليل الأداء)
Kaggle Dataset Integration
النتائج:
النموذج أظهر قدرة متزايدة على حل الألغاز متوسطة الصعوبة، وحقق معدل نجاح مرتفع مقارنة بالخوارزميات التقليدية العشوائية.
تم تقييم الأداء بناءً على معدل الملء الصحيح للخانات، عدد الخطوات حتى الحل، ونسبة الحلول الكاملة.
يفتح المشروع الباب لتطبيقات أوسع في مجالات حل المسائل المنطقية باستخدام الذكاء المعزز.