تحسين تخصيص موارد الشبكة وأداء مهامها باستخدام تقنيات التعلم الآلي: تقطير المعرفة عبر عوامل تعلم متعددة (DDPG ، DQN ، والتعلم الفيدرالي)