نوع المشروع: مسابقة تعلم آلي
الدور: تطوير نموذج تعلم آلي وتحسينه باستخدام تقنيات متقدمة
المجال: الزراعة الذكية وتحليل بيانات التربة
وصف التحدي:
يهدف هذا التحدي إلى بناء نموذج تعلم آلي قادر على التنبؤ بالفجوة بين الكمية المتوفرة والكمية المطلوبة من 11 عنصراً غذائياً رئيسياً في التربة، وذلك بناءً على البيانات التالية:
كمية العناصر الغذائية المتوفرة حالياً في التربة
نتائج تحاليل التربة لعام 2019
بيانات بيئية وجغرافية (مثل: معدل هطول الأمطار، درجة الحرارة، نوع التربة)
تمثل البيانات مزارع في مناطق مختلفة من قارة أفريقيا، بتباين كبير في المناخ والخصوبة والظروف الجغرافية، والهدف من النموذج هو تحديد نقص المغذيات الذي إذا تم التعامل معه يمكن أن يُحسن بشكل كبير إنتاجية الذرة ويدعم الزراعة المستدامة.
نظرة عامة على الحل:
توقع الفجوة الغذائية: تم بناء النموذج لتوقع الكمية المطلوبة من كل عنصر غذائي، ومن ثم حساب الفجوة بطرح الكمية المتوفرة من الكمية المطلوبة.
دمج بيانات الاستشعار عن بعد (Earth Observation):
استخدمت بيانات من الأقمار الصناعية (Sentinel-1, Sentinel-2, MODIS)، وتم تطبيق نموذج K-Neighbors لتقدير متوسط السمات للمزارع القريبة، بهدف تعزيز بيانات التدريب والاختبار.
استخدام العلاقة بين العناصر الغذائية:
لوحظ أن العنصر الغذائي الأعلى قيمة في كل مزرعة يكون إما الكالسيوم (Ca) أو الصوديوم (Na). لذلك، تم تدريب نموذج تصنيف باستخدام HistGradientBoostingClassifier للتنبؤ بالعنصر الأعلى وفرة، وإضافته كميزة ثنائية.
تجميع المتغيرات المستهدفة:
تم استخدام خوارزمية K-Means لتجميع الأهداف (المغذيات)، ثم تدريب نموذج تصنيف (HistGradientBoostingRegressor) لتوقع المجموعة، وإضافتها كميزة جديدة.
اختيار الميزات (Feature Selection):
بعد دمج هذه الميزات، أصبح عدد الخصائص كبيراً جداً ويحتوي على كثير من التكرار والارتباط، مما أضاف ضجيجاً وأدى إلى عدم استقرار النموذج.
تم استخدام طريفة Leave-One-Out Cross-Validation (LOOCV) لحذف الميزات ذات التأثير الضعيف أو السلبي، مما حسن استقرار النموذج وكفاءته.
النموذج النهائي:
بعد مقارنة عدة نماذج، تم اختيار HistGradientBoostingRegressor كنموذج نهائي بسبب أدائه الأفضل في التحقق المتقاطع (Cross-Validation).
ملاحظة: تم التحقق من فاعلية كل خطوة عن طريق التحقق المتقاطع(Cross Validation) لضمان مساهمتها الفعلية في تحسين النموذج.