في هذا المشروع، قمت بتحليل بيانات 967 ملاحظة بيئية للأشجار والغابات، وبنيت نماذج تنبؤية دقيقة لإجمالي سقوط الأوراق السنوي (Mg/ha/yr) باستخدام تقنيات التعلم الآلي (ML) في لغة R.
المهام التي تم تنفيذها تشمل:
تنظيف البيانات ومعالجة القيم المفقودة وإزالة الصفوف غير المكتملة.
التعامل مع القيم المتطرفة (outliers) وتحويل المتغيرات النوعية إلى رقمية.
إنشاء ميزات جديدة (Feature Engineering) مثل: حجم الشجرة، مؤشر الغطاء النباتي، ومؤشر المناخ.
تحليل العلاقات بين المتغيرات باستخدام المصفوفات الارتباطية والرسوم البيانية الاستكشافية.
بناء وتقييم عدة نماذج تعلم آلي:
الانحدار الخطي (Linear Regression)
شجرة القرار (Decision Tree)
الغابات العشوائية (Random Forest)
التعزيز التدريجي (Gradient Boosting Machine)
مقارنة أداء النماذج باستخدام RMSE، MAE، وR² وتحديد النموذج الأفضل للتنبؤ.
تحليل أهمية الميزات (Feature Importance) لمعرفة العوامل المؤثرة في سقوط الأوراق.
الأدوات المستخدمة: R, dplyr, ggplot2, corrplot, randomForest, gbm, rpart