تفاصيل العمل

وصف المشروع:

هذا المشروع يعتمد على تعلم الآلة لتوقع هطول الأمطار في اليوم التالي بناءً على مجموعة من العوامل المناخية. تم تدريب نماذج تصنيفية على المتغير المستهدف RainTomorrow لتحقيق تنبؤات دقيقة. المشروع يشمل مراحل معالجة البيانات، استخراج الميزات، تدريب النماذج، تقييم الأداء، وأخيرًا نشر النموذج.

تفاصيل المشروع:

1. معالجة البيانات (Data Preprocessing):

التحدي الأول: معالجة القيم المفقودة.

تم استخدام نموذج Linear Regression للتنبؤ بالقيم العددية.

نموذج Logistic Regression للتعامل مع القيم المفقودة في الميزات الفئوية.

التحدي الثاني: التعامل مع القيم الشاذة (Outliers).

تم تطبيق تقنيات متعددة مثل IQR, SQRT, Log Transformation, BOX-COX, Power Transformation.

في النهاية، تم استخدام RobustScaler لتوحيد البيانات بطريقة تتجاهل تأثير القيم الشاذة.

ترميز الميزات الفئوية: تم استخدام LabelEncoder لتحويل الميزات الفئوية إلى قيم رقمية.

تقسيم البيانات:

تم تقسيم البيانات إلى 80% للتدريب و20% للاختبار.

2. النمذجة (Modeling):

تم استخدام نموذج Random Forest نظرًا لتوازن البيانات النسبي وعدم الحاجة إلى إعادة التوازن (Resampling).

تم ضبط النموذج باستخدام Hyperparameter Tuning لتقليل الإفراط في التعميم (Overfitting) وتحقيق أداء أفضل.

تم بناء نموذج شبكة عصبية (Neural Network) لتحقيق دقة أفضل.

3. النتائج (Results):

أعلى دقة تم تحقيقها هي 88.5% باستخدام النموذج العصبي (Neural Network)، وهو تحسن كبير مقارنة بالبيانات الأصلية.

تم تقييم النموذج باستخدام مقاييس متعددة لضمان الدقة في الأداء.

4. التحليل (Analysis):

تم إجراء تحليل استكشافي (EDA) لفهم أفضل للبيانات باستخدام Python.

بالإضافة إلى ذلك، تم إنشاء تقارير تفاعلية باستخدام Power BI.

5. النشر (Deployment):

تم نشر النموذج في بيئة مناسبة لاختبار واستخدام التنبؤات.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
12
تاريخ الإضافة
المهارات