هذا المشروع يهدف إلى تطوير نموذج تعلّم آلي قادر على تصنيف جودة المياه بشكل دقيق إلى صالحة للشرب أو غير صالحة للشرب. تم استخدام مجموعة بيانات كبيرة تحتوي على خصائص كيميائية وفيزيائية مختلفة للمياه، مع معالجة القيم المفقودة، وتحليل العلاقات بين المتغيرات، وهندسة الميزات لتحسين أداء النموذج.
تم تطبيق خوارزميات تصنيف متنوعة مثل Logistic Regression و Random Forest و Gradient Boosting، مع تقييم الأداء باستخدام مقاييس مثل Accuracy، Precision، Recall، و F1-Score لضمان دقة النموذج وموثوقيته.
ساهم المشروع في اكتساب خبرة عملية في التعامل مع البيانات البيئية، تحسين جودة النماذج التنبؤية، وضبط المعاملات (Hyperparameter Tuning) لتحقيق أفضل أداء ممكن.