السلام عليكم و رحمة الله ,في هذا المشروع قمتُ بتحليل مجموعة بيانات خاصة بمرضى السكري، وتنفيذ سلسلة خطوات تبدأ من تنظيف البيانات حتى بناء النماذج التنبؤية.
المهام المنجزة:
تنظيف البيانات (إزالة القيم المكررة والأعمدة غير المهمة).
معالجة البيانات الفئوية باستخدام One-Hot Encoding.
تقسيم البيانات إلى تدريب واختبار باستخدام train_test_split.
معالجة مشكلة عدم توازن البيانات باستخدام SMOTE.
بناء نماذج تعلم الآلة مثل: Random Forest Classifier و Decision Tree Classifier.
تقييم النماذج باستخدام الدقة (Accuracy) ومؤشرات الأداء الأخرى.
الأدوات والتقنيات المستخدمة:
Python – Pandas – NumPy – Matplotlib – Seaborn – Scikit-learn – imbalanced-learn
هذا المشروع يعكس مهارتي في الجمع بين تنظيف البيانات، تحليلها، والتعلم الآلي لاستخراج نتائج دقيقة يمكن الاعتماد عليها.