قمت بتطوير نماذج تعلم آلي لتصنيف ما إذا كان الأشخاص مصابين بمرض السكري أم لا Binary Classification Models.
الخطوات التي قمت بها:
1. التحليل الاستكشافي للبيانات (EDA): دراسة البيانات وفهمها، واكتشاف الأنماط والعلاقات باستخدام الرسوم التوضيحية والتمثيلات البصرية.
2.تنظيف البيانات ومعالجتها: التعامل مع القيم المفقودة (Null Values)، إزالة التكرارات (Duplicates)، واستخدام تقنيات الترميز (Encoders) والتقييس (Scalers) لجعل البيانات صالحة للنماذج.
3.بناء النماذج التصنيفية: تدريب نماذج باستخدام خوارزميات مختلفة مثل K-Nearest Neighbors، Random Forest، Logistic Regression، Decision Tree، Naive Bayes، و SVC.
4.تقييم الأداء: استخدام مقاييس مثل الدقة (Accuracy)، تقرير التصنيف (Classification Report)، ومصفوفة الارتباك (Confusion Matrix) لقياس أداء النماذج.
5.تحسين الأداء: تطبيق تقنيات ضبط المعاملات (Hyperparameter Tuning) لزيادة دقة النماذج وتحسين نتائجها.
النتيجة: نماذج تصنيفية دقيقة تساعد في التنبؤ بمرض السكري ودعم القرارات الطبية.
التقنيات والأدوات المستخدمة:
- اللغات والمكتبات: Python، Pandas، Seaborn، Matplotlib
- تحليل البيانات: Scikit-learn (train_test_split, GridSearchCV)
- الخوارزميات: RandomForestClassifier، LogisticRegression، SVC، KNeighborsClassifier، DecisionTreeClassifier، Naive Bayes
- المعالجة المسبقة: MinMaxScaler، LabelEncoder
- تقييم النماذج: accuracy_score، confusion_matrix، classification_report