مشروع تنبؤ حصوات الكلي باستخدام تحليل البول

تفاصيل العمل

? **توقّع الإصابة بحصوات الكلى باستخدام تحليل البول**

هذا المشروع عبارة عن خط أنابيب تعلم آلي يهدف إلى التنبؤ باحتمالية وجود حصى في الكلى بناءً على تحليل البول. يستخدم مجموعة بيانات متاحة على موقع Kaggle، ويتضمن جميع الخطوات من المعالجة المسبقة إلى تقييم النموذج.

️ **تنويه:**

هذا النموذج تم تطويره لأغراض تعليمية وبحثية فقط، ولا يُستخدم للتشخيص أو العلاج الطبي في الواقع.

**مجموعة البيانات**

* **المصدر:** Kaggle – التنبؤ بحصى الكلى باستخدام تحليل البول

[رابط البيانات](https://www.kaggle.com/da...)

* **النوع:** بيانات جدولة منظمة

* **الهدف:** تصنيف ثنائي (`0` - لا يوجد حصى، `1` - يوجد حصى)

**أهم مميزات المشروع**

* تنظيف البيانات والمعالجة المسبقة

* تحليل استكشافي للبيانات (EDA)

* كشف وإزالة القيم الشاذة

* تقييس وترميز الميزات

* التدريب باستخدام عدة مصنّفات:

* الانحدار اللوجستي (Logistic Regression)

* آلة المتجهات الداعمة (SVM)

* الجار الأقرب (KNN)

* شجرة القرار

* الغابة العشوائية (Random Forest)

* أدا بوست (AdaBoost)

* التدرّج المعزز (Gradient Boosting)

* تقييم النماذج باستخدام:

* الدقة (Accuracy)، الدقة النوعية (Precision)، الاستدعاء (Recall)، F1-score

* منحنى ROC ومصفوفة الالتباس (Confusion Matrix)

* تصوّر نماذج الشجرة والنماذج التجميعية

️ **سير العمل البرمجي**

1. **المعالجة المسبقة للبيانات**

* معالجة القيم المفقودة

* ترميز الميزات الفئوية (مثلاً: "Yes"/"No" ← 1/0)

* تقييس الأعمدة الرقمية (عند الحاجة)

2. **كشف القيم الشاذة**

* إزالة الشذوذ باستخدام طريقة المدى الربيعي (IQR)

3. **اختيار الميزات وتقييسها**

* حذف الميزات غير المهمة أو ذات التباين المنخفض

* استخدام `MinMaxScaler` لتطبيع البيانات

4. **تدريب النماذج**

* تقسيم البيانات إلى مجموعتي تدريب واختبار (مثلاً 80% تدريب / 20% اختبار)

5. **تقييم الأداء**

* استخدام مصفوفة الالتباس وتقارير التصنيف

* مقارنة الأداء بين النماذج المختلفة

6. **تفسير النتائج**

* تصوّر نماذج الشجرة لفهم طريقة اتخاذ القرار

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
15
تاريخ الإضافة
تاريخ الإنجاز
المهارات