#### 1. استكشاف البيانات
- تحميل بيانات التدريب والاختبار من ملفات CSV.
- التحليل الاستكشافي للبيانات لفهم هيكل البيانات:
- عرض عدد الصفوف والأعمدة.
- أنواع البيانات لكل عمود.
- تحديد القيم المفقودة في كل عمود.
- فصل الأعمدة إلى عددية وتصنيفية.
#### 2. معالجة القيم المفقودة
- حذف الصفوف التي تحتوي على قيم مفقودة في العمود 'الحديقة'.
- ملء القيم المفقودة في 'حجم المبنى' بالوسيط.
- ملء القيم المفقودة في 'رمز الموقع' بالوضع (القيمة الأكثر شيوعًا).
#### 3. معالجة القيم الطردية
- تحديد القيم الطردية في الأعمدة العددية.
- استبدال القيم الطردية بالحدود المحددة (طريقة IQR).
#### 4. توحيد البيانات
- استخدام RobustScaler لتقليل تأثير القيم الطردية على 'حجم المبنى'.
- ترميز المتغيرات التصنيفية باستخدام LabelEncoder.
#### 5. تقسيم البيانات
- استخدام KBinsDiscretizer لتقسيم 'سنة المراقبة' و 'حجم المبنى' إلى فترات متساوية.
#### 6. نمذجة المطالبات التأمينية
- تدريب عدة نماذج لتعلم الآلة:
- الانحدار اللوجستي
- شجرة القرار
- الغابة العشوائية
- آلة الدعم الناقصة (SVM)
- شبكة الانتشار العصبي MLP
- تقييم النماذج باستخدام مقاييس مثل:
- الدقة
- الدقة
- الاستدعاء
- الف1 سكور
#### 7. منحنيات ROC للتقييم
- عرض منحنيات ROC لكل نموذج مع مساحة تحت المنحنى (AUC).
- مقارنة بصرية لأداء النماذج.
يوفر هذا التطبيق إطارًا شاملاً لمعالجة بيانات التأمين، وبناء وتقييم نماذج مختلفة لتنبؤ المطالبات التأمينية. يسمح بتحليل عميق للبيانات ويوفر مقاييس الأداء لاختيار أفضل نموذج.
اسم المستقل | أمين م. |
عدد الإعجابات | 0 |
عدد المشاهدات | 9 |
تاريخ الإضافة | |
تاريخ الإنجاز |