تفاصيل العمل

في هذا المشروع، قمنا بتحليل مجموعة بيانات حقيقية من مؤسسة بنكية برتغالية باستخدام خوارزميات تعلم الآلة مثل K-Means، K-Nearest Neighbors (K-NN)، وشجرة القرار (Decision Tree) بالإضافة إلى خوارزمية Apriori. كان الهدف الرئيسي هو التنبؤ بما إذا كان العميل سيشترك في وديعة لأجل محدد بناءً على البيانات المتاحة.

الخطوات الرئيسية:

تحليل البيانات: قمنا بفحص البيانات الرقمية والفئوية لتحديد الأنماط والعلاقات.

معالجة البيانات: تمت معالجة القيم المفقودة، وتشفير الميزات الفئوية، وتوحيد المقاييس لضمان جودة البيانات.

التجميع باستخدام K-Means: تم تقسيم البيانات إلى أربع مجموعات بناءً على التشابه، مع تقييم جودة التجميع باستخدام مقاييس مثل Silhouette Score وDavies-Bouldin Index.

التصنيف باستخدام K-NN وشجرة القرار: تم تطبيق خوارزميات التصنيف للتنبؤ بالنتائج، مع تقييم الأداء باستخدام مقاييس مثل الدقة (Accuracy) ومصفوفة الارتباك (Confusion Matrix).

تحليل الارتباط باستخدام Apriori: تم تحديد العناصر المتكررة وإنشاء قواعد الارتباط لفهم العلاقات بين المتغيرات.

النتائج:

أظهرت خوارزمية K-NN دقة بنسبة 90%، بينما حققت شجرة القرار دقة بنسبة 89%.

تم تحديد علاقات قوية بين المتغيرات مثل الحالة الاجتماعية وحالة القرض.

تم تصور المجموعات باستخدام تحليل المكونات الرئيسية (PCA) لتوفير رؤية واضحة لتوزيع البيانات.

الاستنتاج:

تمكن المشروع من إظهار فعالية خوارزميات تعلم الآلة في تحليل البيانات المالية والتنبؤ بالنتائج. النتائج تؤكد أهمية معالجة البيانات وتقييم النماذج لتحقيق نتائج موثوقة. يمكن تطبيق هذه النتائج في مجالات أخرى مثل التسويق والرعاية الصحية لتحسين عمليات اتخاذ القرار.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات