تفاصيل العمل

تحليل وتنظيف البيانات باستخدام Python

في هذا العمل، تم استخدام مكتبات Python الاحترافية مثل pandas، numpy، seaborn، وmatplotlib لتحليل وتنظيف مجموعة بيانات خاصة بعملاء أحد البنوك. يشمل العمل المهام التالية:

تنظيف البيانات ومعالجتها:

التعامل مع القيم المفقودة باستخدام dropna() و fillna() لاستبدال القيم الناقصة بمتوسط العمر أو قيم افتراضية.

معالجة الأخطاء النصية مثل إزالة الرموز غير المرغوب فيها (str.replace()) وتوحيد بيانات الدول (replace()).

تحويل أنواع البيانات (astype()) لضمان الدقة وتحسين الأداء.

إزالة البيانات المكررة باستخدام drop_duplicates().

تحليل البيانات واستكشافها:

استعراض البيانات عبر df.head() و df.describe() و df.info().

استخراج القيم الفريدة unique() وتحليل توزيع البيانات value_counts().

تصفية البيانات باستخدام loc[] لاستخراج أجزاء محددة.

تحليل إحصائي وبصري:

رسم مخططات الصندوق (Boxplot) باستخدام sns.boxplot() لفهم توزيع Credit Score حسب الفئات العمرية.

إنشاء المخططات الدائرية (Pie Charts) باستخدام plt.pie() لتحليل توزيع العملاء حسب الدولة.

استخدام المخططات الخطية والنقطية (Line & Scatter Plots) لفهم العلاقة بين العمر ودرجة الائتمان.

تمثيل توزيع البيانات باستخدام المخططات الهيستوغرامية (Histograms) عبر plt.hist().

المهارات المكتسبة في هذا العمل:

️ تنظيف البيانات وتحويلها إلى صيغة قابلة للتحليل.

️ تحليل البيانات واستكشافها باستخدام Pandas.

️ التحليل الإحصائي للمعلومات المالية.

️ تصور البيانات بطرق متعددة باستخدام Seaborn وMatplotlib.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات