Salary data analysis and extracting key statistics using Python

تفاصيل العمل

المشروع هدفة تحليل واستكشاف بيانات رواتب الموظفين باستخدام لغة Python وتقنيات تحليل البيانات. أقوم بالعمل على مجموعة بيانات تحتوي على معلومات عن الرواتب مثل Base Pay و Overtime Pay و Other Pay و Benefits و Total Pay و Total Pay Benefits.

بدأت المشروع بمرحلة تنظيف البيانات (Data Cleaning) للتأكد من خلو البيانات من القيم غير الصحيحة أو المفقودة، ثم تم إجراء تحليل استكشافي للبيانات (Exploratory Data Analysis - EDA) لفهم توزيع الرواتب والعلاقات بين المتغيرات المختلفة.

يتضمن المشروع عدة تحليلات مهمة، منها:

حساب متوسط إجمالي الرواتب والمزايا (Mean of Total Pay Benefits) لفهم المستوى العام للرواتب.

تحديد أكثر الوظائف تكرارًا بين الموظفين لمعرفة أكثر المسميات الوظيفية انتشارًا.

استخراج أعلى 10 وظائف من حيث الرواتب القصوى (Max Salary) لمعرفة الوظائف الأعلى دخلًا.

تحليل توزيع الرواتب باستخدام الرسوم البيانية لفهم شكل توزيع البيانات.

دراسة العلاقات بين المتغيرات المختلفة باستخدام Correlation Heatmap لمعرفة مدى ارتباط عناصر الرواتب ببعضها.

تم استخدام عدة مكتبات متخصصة في تحليل البيانات وعرض النتائج بصريًا، مثل:

Pandas لمعالجة وتنظيف البيانات

Matplotlib و Seaborn لعرض البيانات والنتائج باستخدام الرسوم البيانية

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
المهارات