قمتُ بتنفيذ مشروع تحليل بيانات الرواتب لموظفي إحدى المؤسسات باستخدام Python و Pandas، حيث تم التعامل مع مجموعة بيانات تتضمن معلومات حول الرواتب الأساسية، الأجور الإضافية، والمزايا.
خطوات العمل:
1- استيراد البيانات واستكشافها (EDA):
عرض أول وأخر الصفوف في البيانات.
التحقق من أنواع البيانات والتأكد من عدم وجود بيانات غير متناسقة.
البحث عن القيم الفارغة والبيانات المكررة.
2- تنظيف البيانات ومعالجتها:
حذف الأعمدة غير الضرورية مثل (ID, Agency, Notes).
إزالة القيم المكررة.
تحويل البيانات إلى النوع الرقمي عند الحاجة.
ملء القيم الفارغة ببدائل مناسبة مثل الميديان أو الصفر.
3- تحليل البيانات واستخراج الإحصائيات:
حساب متوسط وأعلى وأدنى راتب أساسي (BasePay).
تحديد الموظف الذي يحصل على أعلى راتب أساسي.
حساب متوسط الراتب الأساسي لكل وظيفة.
تحليل متوسط الرواتب عبر السنوات.
النتائج والاستنتاجات:
تم تنظيف البيانات وإزالة القيم غير الضرورية، مما أدى إلى تحسين دقة التحليل.
تحديد الوظائف ذات الرواتب الأعلى وتحليل الفروقات بين متوسطات الرواتب الأساسية.
توفير رؤى قيّمة حول اتجاهات الرواتب، مما يمكن أن يساعد في اتخاذ قرارات إدارية ومالية أفضل.
التقنيات والأدوات المستخدمة:
Python
Pandas
Google Colab
تحليل البيانات والاستكشاف (EDA)
هذا المشروع يوضح كيفية التعامل مع البيانات الخام وتحليلها لاستخراج معلومات قيمة تساعد في فهم الأنماط واتخاذ القرارات بناءً على البيانات.