HR Full Analysis - Comprehensive Human Resources Analytics Platform
مشروع تحليل بيانات شامل للموارد البشرية باستخدام Python و Data Science لاستخراج رؤى قابلة للتنفيذ لتحسين الأداء والاحتفاظ بالموظفين.
نظرة عامة على المشروع:
منصة تحليلية متكاملة لتحليل بيانات الموارد البشرية تعتمد على 2,845 سجل موظف و28 متغير شامل، تغطي:
• معدلات الاستقالات والفصل
• تحليل الأداء الوظيفي
• فعالية برامج التدريب
• التوزيع الديموغرافي للقوى العاملة
• الرضا الوظيفي والمشاركة
التحليلات المنفذة:
**Data Cleaning & Preparation**:
• معالجة القيم المفقودة والسجلات المكررة (Data Quality Assurance)
• Feature Engineering: استخراج Age Bands، Employment Years، Date Parsing
• تحويل أنواع البيانات وضمان سلامة البيانات
**Univariate Analysis** (تحليل أحادي المتغير):
• التوزيع العمري والنوعي والعرقي والحالة الاجتماعية
• اتجاهات التوظيف عبر السنوات (Hiring Trends Over Time)
• توزيع الموظفين حسب الأقسام والوحدات
• تحليل التوزيع الجغرافي (State-wise Analysis)
• توزيع تقييمات الأداء والدرجات
**Multivariate Analysis** (تحليل متعدد المتغيرات):
• **Turnover Analysis**: معدلات الاستقالة حسب القسم، Business Unit، Division، Employee Type
• **Performance Correlation**: العلاقة بين Engagement، Satisfaction، Work-Life Balance والأداء
• **Training Effectiveness**: تأثير البرامج التدريبية (Internal vs External) على الأداء
• **Demographic Performance Patterns**: الأداء حسب Age Bands، Gender، Race، Marital Status
• **Compensation Analytics**: تحليل Pay Zones وعلاقتها بالأداء
• **Training ROI Analysis**: تحليل تكلفة/فائدة البرامج التدريبية
أبرز النتائج والرؤى:
**Organizational Headcount Distribution**:
• Production يهيمن بـ 1,910 موظف (67% من القوى العاملة)
• IT/IS: 409 | Sales: 311 | Software Engineering: 112
**Employee Retention by Department**:
• IT/IS وProduction لديهما أعلى معدلات Turnover (~10-15%)
• Admin Offices وExecutive Office تحقق 100% Retention
**Performance by Age Band**:
• الفئة العمرية 40-49 تحقق أفضل أداء (80.1% Fully Meets)
• الموظفون 60+ لديهم أعلى نسبة PIP (6.5%)
**Training Effectiveness**:
• External Training يحقق 12.8% "Exceeds" مقابل 11.4% للـ Internal
• كلا النوعين يحقق ~78% "Fully Meets"
التقنيات والمكتبات المستخدمة:
• **Python 3.8+**: لغة البرمجة الأساسية
• **Pandas**: معالجة وتحليل البيانات
• **NumPy**: العمليات الحسابية
• **Matplotlib & Seaborn**: تصورات احترافية (Stacked Bars, Box Plots, Count Plots)
• **Jupyter Notebook**: بيئة التطوير التفاعلية
الـ Deliverables (المخرجات):
Jupyter Notebook كامل
4 تصورات احترافية (PNG عالية الدقة):
• Department Headcount Distribution
• Employee Retention by Department
• Performance by Age Band
• Training Effectiveness Comparison
GitHub Repository مع README.md احترافي
Data Insights Report (رؤى قابلة للتنفيذ)
القيمة المضافة للأعمال:
• تحديد الأقسام ذات معدل Turnover العالي لاتخاذ إجراءات وقائية
• تقييم ROI للبرامج التدريبية وتحسين الميزانيات
• فهم العوامل المؤثرة على الأداء (Age, Training, Engagement)
• تخطيط القوى العاملة بناءً على التوزيع الديموغرافي