هذا المشروع عبارة عن أداة تحليلية مبنية بلغة Python تهدف إلى مساعدة أقسام الموارد البشرية (HR) في الشركات على التنبؤ باحتمالية ترك الموظف لعمله (Employee Turnover) بناءً على بيانات تاريخية.
يتضمن المشروع الخطوات التالية:
معالجة البيانات (Data Preprocessing): تنظيف البيانات وتحويل المتغيرات النصية (مثل التعليم، المدينة، والجنس) إلى قيم رقمية باستخدام تقنية One-Hot Encoding لتكون صالحة للنماذج الرياضية.
هندسة الميزات (Feature Engineering): إضافة متغيرات جديدة مثل "عدد سنوات العمل في الشركة" (YearsAtCompany) لاستخراج رؤى أعمق من البيانات.
التحليل الاستكشافي (Exploratory Data Analysis): استخدام الرسوم البيانية (Histograms & Boxplots) لفهم توزيع أعمار الموظفين وسنوات خبرتهم واكتشاف القيم الشاذة.
بناء النماذج التنبؤية (Predictive Modeling): مقارنة أداء خوارزميات مختلفة مثل:
الارتباط اللوجستي (Logistic Regression).
خوارزمية الجار الأقرب (K-Nearest Neighbors).
تحسين الأداء (Optimization): إجراء اختبارات على معامل (K) في خوارزمية KNN للوصول إلى أعلى دقة ممكنة وتجنب مشكلة "الإفراط في التخصيص" (Overfitting).
الهدف النهائي: توفير رؤية استباقية للإدارة لتمكينها من اتخاذ إجراءات للاحتفاظ بالمواهب وتقليل تكاليف الاستبدال الوظيفي.