مشروع تحليل وتوقع رواتب علماء البيانات (Data Science Salaries 2024)
بصفتي محلل بيانات طموح، قمت بتطوير مشروع متكامل بلغة Python لتحليل اتجاهات الرواتب العالمية لعام 2024 وبناء نماذج تنبؤية دقيقة. يعكس هذا المشروع قدرتي على التعامل مع دورة حياة البيانات كاملة، بدءاً من التنظيف وحتى النمذجة المتقدمة.
أبرز ما تم تنفيذه في المشروع:
تنقية ومعالجة البيانات (Data Cleaning & Preprocessing):
الكشف عن الصفوف المكررة ومعالجتها لضمان جودة التحليل.
التعامل مع القيم المفقودة والتأكد من سلامة البيانات بنسبة 100%.
التحليل الاستكشافي والإحصائي (EDA & Aggregation):
تحليل الرواتب بناءً على المسميات الوظيفية (Job Titles) ومستويات الخبرة.
استخدام المقاييس الإحصائية المتقدمة (Mean, Max) لاستخلاص رؤى سوقية دقيقة.
هندسة البيانات واكتشاف القيم الشاذة (Outlier Detection):
تطبيق تقنيات Z-score و IQR لتحديد القيم الشاذة التي قد تؤثر على دقة النتائج.
استراتيجيات متقدمة للتعامل مع البيانات المتطرفة عبر أسلوب الـ Capping
لأدوات المستخدمة (Tech Stack):
- Pandas & NumPy لمعالجة البيانات الضخمة.
- Scipy للتحليلات الإحصائية المتقدمة.
الهدف من هذا العمل: تحويل البيانات الخام إلى قرارات استراتيجية تساعد الشركات على فهم سوق العمل بشكل أفضل وتوقع التكاليف والميزانيات بدقة.