تحليل بيانات وتنبؤ برواتب المطورين باستخدام تعلم الآلة

تفاصيل العمل

نظرة عامة على المشروع:

هذا المشروع هو تحليل علمي متكامل لمجموعة بيانات "استبيان مطوري Stack Overflow لعام 2023"، بهدف اكتشاف العوامل الرئيسية التي تؤثر على رواتب المطورين وبناء نموذج تعلم آلة قادر على التنبؤ بمستوى الدخل.

العمل المنجز:

تم تنفيذ المشروع بالكامل باستخدام لغة Python والمكتبات المتخصصة في علم البيانات، وشمل دورة حياة المشروع كاملة:

تنظيف وتجهيز البيانات: معالجة أكثر من 89 ألف استجابة، والتعامل مع القيم المفقودة، وهندسة الميزات لإنشاء متغير هدف واضح.

التحليل الاستكشافي للبيانات (EDA): إنشاء رسوم بيانية متقدمة (Box Plots, Bar Plots) لكشف العلاقات بين الخبرة، التعليم، والموقع الجغرافي والدخل.

التحليل العنقودي (Clustering): استخدام خوارزمية K-Means لتقسيم المطورين إلى 4 شرائح مهنية مميزة بناءً على مسارهم الوظيفي.

بناء نماذج التنبؤ (Classification): تدريب ومقارنة 3 نماذج تعلم آلة (Logistic Regression, Decision Tree, Random Forest) لتحقيق أفضل أداء في التنبؤ.

النتائج الرئيسية:

أثبت التحليل أن سنوات الخبرة والموقع الجغرافي هما العاملان الأكثر تأثيراً على الراتب.

تم التوصل إلى نموذج تنبؤي بدقة تقارب 80% في تصنيف المطورين إلى فئات الدخل المرتفع أو المنخفض.

هذا المشروع يعكس خبرة عملية في التعامل مع بيانات حقيقية ومعقدة وتحويلها إلى رؤى قابلة للتنفيذ ونماذج تنبؤية فعالة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
9
تاريخ الإضافة
تاريخ الإنجاز
المهارات