يهدف هذا المشروع إلى تحليل بيانات استبيان Kaggle خلال الفترة (2017–2021) لاستخراج رؤى حول الخصائص الديموغرافية، المستوى التعليمي، الوظائف، ولغات البرمجة المفضلة لدى المتخصصين في مجال البيانات.
أهم ما تم تنفيذه:
-تنظيف البيانات: حذف التكرار، معالجة القيم المفقودة، وحل مشاكل الترميز.
-المعالجة المسبقة: تنظيف وترميز بيانات النوع، العمر، التعليم، ودمج أعمدة لغات البرمجة.
-التصور البياني:
مخطط دائري لتوزيع النوع
مخطط أعمدة لأكثر لغات البرمجة استخدامًا
عرض أهم 5 رؤى تشمل: النوع، اللغات، التعليم، الوظائف، والعمر
الأدوات المستخدمة:
Python
Pandas
Matplotlib & Seaborn
Scikit-learn (Label Encoding)