قمت في هذا المشروع بإجراء تحليل معمق لسوق وظائف علم البيانات (Data Science) في الولايات المتحدة، استناداً إلى بيانات تم استخراجها من موقع Glassdoor لأكثر من 600 إعلان وظيفي. يهدف المشروع إلى كشف الروابط بين المهارات المطلوبة، الموقع الجغرافي، ومستويات الرواتب.
أبرز ما قمت به في المشروع:
جمع وتجهيز البيانات (Data Cleaning & Wrangling):
تنظيف بيانات Raw تتضمن 672 سجلاً.
استخراج الرواتب وتحويلها من صيغ نصية ($100K-$150K) إلى قيم رقمية لحساب المتوسطات.
معالجة أسماء الشركات وتصنيف المواقع الجغرافية (States) بدقة.
استخراج الرؤى (Insights Extraction):
تحديد المدن الأكثر طلباً (San Francisco, NY, DC) والتي تستحوذ على 50% من الوظائف.
تحليل المهارات التقنية الأكثر طلباً، حيث تصدرت Python بنسبة 75%، تليها SQL ثم Excel.
تحليل الرواتب:
اكتشاف متوسط الرواتب السائد في السوق (بين 100 ألف و125 ألف دولار سنوياً).
تحديد الشركات الأعلى دفعاً للرواتب والتي تصل لـ +250 ألف دولار للمناصب العليا.
التوصيات الاستراتيجية:
تقديم نصائح مبنية على البيانات للباحثين عن عمل حول المهارات الواجب تعلمها والمناطق الجغرافية المستهدفة لتقليل المنافسة وزيادة فرص القبول.
الأدوات والتقنيات المستخدمة:
Python: لتنظيف وتحليل البيانات (Pandas, Numpy).
Web Scraping: لجمع البيانات من موقع Glassdoor.
Data Visualization: لتمثيل النتائج بشكل بصري يسهل اتخاذ القرار.
Microsoft PowerPoint: لعرض النتائج النهائية بشكل احترافي.