في هذا المشروع قمت بتنظيف وتحليل مجموعة بيانات حقيقية عن تسريحات الموظفين (من Kaggle) باستخدام لغة SQL. كان المشروع موجّه من خلال سلسلة تعليمية لـ Alex The Analyst، وركز على تجهيز البيانات الخام للتحليل واستخراج أهم المؤشرات حول تسريحات الموظفين عالميًا خلال عام 2022.
الخطوات والمهارات المستخدمة:
تنظيف البيانات ومعالجتها:
إنشاء جداول مرحلية (Staging Tables) للحفاظ على البيانات الأصلية.
إزالة التكرارات باستخدام ROW_NUMBER() و CTEs.
توحيد القيم غير المتناسقة.
تحويل التواريخ النصية إلى صيغة SQL DATE.
معالجة القيم الفارغة (Nulls) والسجلات غير الصالحة.
التحليل الاستكشافي (EDA):
تجميع البيانات وتحليل التسريحات حسب الشركة، الدولة، الصناعة، ومرحلة التمويل.
تحديد الشركات التي قامت بتسريح كامل للقوى العاملة.
ترتيب التسريحات السنوية باستخدام DENSE_RANK().
متابعة الاتجاهات الشهرية باستخدام Rolling Totals.
النتائج والاستنتاجات:
الشركات الناشئة ذات التمويل العالي واجهت غالبًا إغلاقات كاملة.
التسريحات تركزت بشكل ملحوظ في صناعات مثل التكنولوجيا والعملات الرقمية.
سجلت الولايات المتحدة أعلى نسبة تسريحات، مع اتجاه تصاعدي واضح خلال عام 2022.
المهارات المكتسبة:
SQL (Joins, Aggregations, CTEs, Window Functions)
تنظيف وتحويل البيانات
التحليل الاستكشافي للبيانات (EDA)
التفكير التحليلي واستخراج المؤشرات
هذا المشروع يعكس قدرتي على التعامل مع بيانات واقعية، واستخدام SQL كأداة قوية للتحليل، بالإضافة إلى استخراج رؤى تساعد على دعم اتخاذ القرارات. وهو جزء من رحلتي في بناء بورتفوليو قوي كمحلل بيانات طموح.