في هذا المشروع، قمت بالتعامل مع قاعدة بيانات عالمية لعمليات تسريح الموظفين (Layoffs) باستخدام SQL (MySQL Workbench). ركزت في هذا العمل على تحويل بيانات "خام" مليئة بالأخطاء إلى قاعدة بيانات نظيفة وجاهزة لاتخاذ القرارات.
أولاً: مرحلة تنظيف البيانات (Data Cleaning)
تعتبر هذه المرحلة هي الأهم لضمان دقة النتائج، وقد قمت فيها بـ:
إزالة البيانات المكررة (Duplicates): استخدمت الـ CTE مع ROW_NUMBER لتحديد وحذف السجلات المتكررة بدقة.
توحيد المعايير (Standardization): معالجة المشاكل في النصوص (مثل توحيد كلمة 'Crypto' وإزالة المسافات الزائدة) لضمان دقة عمليات الـ GROUP BY.
تصحيح أنواع البيانات: تحويل التواريخ من نصوص (String) إلى صيغة DATE الرسمية لتفعيل التحليل الزمني.
التعامل مع القيم المفقودة (Nulls): استكمال البيانات المفقودة بناءً على سجلات أخرى لنفس الشركات (Self Join) بدلاً من حذفها عشوائياً.
ثانياً: التحليل الاستكشافي للبيانات (EDA)
بعد تنظيف البيانات، انتقلت لاستخراج إجابات عن أسئلة بيزنس هامة:
تحليل التأثير: تحديد الشركات والصناعات الأكثر تضرراً من عمليات التسريح.
تحليل الاتجاهات الزمنية: حساب "الإجمالي المتراكم" (Rolling Total) لعمليات التسريح شهرياً لفهم وتيرة الأزمة عالمياً.
نظام الترتيب (Ranking): استخدمت الدوال النافذة DENSE_RANK لتحديد أكثر 3 شركات قامت بتسريح موظفين في كل عام على حدة.
الرؤى التشغيلية: تحليل الربط بين حجم التمويل (Funds Raised) وقدرة الشركات على الصمود.
المهارات التقنية المستخدمة:
SQL Advanced: (Window Functions, CTEs, Joins, Subqueries).
Data Integrity: (Staging Tables, Constraints).