وصف ملف SQL - تحليل وتنظيف بيانات سلسلة التوريد
يتضمن هذا الملف مجموعة أوامر SQL مخصصة لـ استكشاف وتنظيف وتحليل بيانات سلسلة التوريد داخل قاعدة بيانات supply_chain، بالاعتماد على الجدول الرئيسي supplychaindc.
أهم ما تم تنفيذه:
استكشاف البيانات وعرض عينات أولية لفهم هيكل الجدول
حساب إحصائيات وصفية أساسية للأعمدة الرقمية (Min - Max - Average).
تحليل توزيع المنتجات حسب الفئات.
التحقق من التكرارات باستخدام SKU.
إنشاء جدول نظيف خالٍ من الصفوف المكررة.
حذف الأعمدة غير المفيدة.
معالجة القيم المفقودة:
استبدال القيم النصية الفارغة بـ "غير معروف".
تحويل الأعمدة الرقمية لنوع مناسب وملء القيم الناقصة بالمتوسط.
التحقق النهائي من جودة البيانات بعد التنظيف.