هذا المشروع يركز على تحليل بيانات العملاء والمبيعات باستخدام Python في بيئة Jupyter Notebook. تم استخدام مكتبات Pandas و NumPy لمعالجة البيانات وإجراء التحليلات الإحصائية. شمل المشروع الخطوات التالية:
• استيراد البيانات وتحميلها للبدء في التحليل.
• استخدام info() للحصول على نظرة عامة على البيانات، مثل نوع كل عمود وعدد القيم غير الفارغة.
• إعادة تسمية الأعمدة لتسهيل التعامل مع البيانات.
• التعامل مع القيم المكررة وحذفها لضمان دقة التحليل.
• حذف القيم الفارغة (Dropna) لتحسين جودة البيانات.
• تحليل إحصائي للبيانات باستخدام describe() للحصول على معلومات مثل المتوسط والانحراف المعياري والحدود القصوى والدنيا.
• حساب عدد القيم الفريدة لكل عمود باستخدام nunique() لفهم تنوع العملاء والمنتجات.
• تصفية البيانات (Filter) لاستخراج معلومات محددة مثل العملاء النشطين أو المنتجات الأكثر مبيعًا.
• ترتيب البيانات (Sort) لعرض النتائج حسب قيمة معينة مثل إجمالي المبيعات أو تاريخ الشراء.
• تجميع البيانات (Group By) لإجمال المبيعات أو عدد العملاء حسب فئات معينة مثل المنطقة أو الفئة المنتجية.
• تصدير البيانات النظيفة والمحسوبة إلى ملف CSV للاستخدام المستقبلي أو لمشاركة النتائج بسهولة.