في هذا المشروع، قمت بتنظيف وتحليل بيانات الطلبات باستخدام مكتبات Pandas و Seaborn في Python، مع التركيز على معالجة القيم المفقودة وتنظيم البيانات النصية وتحليلها. المهام التي تم تنفيذها تشمل:
تنظيف البيانات النصية: تعديل أسماء المدن والأسماء الأولى والأخيرة للعملاء بحيث تبدأ بحروف كبيرة، وتحويل عناوين البريد الإلكتروني إلى حروف صغيرة، وتنظيف أرقام الهواتف بإزالة النصوص الزائدة.
معالجة القيم المفقودة: تم ملء القيم المفقودة في الأعمدة العددية بصفر، مما يضمن عدم تأثيرها على التحليلات.
حساب إجمالي السعر والتكلفة: تم حساب إجمالي السعر لكل طلب من خلال ضرب الكمية في سعر الوحدة، مع حساب التكلفة النهائية بعد الخصم.
تصنيف مستوى التكلفة: تصنيف التكلفة إلى فئتين ("High" و"Low") بناءً على قيمة التكلفة.
تحليل البيانات الرسومية: إنشاء رسوم بيانية مثل خريطة حرارية (heatmap) توضح العلاقة بين المتغيرات العددية، ورسم بياني للأوامر حسب الدولة.
التقنيات المستخدمة:
Python (Pandas وNumPy)
Matplotlib وSeaborn للرسوم البيانية
اسم المستقل | Fatma A. |
عدد الإعجابات | 0 |
عدد المشاهدات | 5 |
تاريخ الإضافة |