تحليل وتنظيف البيانات باستخدام Python: معالجة القيم المفقودة، حساب التكلفةوالإجمالي، وتصنيف المستويات

تفاصيل العمل

في هذا المشروع، قمت بتنظيف وتحليل بيانات الطلبات باستخدام مكتبات Pandas و Seaborn في Python، مع التركيز على معالجة القيم المفقودة وتنظيم البيانات النصية وتحليلها. المهام التي تم تنفيذها تشمل:

تنظيف البيانات النصية: تعديل أسماء المدن والأسماء الأولى والأخيرة للعملاء بحيث تبدأ بحروف كبيرة، وتحويل عناوين البريد الإلكتروني إلى حروف صغيرة، وتنظيف أرقام الهواتف بإزالة النصوص الزائدة.

معالجة القيم المفقودة: تم ملء القيم المفقودة في الأعمدة العددية بصفر، مما يضمن عدم تأثيرها على التحليلات.

حساب إجمالي السعر والتكلفة: تم حساب إجمالي السعر لكل طلب من خلال ضرب الكمية في سعر الوحدة، مع حساب التكلفة النهائية بعد الخصم.

تصنيف مستوى التكلفة: تصنيف التكلفة إلى فئتين ("High" و"Low") بناءً على قيمة التكلفة.

تحليل البيانات الرسومية: إنشاء رسوم بيانية مثل خريطة حرارية (heatmap) توضح العلاقة بين المتغيرات العددية، ورسم بياني للأوامر حسب الدولة.

التقنيات المستخدمة:

Python (Pandas وNumPy)

Matplotlib وSeaborn للرسوم البيانية

ملفات مرفقة

بطاقة العمل

اسم المستقل Fatma A.
عدد الإعجابات 0
عدد المشاهدات 5
تاريخ الإضافة