تنظيف ومعالجة بيانات مبيعات مقهى للوصول إلى قاعدة بيانات نظيفة وجاهزة للتحليل

تفاصيل العمل

هذا المشروع يركز بشكل أساسي على مهارات تنظيف البيانات (Data Cleaning)، وهي أهم مرحلة في أي مشروع تحليل بيانات. تعاملت مع مجموعة بيانات تحتوي على العديد من الأخطاء الشائعة مثل القيم المفقودة، البيانات غير المتسقة، وأنواع البيانات الخاطئة.

الميزات والتقنيات المستخدمة:

توحيد وتنظيف البيانات النصية: تم التعامل مع قيم غير صحيحة مثل 'ERROR' و 'UNKNOWN' في الأعمدة النصية (Item, Payment Method, Location) واستبدالها بقيم فارغة (NaN) ثم معالجتها.

تصحيح أنواع البيانات: تم تحويل الأعمدة الرقمية (مثل Quantity, Price Per Unit) التي كانت مخزنة كنصوص إلى أرقام فعلية لتجهيزها للعمليات الحسابية.

معالجة القيم المفقودة: تم ملء القيم المفقودة في الأعمدة الرقمية باستخدام الوسيط (Median)، والأعمدة النصية باستخدام المنوال (Mode).

معالجة القيم المتطرفة: تم اكتشاف القيم المتطرفة في عمود Total Spent باستخدام قاعدة الانحراف الربيعي (IQR) ومعالجتها لضمان عدم تأثيرها على التحليلات المستقبلية.

النتيجة: الحصول على قاعدة بيانات نظيفة وخالية من الأخطاء، جاهزة تماماً لأي عملية تحليل استكشافي أو نمذجة مستقبلية.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات