1. مراجعة البيانات الخام
بدأت بمراجعة ملف البيانات كما ورد من المصدر، وفحصت أعمدة الحجز والعميل والوزن والتاريخ والوجهة، ولاحظت وجود مجموعة من المشكلات مثل القيم الناقصة، والتكرار، وتنوع تنسيقات الحقول.
2. إزالة التكرارات
قمت بتحديد الأعمدة الأساسية — مثل رقم الحجز ورقم التتبع — ثم استخدمت أداة Remove Duplicates لإزالة الصفوف المكررة وتنقية قاعدة البيانات من التكرار غير المقصود.
3. معالجة البيانات الناقصة
راجعت الأعمدة المهمة وحددت الخلايا التي تحتوي على بيانات ناقصة، ثم:
أضفت البيانات المفقودة إذا كانت متاحة.
أو حذفت الصفوف التي لا يمكن الاعتماد عليها لعدم اكتمالها.
وبذلك ضمنت أن كل سجل يحتوي على معلومات أساسية صحيحة.
4. توحيد تنسيقات التواريخ
لاحظت اختلاف تنسيقات التاريخ بين نصوص وأرقام، فقمت بتحويلها إلى تنسيق موحد قابل للمعالجة — مثل DD/MM/YYYY — باستخدام
Text to Columns و DATEVALUE.
5. تنظيف تنسيقات الأسماء والعناوين
استخدمت دوال مثل:
TRIM() لإزالة المسافات الزائدة
CLEAN() لتنظيف النصوص
كما قمت بتوحيد نمط كتابة الأسماء والعناوين لتسهيل الفرز والبحث.