بدأتُ العمل على ملف بيانات خام يحتوي على معاملات شراء لعملاء، وكانت البيانات غير منظمة وتتطلب تنظيفًا وتجهيزًا قبل أي عملية تحليل أو تلخيص.
في البداية قمت بعمل نسخة احتياطية من ملف البيانات بهدف ضمان إمكانية الرجوع إلى النسخة الأصلية في حال حدوث أي خطأ أثناء عملية التنظيف، وهي خطوة أساسية في أي Workflow احترافي.
بعد ذلك قمت بعمل Auto-Fitting للأعمدة والصفوف، حتى تظهر البيانات بشكل واضح وسهل القراءة، ولتسهيل عملية الفحص البصري Visual Inspection.
ثم انتقلت إلى مرحلة Data Cleaning والتي تضمنت عدة خطوات تقنية، من أهمها:
التأكد من أنواع البيانات Data Types في كل عمود، مثل تحويل الأعمدة الخاصة بالمبالغ إلى نمط Number / Currency، والأعمار والأعداد إلى Integer Numbers، وأعمدة الـ ID إلى Text لمنع فقدان الأصفار أو حدوث تحويلات غير متوقعة.
تنفيذ عمليات Formatting تشمل:
ضبط المحاذاة Alignment
إزالة المسافات الزائدة باستخدام Trim
وتنسيق العملات لتُعرض بالدولار الأمريكي بشكل صحيح.
إجراء Validation Checks للتأكد من خلو البيانات من:
الصفوف الفارغة
القيم الشاذة
الأخطاء في الأنواع أو النطاقات
القيم النصية في أعمدة رقمية أو العكس
تنفيذ خطوة Remove Duplicates لإزالة أي سجلات مكررة داخل البيانات الأصلية.
تطبيق Sorting و Filtering بهدف قراءة أوضح للبيانات ومعرفة توزيع القيم.
بعد تنظيف البيانات والتأكد من سلامتها وجودتها، انتقلتُ إلى مرحلة Data Preparation for Analysis والتي شملت بناء Pivot Table لتلخيص البيانات بطريقة تحليلية.
في الـ Pivot Table وضعتُ:
Customer ID في الـ Rows
والمنتجات المشتراة (الـ Items) كعناصر تحليلية إضافية في الـ Rows
وفي الـ Values قمت بتجميع البيانات من حيث:
عدد القطع المشتراة Quantity
وقيمة المبلغ المدفوع Purchase Amount بالدولار
وبذلك حصلت على تقرير يُظهر بشكل واضح:
ماذا اشترى كل عميل؟
وبكم كلفه كل صنف؟
وبأي كمية؟
وفي النهاية قمت بحفظ المخرجات على هيئة ملف PDF بهدف مشاركته ورفعه على Google Drive لتوثيق التحليل.
من خلال هذه الخطوات انتقلت البيانات من مرحلة Raw Data إلى مرحلة Clean & Structured Data ثم إلى Analyzed / Summarized Data جاهزة للعرض أو لمزيد من التحليل.