نهارده اشتغلت على Dataset جديدة فيها معلومات عن العملاء والمشتريات، وبدأت أول خطوة أساسية في أي مشروع Data Analysis: إنّي أفهم شكل البيانات قبل مالمسها
أول حاجة عملتها كانت
1. نظرة سريعة على البيانات
استخدمت df.head() عشان أشوف أول صفوف
ولاحظت شوية حاجات لازم تتظبط قبل ما أبدأ أي تحليل، زي
وجود قيم ناقصة (Missing Values) في أعمدة زي Phone
وجود قيم غريبة في العمر Age (زي 200 سنة ?)
اختلاف في كتابة بعض التصنيفات ProductCategory
بيانات محتاجة تحويل لصيغة مناسبة زي التاريخ PurchaseDate
? 2. بعدها استخدمت df.info()
عشان أتأكد من:
أنواع البيانات (Dtypes)
الأعمدة اللي فيها Nulls
حجم الـ Dataset كله
والحقيقة…
أغلب الأخطاء اللي بتحصل في التحليل مش بسبب الأداة، لكن بسبب إننا بنحلل بيانات لسه مش جاهزة.
3. ليه المرحلة دي مهمة
لأنها بتوفر عليك وقت كبير جدًا بعد كدا.
لما تفهم الداتا كويس من الأول، أنت كدا بتقلل الأخطاء وبتضمن نتائج أوضح وأدق.
هكمل في الخطوة الجاية تنظيف وتعديل القيم، وبعدها هبدأ التحليل الفعلي واستخراج Insights.
هسجل فيديو وسيبو هنا