تفاصيل العمل

نهارده اشتغلت على Dataset جديدة فيها معلومات عن العملاء والمشتريات، وبدأت أول خطوة أساسية في أي مشروع Data Analysis: إنّي أفهم شكل البيانات قبل مالمسها

أول حاجة عملتها كانت

1. نظرة سريعة على البيانات

استخدمت df.head() عشان أشوف أول صفوف

ولاحظت شوية حاجات لازم تتظبط قبل ما أبدأ أي تحليل، زي

وجود قيم ناقصة (Missing Values) في أعمدة زي Phone

وجود قيم غريبة في العمر Age (زي 200 سنة ?)

اختلاف في كتابة بعض التصنيفات ProductCategory

بيانات محتاجة تحويل لصيغة مناسبة زي التاريخ PurchaseDate

? 2. بعدها استخدمت df.info()

عشان أتأكد من:

أنواع البيانات (Dtypes)

الأعمدة اللي فيها Nulls

حجم الـ Dataset كله

والحقيقة…

أغلب الأخطاء اللي بتحصل في التحليل مش بسبب الأداة، لكن بسبب إننا بنحلل بيانات لسه مش جاهزة.

3. ليه المرحلة دي مهمة

لأنها بتوفر عليك وقت كبير جدًا بعد كدا.

لما تفهم الداتا كويس من الأول، أنت كدا بتقلل الأخطاء وبتضمن نتائج أوضح وأدق.

هكمل في الخطوة الجاية تنظيف وتعديل القيم، وبعدها هبدأ التحليل الفعلي واستخراج Insights.

هسجل فيديو وسيبو هنا

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات