تفاصيل العمل

خطوات تنفيذ المشروع:

1_الحصول على البيانات:

- قمت بتحميل الـ Dataset من موقع Kaggle.

2_قراءة البيانات:

- استخدمت مكتبة pandas لقراءة ملف CSV وتحويله إلى DataFrame لسهولة التعامل مع البيانات

3_استكشاف البيانات (Exploratory Data Analysis – EDA):

- عرض أول وأسطر وأعمدة من البيانات (df.head(), df.info(), df.describe()).

- تحديد الهدف الرئيسي من التحليل (مثلاً: تحليل المبيعات أو النجاة في Titanic) علشان أوصل لإجابات واضحة من الداتا.

4_تنظيف البيانات (Data Cleaning):

- تعديل الأعمدة لو في أي مشكلة (زي تحويل الأعمدة لتواريخ باستخدام pd.to_datetime).

- تغيير أنواع البيانات غير الصحيحة (Strings → Numeric أو Date).

5_ معالجة القيم المفقودة (Handling Null Values):

- فحص القيم المفقودة باستخدام: df.isnull().sum()

6_التعامل مع القيم المكررة (Handling Duplicates):

- التحقق من وجود صفوف مكررة: df.duplicated().sum()

7_التحليل البصري (Data Visualization):

**استخدمت مكتبات زي:

- matplotlib و seaborn للرسوم البيانية.

- plotly للتفاعلية (لو حبيت).

- رسم المخططات (Bar charts, Pie charts, Line charts) لعرض:

- التوزيع حسب الفئات.

- الاتجاهات الزمنية.

- النسب المئوية.

النتيجة:

وصلت لداشبورد/رسوم بصرية بتوضح أهم المؤشرات (KPIs).

التحليل ساعد في استخراج Insights

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات