هذا المشروع يركز على تنظيف البيانات، وتحديدًا معالجة القيم المفقودة (Null values) باستخدام python

تفاصيل العمل

في هذا المشروع، قمت بتنظيف وتحليل مجموعة بيانات خاصة بالمنتجات باستخدام مكتبة Pandas في Python. تضمن العمل معالجة القيم المفقودة واستبدالها بطرق إحصائية مناسبة مثل المتوسط والقيمة الأكثر تكرارًا، مع الحفاظ على دقة البيانات الأصلية. استخدمت تقنيات مختلفة لتحسين البيانات، بما في ذلك:

معالجة القيم المفقودة: استبدال القيم المفقودة بمتوسط القيم أو القيمة الأكثر تكرارًا حسب طبيعة العمود.

تحليل العلاقة بين المتغيرات: باستخدام مكتبة Seaborn، قمت بتوليد خريطة حرارية لتحليل العلاقة بين المتغيرات العددية.

التعامل مع البيانات الفئوية: تم استخدام طرق إحصائية لاستبدال القيم المفقودة في الأعمدة الفئوية (مثل التصنيفات) بالقيمة الأكثر تكرارًا.

التقنيات المستخدمة:

Python (Pandas وSeaborn)

Matplotlib للتحليلات التصويرية

ملفات مرفقة

بطاقة العمل

اسم المستقل Fatma A.
عدد الإعجابات 0
عدد المشاهدات 4
تاريخ الإضافة