في هذا المشروع، قمت بتنظيف وتحليل مجموعة بيانات خاصة بالمنتجات باستخدام مكتبة Pandas في Python. تضمن العمل معالجة القيم المفقودة واستبدالها بطرق إحصائية مناسبة مثل المتوسط والقيمة الأكثر تكرارًا، مع الحفاظ على دقة البيانات الأصلية. استخدمت تقنيات مختلفة لتحسين البيانات، بما في ذلك:
معالجة القيم المفقودة: استبدال القيم المفقودة بمتوسط القيم أو القيمة الأكثر تكرارًا حسب طبيعة العمود.
تحليل العلاقة بين المتغيرات: باستخدام مكتبة Seaborn، قمت بتوليد خريطة حرارية لتحليل العلاقة بين المتغيرات العددية.
التعامل مع البيانات الفئوية: تم استخدام طرق إحصائية لاستبدال القيم المفقودة في الأعمدة الفئوية (مثل التصنيفات) بالقيمة الأكثر تكرارًا.
التقنيات المستخدمة:
Python (Pandas وSeaborn)
Matplotlib للتحليلات التصويرية
اسم المستقل | Fatma A. |
عدد الإعجابات | 0 |
عدد المشاهدات | 3 |
تاريخ الإضافة |