في هذا المشروع، تم تطبيق تحليل البيانات الاستكشافي (EDA) باستخدام Python على مجموعة بيانات متنوعة. تم استخدام مكتبات Seaborn وMatplotlib لتصوير البيانات وتقديم رؤى قيمة حول العلاقة بين المتغيرات، وكذلك لتحديد الأنماط، الاتجاهات، والقيم المتطرفة في البيانات.
خطوات التحليل:
تحميل وتنظيف البيانات:
تم استيراد مجموعة البيانات وتحويلها إلى إطار بيانات باستخدام Pandas.
تنظيف البيانات شمل التعامل مع القيم المفقودة، وتصحيح التنسيقات، وإزالة القيم المتطرفة.
تحليل البيانات:
تم تطبيق التحليل الإحصائي لفحص التوزيعات والارتباطات بين المتغيرات.
تم استخدام الملخصات الإحصائية (مثل المتوسط، الوسيط، والانحراف المعياري) لفهم خصائص البيانات بشكل أعمق.
تصوير البيانات:
الرسم البياني التوزيعي (Histogram): لتحليل التوزيع الاحتمالي للمتغيرات.
الرسم البياني الصندوقي (Box Plot): لاكتشاف القيم المتطرفة وتحليل التوزيع.
الرسم البياني المتناثر (Scatter Plot): لفحص العلاقة بين المتغيرات المستمرة.
الرسم البياني للحرارة (Heatmap): لعرض مصفوفة الارتباط بين المتغيرات.
استخدام Seaborn:
تم استخدام Seaborn لإنشاء رسومات بيانية متميزة، حيث توفر المكتبة أدوات فعّالة ومباشرة لإنشاء تصورات بيانية ذات مظهر احترافي.
اسم المستقل | ندا ر. |
عدد الإعجابات | 0 |
عدد المشاهدات | 8 |
تاريخ الإضافة | |
تاريخ الإنجاز |