تضمن المشروع الخطوات التالية:
pandas و seaborn و matplotlib
استيراد المكتبات: يتم استيراد المكتبات الضرورية مثل math و numpy و pandas و matplotlib.pyplot و seaborn.
استكشاف البيانات: يتم تحميل البيانات من ملف country_wise_latest.csv واستعراض بعض من أول وآخر صفوف البيانات، بالإضافة إلى الحصول على معلومات شاملة حول البيانات باستخدام info() و describe(include='all').
التأكد من تناسق البيانات: يتم حذف الأعمدة غير الضرورية وتغيير أنواع البيانات لتتناسب مع التحليل المطلوب.
التعامل مع القيم الفارغة والقيم الشاذة: يتم فحص النسب المئوية للقيم الفارغة في البيانات واستبدال القيم الشاذة باستخدام طريقة Interquartile Range (IQR).
تحليل الارتباط: يتم إنشاء مصفوفة الارتباط بين المتغيرات العددية باستخدام seaborn.heatmap لتحليل العلاقات بين المتغيرات.
التصور البصري: يتم إنشاء الرسوم البيانية باستخدام seaborn و matplotlib.pyplot لتصور البيانات بشكل أفضل. تشمل الرسوم البيانية الرسوم الصندوقية قبل وبعد تطبيق IQR، والرسوم البيانية الشريطية، ورسم الانتشار.
يهدف هذا المشروع إلى تحليل وتصور البيانات لمساعدتك في فهم الأوضاع الحالية وتحديد العلاقات بين المتغيرات المختلفة.
اسم المستقل | Youssef S. |
عدد الإعجابات | 0 |
عدد المشاهدات | 6 |
تاريخ الإضافة | |
تاريخ الإنجاز |