تحليل توزيع النوع الاجتماعي في مسح Kaggle للتعلم الآلي وعلوم البيانات لعام 2021

تفاصيل العمل

رواية البيانات مع Numpy و Pandas و Matplotlib: تحليل توزيع النوع الاجتماعي في مسح Kaggle للتعلم الآلي وعلوم البيانات لعام 2021

الهدف من هذا المشروع هو تحليل التوزيع بين الجنسين في مسح Kaggle للتعلم الآلي وعلوم البيانات لعام 2021 باستخدام Numpy و Pandas و Matplotlib. ويتضمن المشروع الخطوات التالية:

تحميل البيانات: قم بتحميل مجموعة بيانات المسح في إطار بيانات بانداس باستخدام طريقة read_csv ().

تنظيف البيانات: إجراء عمليات تنظيف البيانات الأساسية، مثل إزالة الأعمدة غير ذات الصلة، والتعامل مع القيم المفقودة، وإعادة تسمية الأعمدة من أجل قراءة أفضل.

استكشاف البيانات: استخدم Pandas و Numpy لاستكشاف مجموعة البيانات وإنشاء إحصاءات موجزة ورؤى حول مجتمع علوم البيانات.

تصور البيانات: استخدم Matplotlib لإنشاء تصورات تساعد في سرد قصة بيانات مقنعة حول توزيع الجنس في بيانات المسح. قد يتضمن ذلك إنشاء مخططات شريطية أو مخططات فطائر أو أي نوع آخر من المخططات التي توضح بشكل أفضل الرؤى الموجودة في البيانات.

الاستنتاج: تلخيص الرؤى الرئيسية المكتشفة في مرحلتي استكشاف البيانات وتصورها واستخلاص استنتاجات ذات مغزى حول توزيع الجنسين في مجتمع علوم البيانات

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
30
تاريخ الإضافة
تاريخ الإنجاز
المهارات