تحليل وتنظيف وتصوير بيانات تقييمات الأفلام باستخدام Python (Pandas, Matplotlib, Seaborn)

تفاصيل العمل

قمت بإنجاز مشروع تحليل بيانات متكامل باستخدام لغة Python يشمل الخطوات التالية:

استيراد وتنظيم البيانات:

تحميل مجموعة بيانات تقييمات الأفلام ومعالجتها باستخدام مكتبات Pandas وNumPy.

تنظيف البيانات ومعالجة القيم المفقودة:

إزالة التكرارات.

معالجة القيم المفقودة في عمود الإيرادات (gross) لضمان دقة التحليل.

استكشاف البيانات (EDA):

عرض معلومات الأعمدة وحجم البيانات.

حساب الإحصاءات الوصفية مثل المتوسط، الانحراف المعياري، القيم الصغرى والكبرى.

الكشف عن القيم المتطرفة باستخدام Boxplots.

معالجة وتحليل عمود الأنواع (Genres):

تحويل الأنواع من نصوص إلى قوائم منظمة.

حساب أكثر الأنواع تكراراً وتصنيفها.

تصوير البيانات (Data Visualization):

رسم مخطط دائري يوضح أكثر 10 أنواع أفلام انتشاراً.

رسم Histogram يوضح توزيع عدد الأصوات.

رسم Scatter Plot لبيان العلاقة بين تقييم IMDb والإيرادات.

رسم Bar Plot لمتوسط تقييمات IMDb لكل سنة.

رسم Line Plot لإجمالي الإيرادات لكل سنة.

الأدوات والتقنيات المستخدمة:

Python (Pandas, NumPy, Matplotlib, Seaborn)

تحليل بيانات إحصائي + تصوير بيانات احترافي

النتيجة:

تم استخراج رؤى واضحة حول الأنواع الأكثر انتشاراً، السنوات ذات أعلى الإيرادات، والعلاقة بين تقييمات IMDb والإيرادات، مع توفير رسومات توضيحية سهلة الفهم تساعد في دعم اتخاذ القرار.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات