• جمع البيانات: جمع البيانات من مصادر مثل ملفات CSV (باستخدام بانداس).
•تنظيف البيانات والمعالجة المسبقة: إزالة التكرارات، والتعامل مع القيم المفقودة، وضمان الاتساق في الحقول مثل تواريخ الإصدار والأنواع والميزانيات والإيرادات.
• تحليل البيانات الاستكشافية (EDA):
• استخدام مكتبات مثل matplotlib وSeaborn لتصور التوزيعات والاتجاهات.
• حساب الارتباط بين المتغيرات العددية مثل الميزانية والنتيجة والتقييمات ووقت التشغيل باستخدام pandas.corr().
تصور الارتباطات باستخدام الخرائط الحرارية باستخدام seaborn.heatmap.
• تحديد العوامل التي تؤثر على أداء الأفلام .