- تحتوي مجموعة البيانات هذه على معلومات حول 10000 فيلم تم جمعها من قاعدة بيانات الأفلام (TMDb) ، بما في ذلك تقييمات المستخدمين والإيرادات.
● تحتوي أعمدة معينة ، مثل "cast" و "genres" ، على قيم متعددة مفصولة بأحرف خطية (|).
● هناك بعض القيم الفردية في عمود "فريق التمثيل". لا تقلق بشأن تنظيفها. يمكنك تركها كما هي.
● يظهر العمودان الأخيران اللذان ينتهيان بعلامة "_adj" الميزانية والإيرادات للفيلم المرتبط بدولارات 2010 ، وهو ما يمثل التضخم بمرور الوقت.
- تم العمل على هذا المشروع عن طريق الخطوات الاتية :
1 - Meta-data preparation and understanding data
2 - Asking SMART questions
3 - Data cleaning
4 - Data analyzing using EDA
5 - Data Visualizing
6 - Show conclusions