يحتوي هذا المجموعة من البيانات على معلومات حول 10,000 فيلم تم جمعها من قاعدة بيانات الأفلام (TMDb)، بما في ذلك تقييمات المستخدمين والإيرادات.
● تحتوي بعض الأعمدة، مثل "cast"و "genres"، على قيم متعددة مفصولة (|).
● تظهر العمودين الأخيرين المنتهيين بـ "_adj" الميزانية والإيرادات للفيلم المرتبط بالدولارات الأمريكية لعام 2010، مع مراعاة التضخم مع مرور الوقت.
الأسئلة المطروحة للتحليل:
1- اسماء الأفلام لكل نوع من الأنواع التي لديها أعلى قيمة تصويت.
2- ما هو عدد الأعوام التي تم فيها إصدار أكبر عدد من الأفلام؟
3- هل هناك علاقة بين الميزانية والإيرادات؟
4- ما هي أفضل 20 فيلمًا لم تغطِ أرباحها تكاليفها؟
5- عدد الأفلام لكل نوع من الأنواع.
الأدوات المستخدمة
1-بايثون
2- بانداس Pandas
3-نمباي Numpy