هذا مشروع يحلل بيانات أفضل 250 فيلمًا.
أسئلة العمل:
1. ما هي الأفلام الأعلى تقييمًا بشكل عام؟
2. كيف يتغير متوسط تقييم الفيلم بمرور الوقت (حسب العقد)؟
3. ما هو توزيع تقييمات الأفلام؟
4. هل هناك أي ارتباطات بين الأصوات والمدة والتقييم؟
5.أي العقود أنتجت أكثر الأفلام الأعلى تقييمًا؟
النتائج:
الأفلام الأعلى تقييمًا: يعرض الجدول قائمة بالأفلام الأعلى تقييمًا، بما في ذلك "The Shawshank Redemption" و"The Godfather" و"The Dark Knight" وما إلى ذلك. يتم تصنيفها وفقًا لمقياس غير محدد (من المحتمل أن يكون مزيجًا من التقييم والأصوات).
توزيع التصنيف: "الحد الأقصى للتصنيف" و"المتوسط للتصنيف" و"الحد الأدنى للتصنيف" في الأعلى (9.30 و8.31 و8.00 على التوالي) يعطي إحساسًا بتوزيع التصنيف الإجمالي. ومتوسط التصنيف مرتفع للغاية، مما يشير إلى أن مجموعة البيانات تركز على الأفلام التي تحظى بتقدير كبير.
الأفلام حسب العقد: يوضح الرسم البياني عدد الأفلام التي تم إنتاجها (أو على الأقل تلك التي وصلت إلى أفضل 250 فيلمًا) عبر عقود مختلفة. ويبدو أن العقود من السبعينيات وحتى العقد الأول من القرن الحادي والعشرين تتمتع بتمثيل أعلى.
تفاصيل الفيلم المحددة: يوفر الجدول تفاصيل مثل الأصوات والمدة والعقد والسنة والتصنيف لكل فيلم.
الرؤى (المحتملة):
العصر الذهبي للسينما: قد يشير العدد الأكبر من الأفلام الأعلى تصنيفًا من السبعينيات وحتى العقد الأول من القرن الحادي والعشرين إلى "العصر الذهبي" للسينما، على الأقل من حيث الإشادة النقدية أو الشعبية. وسوف تكون هناك حاجة إلى مزيد من التحليل لتأكيد ذلك.
جودة متوسطة عالية: يشير متوسط التقييم المرتفع (8.31) إلى أن معايير الاختيار لهذه المجموعة من البيانات تفضل الأفلام التي نالت استحسان النقاد بشكل كبير.
اختلاف المدة: يعرض عمود "المدة" مجموعة من أطوال الأفلام، مما يشير إلى عدم وجود ارتباط قوي بين المدة والتقييم ضمن هذا الاختيار الأعلى تقييمًا. ومع ذلك، لا يمكن إجراء تحليل ارتباط كامل من الصورة فقط.
عدد الأصوات والشعبية: من المحتمل أن يمثل عمود "الأصوات" عدد أصوات المستخدمين أو المراجعات التي تلقاها الفيلم. ويمكن تفسير ذلك كبديل عن الشعبية أو التقدير.
التوصيات :
التوزيع وتحديد أي قيم شاذة.
تحديد مقياس الترتيب: توضيح المقياس الدقيق المستخدم لتصنيف أفضل 250 فيلمًا (على سبيل المثال، المتوسط المرجح للتقييم والأصوات).
التفكير في مصدر البيانات: فهم مصدر البيانات (على سبيل المثال، IMDb، Rotten Tomatoes) وأي تحيزات محتملة قد تقدمها.