قمت في هذا المشروع ببناء نظام متكامل يعمل على جمع وتحليل بيانات الأفلام من موقع Rotten Tomatoes، ثم تحويلها إلى لوحة تحكم تفاعلية يمكن من خلالها استكشاف المعلومات بسهولة واتخاذ قرارات مبنية على البيانات.
مراحل تنفيذ المشروع:
Web Scraping:
استخراج بيانات الأفلام (العنوان، النوع، سنة الإصدار، تقييم النقّاد والجمهور) باستخدام Python وBeautifulSoup.
تنظيف البيانات (Data Cleaning):
حذف البيانات المكررة
معالجة القيم المفقودة
توحيد تنسيقات البيانات
التحليل الاستكشافي (EDA):
تحليل الاتجاهات حسب النوع والسنة، ومقارنة تقييم النقّاد مقابل تقييم الجمهور.
لوحة تحكم تفاعلية (Interactive Dashboard):
تطوير Dashboard باستخدام Streamlit تسمح للمستخدم:
بتصفية البيانات حسب النوع أو السنة
استعراض الرسوم البيانية
تحميل البيانات بصيغ مختلفة
النشر (Deployment):
إعداد المشروع للنشر محليًا أو عبر منصة Streamlit Cloud.
أهم النتائج:
الأفلام الجماهيرية (Blockbusters) غالبًا ما تحصل على تقييم أعلى من الجمهور مقارنة بالنقّاد.
الدراما المستقلة تسجل نتائج أقوى لدى النقّاد.
زيادة ملحوظة في إنتاج أفلام الرعب بعد 2015.
المهارات والأدوات المستخدمة:
Python – BeautifulSoup – Pandas – Plotly – Streamlit – EDA – Data Cleaning – Deployment