قمت بتنفيذ مشروع Web Scraping لاستخراج بيانات الأفلام وإيراداتها من موقع Box Office Mojo، وذلك بهدف إنشاء قاعدة بيانات شاملة يمكن استخدامها في تحليل صناعة السينما ودراسة أداء الأفلام في شباك التذاكر.
يتضمن المشروع تطوير سكربت برمجي يقوم بجمع البيانات تلقائيًا من صفحات الموقع المختلفة، مع التعامل مع تعدد الصفحات لضمان استخراج جميع السجلات المتاحة.
البيانات التي تم جمعها تشمل:
- اسم الفيلم
- سنة الإصدار
- الإيرادات المحلية )Domestic Gross(
- الإيرادات العالمية )Worldwide Gross(
- ترتيب الفيلم في شباك التذاكر
كما تم تنفيذ عمليات تنظيف ومعالجة للبيانات لضمان دقتها وقابليتها للتحليل، بالإضافة إلى تنظيمها في ملفات منظمة مثل CSV أو JSON لتسهيل استخدامها لاحقًا في التحليل أو إدخالها في قواعد البيانات.