استخراج بيانات الأفلام من IMDb باستخدام Selenium و Chrome Driver
في هذا المشروع، قمت بتطوير سكريبت باستخدام Python و Selenium لاستخراج بيانات الأفلام من موقع IMDb عبر عدة صفحات (Multiple Pages). تم استخدام Chrome WebDriver لمحاكاة التصفح الآلي واستخلاص البيانات المطلوبة مثل:
عنوان الفيلم
السنة
التصنيف العمري
التقييمات
عدد المصوتين
المخرج والنجوم
روابط الأفلام على IMDb
التقنيات المستخدمة
Python
Selenium
Chrome WebDriver
Pandas (لتنظيف البيانات وحفظها في CSV/Excel)
مميزات الكود
استخراج البيانات من عدة صفحات تلقائيًا وليس فقط من صفحة واحدة.
تنفيذ التمرير الديناميكي (Dynamic Scrolling) لتحميل جميع البيانات على الصفحة قبل استخراجها.
إضافة إمكانيات تصفح تلقائي لاستخراج بيانات من صفحات متعددة بدلاً من صفحة واحدة فقط.
حفظ البيانات بأكثر من تنسيق مثل CSV، JSON.
تنظيف البيانات وضبط الدقة.
مخرجات المشروع: ملف Excel يحتوي على قائمة الأفلام وبياناتها المستخرجة من عدة صفحات بدقة، مع تنظيفها و معالجتها.