استخراج بيانات IMDb باستخدام Web Scraping

تفاصيل العمل

استخراج بيانات الأفلام من IMDb باستخدام Selenium و Chrome Driver

في هذا المشروع، قمت بتطوير سكريبت باستخدام Python و Selenium لاستخراج بيانات الأفلام من موقع IMDb عبر عدة صفحات (Multiple Pages). تم استخدام Chrome WebDriver لمحاكاة التصفح الآلي واستخلاص البيانات المطلوبة مثل:

عنوان الفيلم

السنة

التصنيف العمري

التقييمات

عدد المصوتين

المخرج والنجوم

روابط الأفلام على IMDb

التقنيات المستخدمة

Python

Selenium

Chrome WebDriver

Pandas (لتنظيف البيانات وحفظها في CSV/Excel)

مميزات الكود

استخراج البيانات من عدة صفحات تلقائيًا وليس فقط من صفحة واحدة.

تنفيذ التمرير الديناميكي (Dynamic Scrolling) لتحميل جميع البيانات على الصفحة قبل استخراجها.

إضافة إمكانيات تصفح تلقائي لاستخراج بيانات من صفحات متعددة بدلاً من صفحة واحدة فقط.

حفظ البيانات بأكثر من تنسيق مثل CSV، JSON.

تنظيف البيانات وضبط الدقة.

مخرجات المشروع: ملف Excel يحتوي على قائمة الأفلام وبياناتها المستخرجة من عدة صفحات بدقة، مع تنظيفها و معالجتها.

بطاقة العمل

اسم المستقل
عدد الإعجابات
1
عدد المشاهدات
48
تاريخ الإضافة
تاريخ الإنجاز
المهارات