مشروع IMDB ETL
المشروع كان هدفه بناء ETL Pipeline لبيانات قائمة الـ IMDB Top 250 Movies.
الاستخراج (Extraction)
تم جمع البيانات الخام عن طريق Web Scraping لقائمة أفضل 250 فيلم من موقع IMDB.
التحويل (Transformation)
تنظيف وتوحيد الأعمدة الأساسية:
إزالة الصفوف الغير صالحة والتأكد من تنسيق الأسماء.
تحويل سنة الإصدار، التقييمات، ومدة الفيلم إلى قيم رقمية.
تحويل مدة الفيلم من صيغة الساعات/الدقائق إلى دقائق إجمالية.
استبدال الروابط المفقودة بـ NULL.
إزالة التكرارات بناءً على اسم الفيلم + سنة الإصدار.
التحميل (Loading)
تحميل البيانات بعد التنظيف في SQL Server Database لتكون جاهزة للاستعلام والتحليل.
التصور (Visualization)
تم بناء لوحة Power BI تفاعلية تشمل:
متوسط تقييم الأفلام لكل سنة (Line Chart).
توزيع الأفلام حسب التصنيف العمري (Pie Chart).
عرض أعلى فيلم تقييمًا (Card).
إجمالي عدد الأفلام لكل سنة (Column Chart).
النتيجة
المشروع وفر تجربة عملية متكاملة في استخراج، تنظيف، تحويل، تحميل، وعرض بيانات حقيقية للأفلام، مع إبراز أنماط مهمة في تقييمات الأفلام وتوجهات صناعة السينما عبر السنوات.