مشروع تحليل بيانات يركز على معالجة وتنظيف بيانات الأفلام لاستخراج معلومات مهمة مثل أسماء الممثلين (Cast) والمخرجين (Director) من بيانات خام ومعقدة.
هدف المشروع:
تحويل البيانات غير المنظمة (Nested & JSON-like data) إلى بيانات نظيفة ومنظمة يمكن استخدامها بسهولة في التحليل أو بناء أنظمة توصية (Recommendation Systems).
ما تم تنفيذه:
التعامل مع بيانات تحتوي على:
cast (قائمة الممثلين داخل JSON)
crew (بيانات فريق العمل)
movie_id / id
-تنظيف البيانات (Data Cleaning):
-استخراج أسماء الممثلين من القوائم المعقدة
-التعامل مع القيم الفارغة والمفقودة
-تحويل البيانات إلى شكل قابل للاستخدام
Feature Engineering:
--إنشاء عمود جديد يحتوي على أسماء الممثلين فقط (cast_names)
-استخراج اسم المخرج (director) من بيانات الـ crew
-دمج البيانات (Data Merging):
-ربط أكثر من Dataset باستخدام movie_id
الأدوات المستخدمة:
Python
Pandas
Data Cleaning & Transformation
Working with JSON Data
أهمية المشروع:
تجهيز البيانات لاستخدامها في:
- Recommendation Systems
-Data Analysis
- Machine Learning Models