تفاصيل العمل

مشروع تحليل بيانات يركز على معالجة وتنظيف بيانات الأفلام لاستخراج معلومات مهمة مثل أسماء الممثلين (Cast) والمخرجين (Director) من بيانات خام ومعقدة.

هدف المشروع:

تحويل البيانات غير المنظمة (Nested & JSON-like data) إلى بيانات نظيفة ومنظمة يمكن استخدامها بسهولة في التحليل أو بناء أنظمة توصية (Recommendation Systems).

ما تم تنفيذه:

التعامل مع بيانات تحتوي على:

cast (قائمة الممثلين داخل JSON)

crew (بيانات فريق العمل)

movie_id / id

-تنظيف البيانات (Data Cleaning):

-استخراج أسماء الممثلين من القوائم المعقدة

-التعامل مع القيم الفارغة والمفقودة

-تحويل البيانات إلى شكل قابل للاستخدام

Feature Engineering:

--إنشاء عمود جديد يحتوي على أسماء الممثلين فقط (cast_names)

-استخراج اسم المخرج (director) من بيانات الـ crew

-دمج البيانات (Data Merging):

-ربط أكثر من Dataset باستخدام movie_id

الأدوات المستخدمة:

Python

Pandas

Data Cleaning & Transformation

Working with JSON Data

أهمية المشروع:

تجهيز البيانات لاستخدامها في:

- Recommendation Systems

-Data Analysis

- Machine Learning Models

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات