تفاصيل العمل

قمت بتنظيف وتجهيز بيانات مشروع خاص بموقع IMDB باستخدام Excel وPower Query، مع التركيز الكامل على جودة الداتا قبل أي تحليل أو Visualization.

العمل كان موجّه لتحويل داتا خام وغير منظمة إلى Dataset صالحة للتحليل وتعكس الواقع الفعلي، وليس مجرد أرقام مجمّعة.

خطوات تنظيف وتجهيز البيانات شملت:

• توحيد أسماء الأعمدة وصياغتها بشكل تحليلي واضح

• معالجة القيم المفقودة في التقييمات، الإيرادات، ومدد الأفلام

• تصحيح عدم الاتساق في أسماء الأنواع (Genres) وتوحيدها

• فصل الحقول المركّبة مثل (Genres / Directors / Actors) لتسهيل التحليل

• تحويل أنواع البيانات (Dates, Numbers, Ratings) إلى صيغ صحيحة

• استبعاد السجلات غير الصالحة أو غير المكتملة التي تؤثر على دقة النتائج

تم التعامل مع الداتا بمنطق تحليلي، وليس تقني فقط.

أي قيمة ناقصة أو غير منطقية تم تقييمها: إما معالجتها بطريقة صحيحة أو استبعادها إذا كانت ستؤدي لاستنتاجات مضللة.

أكبر تحدي في المشروع لم يكن الأدوات، بل القرارات.

متى أحتفظ بالبيانات؟ ومتى أستبعدها؟ وما تأثير ذلك على التحليل النهائي؟

المشروع أكد نفس القناعة:

التحليل القوي لا يبدأ من الشارت، يبدأ من داتا نظيفة ومفهومة.

تنظيف بيانات IMDB كان تدريب عملي على التفكير التحليلي الحقيقي، حيث كل خطوة في تجهيز الداتا لها تأثير مباشر على أي Insight لاحق.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة