قمت بتنفيذ مشروع تنظيف وتحليل بيانات باستخدام لغة Python ومكتبات Pandas وNumPy، بهدف تحسين جودة البيانات واستخراج مؤشرات دقيقة تدعم اتخاذ القرار.
خطوات العمل التي قمت بها:
- تنظيف البيانات: معالجة القيم المفقودة والأخطاء، وتوحيد تنسيقات البيانات.
- تحليل إحصائي: حساب المئينات (Quartiles) والمدى الربيعي (IQR) لتحديد القيم الشاذة (Outliers).
- تصور البيانات: إنشاء Boxplot لعرض توزيع البيانات وتوضيح القيم المتطرفة بصريًا.
- تحديد المؤشرات: استخراج الحدود العليا والدنيا للقيم الطبيعية، مما يساعد على تحسين دقة النماذج التحليلية لاحقًا.
القيمة المضافة للعميل:
- بيانات نظيفة وجاهزة للتحليل أو النمذجة.
- تقارير ورسوم بيانية توضح النتائج بشكل مبسط وواضح.
- أسلوب عمل منهجي يضمن دقة المخرجات وسهولة إعادة الاستخدام.