قمت بتنفيذ تحليل استكشافي متكامل للبيانات بهدف فهم الهيكل العام للـ dataset واكتشاف الأنماط والعلاقات الخفية بين المتغيرات قبل بناء أي نماذج تنبؤية. ركّز المشروع على تحويل البيانات الخام إلى رؤى واضحة تساعد في اتخاذ قرارات مبنية على الأدلة.
ما يميز هذا العمل:
تنظيف البيانات ومعالجة القيم المفقودة والشاذة لضمان جودة التحليل
تحليل التوزيعات الإحصائية (Mean – Median – Variance) لفهم سلوك البيانات
دراسة العلاقات بين المتغيرات باستخدام Correlation وScatter Plots
اكتشاف الأنماط والـ Trends والعوامل المؤثرة على المتغير المستهدف
استخدام Visualization متقدم لتبسيط النتائج لغير المتخصصين
الأدوات والتقنيات:
Python (Pandas, NumPy)
Data Visualization (Matplotlib, Seaborn)
Jupyter Notebook