مشروع يهدف إلى تحليل البيانات الاستكشافي (Exploratory Data Analysis) باستخدام لغة Python، من أجل فهم طبيعة البيانات واستخراج أنماط وحقائق مبدئية تساعد في بناء قرارات أفضل.
الكود يقوم بالخطوات التالية:
تحميل البيانات من ملف CSV وعرض أبعادها وأول صفوف.
عرض تقرير شامل عن الأعمدة (أنواعها، القيم المفقودة، الإحصائيات الوصفية).
تحليل الأعمدة العددية من خلال رسوم بيانية (Histogram + KDE) لفهم توزيع البيانات.
تحليل الأعمدة الفئوية (Categorical) عبر Countplot لقياس التوزيع بين الفئات.
إنشاء مصفوفة الارتباط (Correlation Heatmap) لتوضيح العلاقات بين المتغيرات العددية.
المشروع يساعد على:
اكتشاف القيم المفقودة أو الغريبة.
التعرف على توزيع البيانات.
فهم العلاقات بين الأعمدة.
تجهيز البيانات للخطوات التالية مثل التنظيف أو النمذجة.