هذا المشروع يوضح كيفية تنظيف ومعالجة البيانات باستخدام لغة بايثون ومكتبة Pandas.
البرنامج يقوم بعدة خطوات أساسية لضمان أن البيانات نظيفة وصالحة للتحليل، ومنها:
إزالة القيم المكررة (Duplicates).
معالجة القيم المفقودة (Missing Values) عن طريق التعويض بقيم مناسبة.
تنسيق الأعمدة النصية (إزالة المسافات الزائدة).
التأكد من أن الأعمدة الرقمية (مثل الأعداد والأسعار) لها النوع الصحيح (int/float).
حفظ البيانات بعد التنظيف في ملف CSV جديد جاهز للاستخدام في أي مشروع تحليل بيانات أو تعلم آلي.
و هذا المشروع يوضح مهاراتي في تنظيف البيانات (Data Cleaning) ومعالجتها (Preprocessing)، وهي خطوة أساسية قبل أي عملية تحليل بيانات أو بناء نماذج تعلم آلي