في هذا المشروع قمت بالتعامل مع ثلاث مجموعات بيانات مختلفة، حيث قمت بـ:
تنظيف البيانات (Handling Missing Values – Removing Duplicates – Fixing Data Types)
توحيد الأعمدة والصيغ بين الملفات المختلفة
معالجة القيم الشاذة Outliers
تنفيذ عمليات Merge متعددة باستخدام مفاتيح مشتركة
التحقق من جودة البيانات بعد الدمج
استخراج نتائج وتحليلات نهائية بعد تكوين Dataset موحدة
استخدمت:
Python
Pandas
NumPy
النتيجة كانت إنشاء Dataset موحدة ونظيفة يمكن الاعتماد عليها في التحليل أو بناء نماذج Machine Learning