Advanced Data Cleaning & Multi-Source Data Integration using Pandas

تفاصيل العمل

في هذا المشروع قمت بالتعامل مع ثلاث مجموعات بيانات مختلفة، حيث قمت بـ:

تنظيف البيانات (Handling Missing Values – Removing Duplicates – Fixing Data Types)

توحيد الأعمدة والصيغ بين الملفات المختلفة

معالجة القيم الشاذة Outliers

تنفيذ عمليات Merge متعددة باستخدام مفاتيح مشتركة

التحقق من جودة البيانات بعد الدمج

استخراج نتائج وتحليلات نهائية بعد تكوين Dataset موحدة

استخدمت:

Python

Pandas

NumPy

النتيجة كانت إنشاء Dataset موحدة ونظيفة يمكن الاعتماد عليها في التحليل أو بناء نماذج Machine Learning

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات