تفاصيل العمل

قمت بتطوير مشروع عملي باستخدام PySpark يهدف إلى تنظيف وتحضير بيانات الطلبات (Orders Dataset) ضمن بيئة معالجة بيانات ضخمة.

المشروع شمل:

تحميل ومعالجة البيانات الخام المخزنة بصيغة Parquet.

تنظيف البيانات من القيم المفقودة والمكررة.

تنسيق الحقول (مثل التواريخ، الأسعار، وحالة الطلبات).

إنتاج ملف بيانات نظيف جاهز للاستخدام في التحليلات المتقدمة.

تنفيذ كل الخطوات داخل Notebook موثّق ليسهّل الفهم وإعادة الاستخدام.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات