Sales Data Analysis Pipeline

تفاصيل العمل

A complete PySpark pipeline that processes raw retail sales data and produces key business insights. The project includes reading CSV files, cleaning and transforming data, handling missing values, and performing aggregations to compute metrics such as top-selling products, monthly sales trends, average order value per customer, and regional sales performance. The final results are written in optimized formats like Parquet/CSV for downstream analytics.

ملفات مرفقة

- 7Z
- SalesDataAnalysisPipeline.7z
- (8.44KB)

بطاقة العمل

اسم المستقل

انصاف م.

عدد الإعجابات

تاريخ الإضافة

07/12/2025

تاريخ الإنجاز

15/10/2025

المهارات

Sales Data Analysis Pipeline

تفاصيل العمل

ملفات مرفقة

بطاقة العمل

روابط

تابع مستقل على

وسائل الدفع المتاحة