مشروع Data Analysis تم فيه استخدام Apache Spark (PySpark) لتحليل بيانات طلبات البيتزا واستخراج مؤشرات تساعد في فهم المبيعات بشكل أفضل
التقنيات المستخدمة
Python
PySpark
Pandas
plotly ( لتكون اكثر تفاعلية)
الخطوات اللي اتعملت (Workflow)
قراءة البيانات (CSV/JSON).
تجهيز وتنظيف البيانات (Data Cleaning).
استخدام PySpark لعمل Aggregations مثل:
3.1. أكثر نوع بيتزا مبيعًا.
3.2. عدد الطلبات اليومي/الأسبوعي.
3.3. المبيعات حسب حجم البيتزا.
استخراج Insights من البيانات.
عرض النتائج في جداول ورسوم بيانية.
المخرجات (Outputs/Results)
جداول تلخص المبيعات.
Charts (Bar chart, Line chart, Pie chart) لعرض:
2.1. Top-selling pizzas.
2.2. Distribution of pizza sizes.
2.3. الطلبات خلال الوقت.
النتيجة / الفائدة العملية
المشروع بيساعد مطعم أو محل بيتزا إنه يعرف:
1.1. أي نوع بيتزا يبيع أكتر.
1.2. أوقات الذروة في الطلبات.
1.3. أي حجم بيتزا مطلوب أكتر.