تفاصيل العمل

إنشاء خط تدفق بيانات (Data Pipeline):

كنت مسئوله عن تصميم وتنفيذ خط تدفق بيانات يتعامل مع مصادر البيانات المختلفة (مبيعات البقالة والبيانات التكميلية).

تطلب هذا المشروع جمع البيانات، تنظيفها، وتحويلها إلى شكل مناسب للتحليل.

الأدوات المستخدمة شملت تقنيات مثل Apache Spark أو Airflow لتنظيم تدفق البيانات، مع استخدام PostgreSQL كمصدر أساسي للبيانات.

تحليل العرض والطلب حول فترة الأعياد:

الهدف من التحليل هو فهم كيف تتأثر مبيعات البقالة خلال فترة الأعياد.

فمت بتحليل اتجاهات العرض والطلب بناءً على بيانات المبيعات. هذا سيتضمن تحديد المنتجات الأكثر مبيعًا، والفترات الزمنية التي يزيد فيها الطلب على بعض السلع.

يمكن الاستفادة من التحليلات التنبؤية للتوقع بكميات المخزون المطلوبة لتلبية الطلب المتزايد.

العمل مع مصدرين للبيانات:

البيانات الرئيسية: هي بيانات grocery_sales التي تحتوي على معلومات حول مبيعات المنتجات (مثل تواريخ المبيعات، الأصناف، الكميات، والمبالغ).

البيانات التكميلية: يمكن أن تشمل بيانات إضافية مثل البيانات الديموغرافية للعملاء، بيانات الطقس (التي قد تؤثر على المبيعات خلال العطلات)، أو بيانات حول العروض والخصومات.

دوري هو الدمج بين هذه البيانات وتحليل العلاقة بينها للحصول على رؤى أعمق.

إجراء تحليل أولي للبيانات:

تحليل البيانات الأولي يتضمن استكشاف البيانات المتاحة، تنظيفها من الأخطاء، ومعالجة القيم المفقودة.

استخراج إحصائيات وصفية حول البيانات (مثل المتوسطات، التوزيعات، والانحرافات) للحصول على فكرة أولية عن الأنماط السائدة.

يمكنك استخدام SQL داخل PostgreSQL لإجراء هذا التحليل أو استخدام أدوات مثل Pandas في Python أو Spark لتحليل البيانات الكبيرة.

مخرجات المشروع:

بناء خط تدفق بيانات متكامل.

تحليل أولي لبيانات المبيعات.

تحديد المنتجات الأكثر طلبًا خلال فترة الأعياد.

توصيات بناءً على التحليل لتحسين العرض والطلب.

دعم البيانات التكميلية للحصول على رؤى شاملة حول ديناميكية المبيعات خلال العطلات.

هذا المشروع سيساعد في تحسين فهم سلوك السوق خلال فترة الأعياد، مما يمكن التجار من اتخاذ قرارات أفضل بشأن المخزون والعروض الترويجية.

ملفات مرفقة

بطاقة العمل

اسم المستقل مايا ع.
عدد الإعجابات 0
عدد المشاهدات 5
تاريخ الإضافة
تاريخ الإنجاز