يهدف هذا المشروع إلى بناء مستودع بيانات متكامل وجاهز للاستخدام في بيئات الإنتاج، مع تطبيق أفضل ممارسات هندسة البيانات الحديثة باستخدام معمارية Medallion Architecture.
يقوم النظام بدمج بيانات المبيعات القادمة من عدة أنظمة مختلفة مثل ERP وCRM، ثم معالجتها وتنظيمها لتصبح جاهزة للتحليل واتخاذ القرارات.
يساعد هذا المشروع الشركات على تحويل البيانات الخام إلى معلومات تحليلية ذات قيمة يمكن استخدامها في التقارير ولوحات البيانات (Dashboards).
?️ معمارية النظام
يعتمد المشروع على Medallion Architecture التي تتكون من ثلاث طبقات رئيسية:
الطبقة الهدف الخصائص
Bronze البيانات الخام استيراد البيانات من ملفات CSV القادمة من أنظمة ERP وCRM وتخزينها كما هي
Silver البيانات المنظفة تنفيذ عمليات تنظيف البيانات، التحقق من الجودة، وتوحيد الصيغ
Gold بيانات جاهزة للتحليل إنشاء نموذج بيانات تحليلي باستخدام Star Schema مع جداول الأبعاد والحقائق
? المهارات التقنية التي يبرزها المشروع
يعرض هذا المشروع مجموعة من المهارات الأساسية في مجال هندسة البيانات وتحليلها:
تصميم معمارية البيانات
تصميم مستودع بيانات قابل للتوسع وقادر على التعامل مع مصادر بيانات متعددة.
نمذجة البيانات (Data Modeling)
بناء نموذج Star Schema باستخدام جداول الأبعاد (Dimensions) وجداول الحقائق (Facts).
تطوير خطوط معالجة البيانات (ETL Pipelines)
استخراج البيانات من المصادر المختلفة
تحويلها وتنظيفها
تحميلها في طبقات مستودع البيانات.
تحسين استعلامات SQL
كتابة استعلامات SQL فعالة لتحويل البيانات وتحليلها.
توثيق البيانات
تطبيق معايير واضحة لتسمية الجداول والأعمدة
إنشاء كتالوج بيانات واضح يسهل فهمه واستخدامه.