المشروع عبارة عن تنفيذ Retail Data Warehouse كامل باستخدام SQL Server (T-SQL) بدءًا من ملف CSV وحتى بناء Star Schema جاهزة للتحليل.
المراحل التي تم تنفيذها:
1- إنشاء Staging Table وتحميل البيانات الخام.
2- تصميم Star Schema:
- fact_sales
- dim_product
- dim_customers
- dim_date (Calendar Dimension مستقلة)
3- معالجة مشاكل البيانات:
- اختلاف صيغ التواريخ (DD/MM/YYYY)
- معالجة NULL values
- حل مشاكل تكرار المفاتيح الأساسية
- توسيع أطوال الأعمدة لمنع Truncation
4- بناء Calendar Dimension احترافية تغطي كامل نطاق التواريخ.
5- تحميل الأبعاد باستخدام GROUP BY على Business Keys لضمان صف واحد لكل كيان.
6- تحميل Fact Table مع ربط صحيح على:
- order_date_id
- ship_date_id
- product_id
- customer_id
7- التحقق من صحة البيانات:
- مقارنة عدد الصفوف
- مطابقة SUM(sales) بين المصدر والـ Warehouse
- اختبار تكامل العلاقات (Foreign Keys)
التقنيات المستخدمة:
- SQL Server
- T-SQL
- Data Modeling
- Star Schema
- Data Validation
- Calendar Dimension Design
المخرجات:
- سكربتات إنشاء الجداول
- سكربتات تحميل الأبعاد
- سكربت تحميل الفاكت
- سكربت بناء Calendar Table
- استعلامات تحقق واختبار