كتير من الشركات عندها بيانات ضخمة من مصادر مختلفة، لكن البيانات دي غالبًا غير منظمة، فيها أخطاء، وصعب الاعتماد عليها في التحليل واتخاذ القرار.
المشروع ده عبارة عن ETL Pipeline متكاملة بتحوّل البيانات الخام لبيانات منظمة، موثوقة، وجاهزة للتحليل، مع واجهة عرض بسيطة وواضحة.
المميزات الأساسية:
سحب البيانات من ملفات CSV من مصادر متعددة
تنظيف البيانات وتوحيدها ومعالجة القيم الناقصة
تخزين البيانات في MySQL باستخدام نموذج تحليلي Star Schema
فحص جودة البيانات تلقائيًا لضمان دقة التحليل
Dashboard باستخدام Streamlit لعرض البيانات بشكل مفهوم
الفائدة للعميل:
بيانات نظيفة وموثوقة جاهزة للتحليل واتخاذ القرار
ETL Pipeline منظمة وسهلة الصيانة والتوسع
إمكانية تكرار المشروع لأي مجموعة بيانات أخرى بسهولة
? مشاهدة المشروع على GitHub: