تفاصيل العمل

كتير من الشركات عندها بيانات ضخمة من مصادر مختلفة، لكن البيانات دي غالبًا غير منظمة، فيها أخطاء، وصعب الاعتماد عليها في التحليل واتخاذ القرار.

المشروع ده عبارة عن ETL Pipeline متكاملة بتحوّل البيانات الخام لبيانات منظمة، موثوقة، وجاهزة للتحليل، مع واجهة عرض بسيطة وواضحة.

المميزات الأساسية:

سحب البيانات من ملفات CSV من مصادر متعددة

تنظيف البيانات وتوحيدها ومعالجة القيم الناقصة

تخزين البيانات في MySQL باستخدام نموذج تحليلي Star Schema

فحص جودة البيانات تلقائيًا لضمان دقة التحليل

Dashboard باستخدام Streamlit لعرض البيانات بشكل مفهوم

الفائدة للعميل:

بيانات نظيفة وموثوقة جاهزة للتحليل واتخاذ القرار

ETL Pipeline منظمة وسهلة الصيانة والتوسع

إمكانية تكرار المشروع لأي مجموعة بيانات أخرى بسهولة

? مشاهدة المشروع على GitHub:

https://github.com/abdel7...