تفاصيل العمل

قمت بتطوير خط معالجة بيانات (ETL Pipeline) احترافي بأسلوب إنتاجي لمعالجة بيانات المستخدمين.

ميزات المشروع:

• دعم إدخال البيانات بصيغة JSON و CSV

• بنية متعددة الطبقات: Source → Staging → Transform → Validate → Load

• تطبيق قواعد تحقق صارمة لضمان جودة البيانات

• منع التكرار باستخدام Idempotent Processing

• تحميل البيانات إلى PostgreSQL

• إنشاء ملف Parquet بنمط Data Lake

• دعم Batch ID لكل عملية معالجة

• اختبارات Unit و Integration باستخدام pytest

• دعم Docker لتشغيل PostgreSQL

تم تنفيذ المشروع باستخدام Python و PostgreSQL مع تصميم معماري واضح ورسومات Mermaid توضح تدفق البيانات.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات