تفاصيل العمل

قمت بتطوير نظام متكامل لأتمتة تدفق البيانات (Data Pipeline) يعمل على استخراج البيانات من مصادر خارجية عبر الـ API، معالجتها، ثم تخزينها بشكل هيكلي ومنظم داخل قاعدة بيانات PostgreSQL. يهدف المشروع إلى تحويل البيانات الخام غير المنظمة إلى بيانات جاهزة للتحليل والاستخدام المباشر في التطبيقات أو لوحات عرض البيانات (Dashboards).

المميزات التقنية للمشروع:

مرحلة الاستخراج (Extract): بناء وظائف برمجية للاتصال بـ APIs، مع معالجة التوثيق (Authentication)، والتعامل الاحترافي مع الـ Pagination لضمان سحب كافة البيانات المتاحة.

مرحلة التحويل (Transform): استخدام مكتبات Python القوية (مثل Pandas) لتنظيف البيانات، معالجة القيم المفقودة، توحيد التنسيقات، وتجهيز الجداول بما يتناسب مع Schema قاعدة البيانات.

مرحلة التحميل (Load): تصميم جداول قاعدة بيانات PostgreSQL وتحسين استعلامات SQL لضمان عملية إدخال (Insertion) سريعة وفعالة مع تجنب تكرار البيانات (Data Integrity).

الكود البرمجي: كود نظيف (Clean Code)

الأدوات والتقنيات المستخدمة:

لغة البرمجة: Python.

المكتبات الأساسية: Requests (للاتصال بـ API)، Pandas (لمعالجة البيانات).

قاعدة البيانات: PostgreSQL.

إدارة الاتصال: Psycopg2

لو اردت الاطلاع علي كامل ملفات المشروع

يمكنك زياره ال Repositories علي

GitHub : https://github.com/ahmeds...

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
المهارات