بناء نظام متكامل لمعالجة بيانات التدفق باستخدام Kafka و PySpark و SQL

تفاصيل العمل

تصميم نظام معالجة بيانات تدفق حية باستخدام Apache Kafka و PySpark لجمع ومعالجة البيانات من مصادر مباشرة. البيانات التي تم جمعها كانت ذات حجم كبير وتمت معالجتها في الوقت الحقيقي باستخدام PySpark، ثم تم تخزينها في مستودعات بيانات قابلة للتوسعة لتحليل لاحق.

المهارات المستخدمة:

Apache Kafka (لإدارة التدفق الحي للبيانات)

PySpark (معالجة البيانات الحية والكبيرة)

إدارة البيانات في الوقت الحقيقي SQL

تحليل البيانات الحية SQL, Python

بطاقة العمل

اسم المستقل محمود ح.
عدد الإعجابات 0
عدد المشاهدات 3
تاريخ الإضافة