تصميم نظام معالجة بيانات تدفق حية باستخدام Apache Kafka و PySpark لجمع ومعالجة البيانات من مصادر مباشرة. البيانات التي تم جمعها كانت ذات حجم كبير وتمت معالجتها في الوقت الحقيقي باستخدام PySpark، ثم تم تخزينها في مستودعات بيانات قابلة للتوسعة لتحليل لاحق.
المهارات المستخدمة:
Apache Kafka (لإدارة التدفق الحي للبيانات)
PySpark (معالجة البيانات الحية والكبيرة)
إدارة البيانات في الوقت الحقيقي SQL
تحليل البيانات الحية SQL, Python
اسم المستقل | محمود ح. |
عدد الإعجابات | 0 |
عدد المشاهدات | 9 |
تاريخ الإضافة |