بناء نظام متكامل لمعالجة بيانات التدفق باستخدام Kafka و PySpark و SQL

تفاصيل العمل

تصميم نظام معالجة بيانات تدفق حية باستخدام Apache Kafka و PySpark لجمع ومعالجة البيانات من مصادر مباشرة. البيانات التي تم جمعها كانت ذات حجم كبير وتمت معالجتها في الوقت الحقيقي باستخدام PySpark، ثم تم تخزينها في مستودعات بيانات قابلة للتوسعة لتحليل لاحق.

المهارات المستخدمة:

Apache Kafka (لإدارة التدفق الحي للبيانات)

PySpark (معالجة البيانات الحية والكبيرة)

إدارة البيانات في الوقت الحقيقي SQL

تحليل البيانات الحية SQL, Python

بطاقة العمل

اسم المستقل	محمود ح.
عدد الإعجابات	0
عدد المشاهدات	9
تاريخ الإضافة	13/10/2024

بناء نظام متكامل لمعالجة بيانات التدفق باستخدام Kafka و PySpark و SQL

تفاصيل العمل

بطاقة العمل

المهارات المستخدمة

شارك العمل

روابط

تابع مستقل على

وسائل الدفع المتاحة