مشروع تحليلي تم تطويره باستخدام Python ونسخة موازية بـ PySpark لتحليل بيانات إشارات المرور بهدف تحسين كفاءة النظام المروري وتقليل الازدحام.
بدأ العمل بمرحلة تنظيف البيانات (Data Cleaning) من ملفات CSV تحتوي على بيانات زمن الإشارات وعدد السيارات في فترات مختلفة.
تم استخدام مكتبات Pandas وNumPy لإجراء التحليلات الإحصائية على النسخة المحلية، ثم تم تنفيذ نفس خطوات ETL (Extract, Transform, Load) على PySpark لمعالجة البيانات بكفاءة أعلى على نطاق أكبر.