تحليل بيانات تأجير الدراجات في مدينة
نفذت هذا المشروع التحليلي باستخدام لغة Python وبيئة Jupyter Notebook بهدف فهم العوامل المؤثرة على عدد مستخدمي نظام تأجير الدراجات في المدينة حسب الساعات، وذلك من خلال تحليل بيانات حقيقية مستخرجة من نظام مشاركة الدراجات.
? مكونات المشروع:
تحميل ومعالجة البيانات: قراءة وتنظيف بيانات تأجير الدراجات، وتحويل المتغيرات الزمنية إلى صيغ قابلة للتحليل.
تحليل استكشافي للبيانات (EDA):
دراسة تأثير الطقس ودرجة الحرارة والرطوبة على عدد المستخدمين.
تحليل توزيع الاستخدام حسب الساعة، اليوم، والشهر.
مقارنة بين المستخدمين العاديين والموسميين.
تصوير البيانات باستخدام الرسوم البيانية:
تحليل بصري للأنماط اليومية والأسبوعية.
رسم العلاقات بين عدد الرحلات والمتغيرات المناخية والزمنية.
تحليل الارتباط بين المتغيرات: لتحديد أهم المؤثرات في عدد المستخدمين.
تهيئة البيانات للنمذجة المستقبلية: شملت استخراج الخصائص وتطبيع القيم وتجهيز البيانات لنماذج التنبؤ.
️ الأدوات والتقنيات المستخدمة:
Python
Pandas, NumPy
Matplotlib, Seaborn, Plotly
Jupyter Notebook
نتائج المشروع:
أظهر التحليل أن العوامل المناخية والوقت من اليوم واليوم من الأسبوع تلعب دورًا أساسيًا في التأثير على استخدام الدراجات، كما تم تحديد الأنماط الزمنية الأكثر استخدامًا والتي تفيد في تحسين التخطيط المستقبلي لخدمات النقل.
ملاحظات:
المشروع قابل للتطوير بإضافة نماذج تعلم آلي لتوقع عدد المستخدمين في أوقات مختلفة، مما يساعد في تحسين إدارة الموارد وخطط الصيانة.