التنبؤ بمدة رحلات التاكسي في نيويورك باستخدام تعلم الآلة (NYC Taxi Trip Duration Prediction)

تفاصيل العمل

قمت ببناء نموذج تعلم آلة (Machine Learning Regression Model) يهدف إلى التنبؤ الدقيق بالمدة الزمنية لرحلات التاكسي في مدينة نيويورك (NYC Taxi Trip Duration). المشروع يحاكي التحديات الحقيقية التي تواجهها شركات النقل الذكي (مثل Uber/Careem) في تقدير وقت الوصول (ETA) للعملاء.

التحديات والحلول التقنية: القيمة الحقيقية لهذا المشروع تكمن في مرحلة ما قبل التدريب (Pre-processing)، حيث قمت بالآتي:

هندسة الخصائص (Feature Engineering): استخراج ميزات ذكية من الطوابع الزمنية (مثل: ساعة الذروة، أيام العطلات، حالة الطقس) وحساب المسافة الجغرافية (Haversine Distance) بين نقطتي الانطلاق والوصول.

تنظيف البيانات (Data Cleaning): التعامل مع القيم الشاذة (Outliers) التي قد تفسد النموذج، مثل الرحلات ذات المدة السالبة أو الرحلات الطويلة جداً غير المنطقية.

تحليل البيانات (EDA): دراسة أنماط الازدحام المروري وتصورها بيانياً لفهم العوامل المؤثرة على الوقت.

النمذجة والنتائج:

تم تجربة عدة خوارزميات، واعتماد نموذج Random Forest (أو XGBoost حسب استخدامك) نظراً لكفاءته مع البيانات غير الخطية.

تم تقييم النموذج باستخدام مقياس RMSLE (لضمان دقة التنبؤ بالدقائق) وتحقيق نتائج تنافسية.

التقنيات والأدوات المستخدمة:

لغة البرمجة: Python.

المعالجة والتحليل: Pandas, NumPy.

تعلم الآلة: Scikit-Learn, XGBoost.

التصور البياني: Matplotlib, Seaborn.

النتيجة النهائية: كود برمجي نظيف وموثق، ونموذج قادر على استقبال إحداثيات ووقت الرحلة وإخراج الزمن المتوقع بدقة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
6
تاريخ الإضافة
تاريخ الإنجاز
المهارات