بنيت نموذج تنبؤي لتقدير مدة رحلات التاكسي في نيويورك
على أكثر من 1,000,000 رحلة حقيقية.
النتائج:
- Validation R²: 0.7638
- RMSE: 0.3524 (log scale)
ما يميز هذا المشروع:
✅ هندسة 15+ feature متقدمة:
- Haversine Distance (المسافة الحقيقية)
- Cyclical Time Encoding (تشفير الوقت الدوري)
- Rush-Hour Flag
- 100 KMeans Route Clusters للأنماط المكانية
✅ معالجة بيانات ضخمة +1M سجل بكفاءة
✅ Ridge Regression مع pipeline كاملة
التقنيات: Python | Pandas | NumPy | Scikit-learn | KMeans