قمتُ بتطوير نموذج تعلم آلي يقوم بتوقع شدة الحادث (Accident Severity) اعتمادًا على بيانات تاريخية تضم عوامل متعددة مثل وقت الحادث، الظروف الجوية، حالة الطريق، نوع المركبة، وموقع الحادث.
العمل شمل تنظيف شامل للبيانات، معالجة القيم المفقودة، استخراج خصائص مهمة، تحليل الارتباط، وترميز الأعمدة. تم استخدام أكثر من نموذج تصنيف للوصول لأفضل أداء.
مميزات المشروع:
تحليل شامل للبيانات (EDA) قبل بناء النموذج
اختيار أفضل الخصائص باستخدام Correlation + SelectKBest
قمت ببناء:
Boosting Models مثل Gradient Boosting وXGBoost
Stacking Ensemble يجمع أكثر من نموذج للحصول على أفضل أداء قوي ومستقر
معالجة مشكلة عدم توازن البيانات
تحسين الأداء باستخدام Hyperparameter Tuning
تقييم النموذج باستخدام Accuracy، Precision، Recall، وROC-AUC
Notebook متكامل قابل للتشغيل مباشرة
طريقتي في التنفيذ:
قراءة البيانات ومعالجة الأعمدة غير الصالحة
تحويل الأعمدة المهمة مثل Time وDate إلى شكل رقمي مفيد
Encoding متقدم للفئات
تقسيم البيانات Train/Test بشكل صحيح
بناء Pipeline للتنظيف + النموذج
تقييم شامل + رسم منحنى ROC
استخراج Insights حقيقية عن أسباب الحوادث
المهارات والأدوات المستخدمة:
Python, Pandas, NumPy
Scikit-learn
Feature Engineering
Data Cleaning & Preprocessing
Correlation Analysis
Classification Algorithms
ROC & AUC Evaluation