قمت ببناء نظام متكامل يعتمد على استخراج بيانات سباقات الخيل من مصدر رسمي (tab.com.au) باستخدام Scraping وواجهات API، ثم قمت بتنظيف البيانات وتجميعها وتحويلها إلى صيغة قابلة للاستخدام في نماذج تعلم الآلة.
المشروع يشمل:
استخراج روابط السباقات عبر API لكل يوم داخل فترة زمنية محددة.
جلب بيانات كل حصان وجوكي ومدرب ونتائج السباقات وتخزينها في ملفات CSV.
دمج البيانات تلقائيًا من عدة أشهر في ملف نهائي واحد.
إعداد البيانات للنمذجة مع تعويض القيم المفقودة، والتعامل مع البيانات التصنيفية.
دعم إعادة تدريب النموذج تلقائيًا عند تشغيل الملف الرئيسي main.ipynb.
تم بناء النظام باستخدام Python وscikit-learn وpandas، مع دعم استخدام TLS-protected APIs وproxy rotation.