بناء قاعدة بيانات شاملة للاتحاد الدولي للفروسية (FEI) تشمل 600,000 حصان ورياضي

تفاصيل العمل

وصف المشروع:

قمت بتطوير "Scraper" متقدم لاستخراج وأرشفة بيانات ضخمة من الموقع الرسمي للاتحاد الدولي للفروسية (FEI). المشروع لا يقتصر فقط على جمع البيانات، بل شمل معالجتها وتنظيمها لتكون جاهزة للتحليل الإحصائي أو بناء تطبيقات برمجية متخصصة في مجال الفروسية.

أبرز أرقام المشروع:

حجم البيانات: أكثر من 600,000 سجل (خيل ومتسابق).

تغطية البيانات: تشمل نتائج البطولات، التصنيفات الدولية، وبيانات الخيول التفصيلية.

هيكل البيانات المستخرجة (Data Schema):

تم تنظيم البيانات في أعمدة دقيقة تغطي كافة جوانب الحدث الرياضي:

بيانات البطولة (Event Info):

show_name: اسم العرض أو البطولة.

event_label: تصنيف الحدث.

event_url: الرابط المباشر للحدث لضمان الموثوقية.

start_date & end_date: الفترة الزمنية للبطولة.

نتائج المنافسات (Competition Results):

individual_results_url: رابط النتائج التفصيلية لكل متسابق.

pos (Position): المركز الذي حققه المتسابق في البطولة.

بيانات الرياضيين (Athletes):

athlete_fei_id: الرقم التعريفي الدولي للمتسابق (ID).

athlete_name: اسم المتسابق بالكامل.

بيانات الخيول (Horses):

horse_fei_id: الرقم التعريفي الدولي للخيل.

horse_name: اسم الخيل.

horse_url: رابط الملف الشخصي للخيل على موقع FEI.

horse_info: معلومات إضافية (مثل السلالة، العمر، والمنشأ).

الأدوات والتقنيات المستخدمة:

Python: اللغة الأساسية للسكربت.

Selenium / Playwright: للتعامل مع المحتوى الديناميكي للموقع.

Data Cleaning: استخدام Pandas لتنظيف البيانات وإزالة التكرارات.

Storage: تصدير البيانات بصيغ (CSV / Excel / SQL) حسب الحاجة.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
المهارات