استكشاف البيانات ومعالجتها
قمت باستكشاف البيانات وفهم طبيعتها من خلال تحليل عدد الصفوف والأعمدة، والتعامل مع القيم المفقودة باستخدام تقنيات مثل التعويض الإحصائي.
حولت أنواع البيانات عند الحاجة لضمان توافقها مع التحليل.
درست توزيع المتغيرات المستهدفة وفحصت أي اختلال في التوزيع.
تحليل البيانات الوصفية والجغرافية
حسبت مقاييس إحصائية مثل المتوسط والانحراف المعياري لفهم توزيع البيانات الرقمية.
استكشفت العلاقة بين أنواع المطابخ وتقييمات المطاعم، وحددت المطابخ والمدن الأكثر شعبية.
استخدمت تقنيات التحليل الجغرافي لعرض مواقع المطاعم على الخرائط، وتحليل تأثير الموقع على التقييمات.
️ هندسة الميزات والنمذجة التنبؤية
أنشأت ميزات جديدة من البيانات المتاحة مثل طول اسم المطعم، ومدى توافر الحجز المسبق وخدمات التوصيل.
طبقت نماذج تعلم الآلة مثل الانحدار الخطي، الأشجار العشوائية (Random Forest) لتوقع تقييمات المطاعم، وقارنت أداء النماذج باستخدام مقاييس مثل RMSE و R².
تصور البيانات والاستنتاجات
أنشأت رسوم بيانية توضيحية لعرض الأنماط والاتجاهات في البيانات.
حللت العلاقة بين الميزات المختلفة والتقييمات لتحسين دقة النماذج التنبؤية.