مشروع: التنبؤ بأسعار السيارات باستخدام تحليل البيانات والنمذجة الرياضية
يواجه الكثير من الأفراد وشركات بيع السيارات صعوبة في تحديد السعر العادل للسيارة اعتمادًا على خصائصها المختلفة مثل العمر والموديل وحالة السيارة. لذلك قمت بتطوير نموذج يعتمد على تحليل البيانات والتعلم الآلي للتنبؤ بسعر السيارة بشكل أكثر دقة.
بدأت المشروع بقراءة البيانات وتحليلها باستخدام Pandas لفهم طبيعة البيانات والعلاقات بين المتغيرات المختلفة. بعد ذلك قمت بتنظيم البيانات من خلال توحيد أسماء الأعمدة وتنظيفها لضمان سهولة التعامل معها في المراحل اللاحقة.
لتحليل البيانات بشكل أعمق، استخدمت الرسوم البيانية لفهم توزيع القيم والعلاقات بين المتغيرات. كما قمت بتطبيق التحويل اللوغاريتمي (Log Transformation) لتطبيع القيم وتحسين أداء النموذج.
بعد ذلك قمت بمعالجة القيم المفقودة عن طريق استبدالها بمتوسط القيم في العمود لضمان عدم فقدان بيانات مهمة. ثم تم تقسيم البيانات إلى مجموعات تدريب، تحقق (Validation)، واختبار لضمان تقييم النموذج بطريقة صحيحة.
استخدمت المعادلة العامة لنماذج الانحدار لحساب الأوزان الخاصة بالمتغيرات، ثم تم تطبيق النموذج على البيانات للتنبؤ بأسعار السيارات. وأخيرًا قمت بتقييم أداء النموذج باستخدام مقياس RMSE (Root Mean Squared Error) لقياس دقة التنبؤات، مع إجراء بعض التحسينات على الميزات لتقليل الخطأ وتحسين النتائج.
المهارات والتقنيات المستخدمة في المشروع:
Python
Data Analysis
Data Cleaning
Data Visualization
Feature Engineering
Linear Regression Modeling
Pandas و NumPy
Model Evaluation (RMSE)