تفاصيل العمل

مشروع: التنبؤ بأسعار السيارات باستخدام تحليل البيانات والنمذجة الرياضية

يواجه الكثير من الأفراد وشركات بيع السيارات صعوبة في تحديد السعر العادل للسيارة اعتمادًا على خصائصها المختلفة مثل العمر والموديل وحالة السيارة. لذلك قمت بتطوير نموذج يعتمد على تحليل البيانات والتعلم الآلي للتنبؤ بسعر السيارة بشكل أكثر دقة.

بدأت المشروع بقراءة البيانات وتحليلها باستخدام Pandas لفهم طبيعة البيانات والعلاقات بين المتغيرات المختلفة. بعد ذلك قمت بتنظيم البيانات من خلال توحيد أسماء الأعمدة وتنظيفها لضمان سهولة التعامل معها في المراحل اللاحقة.

لتحليل البيانات بشكل أعمق، استخدمت الرسوم البيانية لفهم توزيع القيم والعلاقات بين المتغيرات. كما قمت بتطبيق التحويل اللوغاريتمي (Log Transformation) لتطبيع القيم وتحسين أداء النموذج.

بعد ذلك قمت بمعالجة القيم المفقودة عن طريق استبدالها بمتوسط القيم في العمود لضمان عدم فقدان بيانات مهمة. ثم تم تقسيم البيانات إلى مجموعات تدريب، تحقق (Validation)، واختبار لضمان تقييم النموذج بطريقة صحيحة.

استخدمت المعادلة العامة لنماذج الانحدار لحساب الأوزان الخاصة بالمتغيرات، ثم تم تطبيق النموذج على البيانات للتنبؤ بأسعار السيارات. وأخيرًا قمت بتقييم أداء النموذج باستخدام مقياس RMSE (Root Mean Squared Error) لقياس دقة التنبؤات، مع إجراء بعض التحسينات على الميزات لتقليل الخطأ وتحسين النتائج.

المهارات والتقنيات المستخدمة في المشروع:

Python

Data Analysis

Data Cleaning

Data Visualization

Feature Engineering

Linear Regression Modeling

Pandas و NumPy

Model Evaluation (RMSE)

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات